[R-br] Enc: (sem assunto)
Mauro Sznelwar
sznelwar em uol.com.br
Quinta Outubro 17 23:31:17 BRT 2013
Não consegui rodar o script, mesmo baixando a bibliotéca data.table
dply(dados, .(idade, sexo), summarize, soma=sum(tcont), count = length(tcont))
Error: could not find function "ddply"
Existe ainda uma outra alternativa nesse caso que é o uso do data.table:
sexo=c("1","1","2","2","1","2","1","1","1","1","2")
idade=c("1","3","2","1","1","1","2","2","3","3","3")
tcont=c(100,320,24,256,134,290,18,34,15,121,32)
read=c("1","0","0","0","1","1","1","1","1","1","0")
df=data.frame(sexo,idade,read,tcont)
require(data.table)
dt <- data.table(df)
dt[,list(soma=sum(tcont), count=.N), by=list(idade,sexo)]que é equivalente a :ddply(dados, .(idade, sexo), summarize, soma=sum(tcont), count = length(tcont))ambos com saída:
idade sexo soma count
1: 1 1 267 4
2: 2 2 570 3
3: 3 1 475 3O data.table tem uma grande vantagem sobre o plyr que é a velocidade. Quando o arquivo é muito grande ele pode chegar a ser 100x mais rápido.
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20131017/ab824995/attachment-0001.html>
Mais detalhes sobre a lista de discussão R-br