[R-br] Enc: (sem assunto)

Mauro Sznelwar sznelwar em uol.com.br
Quinta Outubro 17 23:31:17 BRT 2013


Não consegui rodar o script, mesmo baixando a bibliotéca data.table 

dply(dados, .(idade, sexo), summarize, soma=sum(tcont), count = length(tcont))
Error: could not find function "ddply"



  Existe ainda uma outra alternativa nesse caso que é o uso do data.table:


  sexo=c("1","1","2","2","1","2","1","1","1","1","2")
  idade=c("1","3","2","1","1","1","2","2","3","3","3")
  tcont=c(100,320,24,256,134,290,18,34,15,121,32)

  read=c("1","0","0","0","1","1","1","1","1","1","0")
  df=data.frame(sexo,idade,read,tcont)


  require(data.table)
  dt <- data.table(df)
dt[,list(soma=sum(tcont), count=.N), by=list(idade,sexo)]que é equivalente a :ddply(dados, .(idade, sexo), summarize, soma=sum(tcont), count = length(tcont))ambos com saída:
   idade sexo soma count
1:     1    1  267     4
2:     2    2  570     3
3:     3    1  475     3O data.table tem uma grande vantagem sobre o plyr que é a velocidade. Quando o arquivo é muito grande ele pode chegar a ser 100x mais rápido.
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20131017/ab824995/attachment-0001.html>


Mais detalhes sobre a lista de discussão R-br