[R-br] RES: [OFF-topic] Processar uma base de dados grande - ENEM 2012 - 6 milhões de registros - só 40 segundos

Manoel Galdino mcz.fea em gmail.com
Segunda Outubro 27 11:05:33 BRST 2014


Se você tiver memória ram suficiente, experimente o fread do data.table.

abçs
M

2014-10-27 10:19 GMT-02:00 Edson Lira <edinhoestat em yahoo.com.br>:

> Experimenta o pacote ff
>
> Edson Lira
> Estatístico
> Manaus-Amazonas
>
>
>   Em Domingo, 26 de Outubro de 2014 16:22, Mauro Sznelwar <
> sznelwar em uol.com.br> escreveu:
>
>
>   Existe este pacote para o Windows? Tentei baixar e disse que não está
> disponível para a versão R 3.1
>
>
>
> Pessoal, eu fiz um teste com o MonetDB importando um arquivo csv do censo
> demográfico 2010 do estado de São Paulo, que tem 2.2 gb, 224 colunas e
> 4038218 linhas. Importou em 109.1149 segundos.
>
>  Meu computador (MacBook Pro) tem processador i7 da primeira geração, 16
> gb de ram e ssd.
>
>  ##------------------------------------------------------
>   library(MonetDB.R)
>
>  #criando um banco de dados
>  startscript <- monetdb.server.setup(
>                                      database.directory = paste0( getwd()
> , "/MonetDB" ) ,
>                                      "",
>                                      dbname = "db1",
>                                      dbport = 50002
>                                      )
>  pid <- monetdb.server.start(startscript)
>  conn <- dbConnect(MonetDB.R(), "monetdb://localhost:50002/db1")
>
>  # 224 colunas
>  # 4038218 linhas
>  # arquivo com 2.2 GB
>  # 109.149 segundos
>  system.time({
>      monetdb.read.csv(conn, 'censo00sp1.csv', "censo00sp", 4038218)
>  })
>   ##------------------------------------------------------
>
>  Att
>  Roney
>
>
> ------------------------------
>    <http://www.avast.com/>
> Este email está limpo de vírus e malwares porque a proteção do avast!
> Antivírus <http://www.avast.com/> está ativa.
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>



-- 
Manoel Galdino
https://sites.google.com/site/galdinomcz/
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20141027/9e112bad/attachment.html>


Mais detalhes sobre a lista de discussão R-br