[R-br] RES: [OFF-topic] Processar uma base de dados grande - ENEM 2012 - 6 milhões de registros - só 40 segundos
Mauro Sznelwar
sznelwar em uol.com.br
Domingo Outubro 26 18:22:04 BRST 2014
Existe este pacote para o Windows? Tentei baixar e disse que não está
disponível para a versão R 3.1
Pessoal, eu fiz um teste com o MonetDB importando um arquivo csv do censo
demográfico 2010 do estado de São Paulo, que tem 2.2 gb, 224 colunas e
4038218 linhas. Importou em 109.1149 segundos.
Meu computador (MacBook Pro) tem processador i7 da primeira geração, 16 gb
de ram e ssd.
##------------------------------------------------------
library(MonetDB.R)
#criando um banco de dados
startscript <- monetdb.server.setup(
database.directory = paste0( getwd() ,
"/MonetDB" ) ,
"",
dbname = "db1",
dbport = 50002
)
pid <- monetdb.server.start(startscript)
conn <- dbConnect(MonetDB.R(), "monetdb://localhost:50002/db1")
# 224 colunas
# 4038218 linhas
# arquivo com 2.2 GB
# 109.149 segundos
system.time({
monetdb.read.csv(conn, 'censo00sp1.csv', "censo00sp", 4038218)
})
##------------------------------------------------------
Att
Roney
---
Este email está limpo de vírus e malwares porque a proteção do avast! Antivírus está ativa.
http://www.avast.com
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20141026/f602d3aa/attachment.html>
Mais detalhes sobre a lista de discussão R-br