[R-br] eficiência de mem?==?UTF-8?Q?ória no R
Thiago V. dos Santos
thi_veloso em yahoo.com.br
Quinta Maio 14 23:28:31 BRT 2015
Fátima,
A minha sugestão é o comando fread do pacote data.table. Em um arquivo meu com cerca de cinco milhões de linhas e 15 colunas, ele reduziu o tempo de leitura de 14s para pouco mais de 1s em comparação com o comando base do R. A sintaxe do comando é basicamente a mesma do read.table.
Se ele ainda não ajudar a ler o seu arquivo rápido o suficiente para as suas necessidades, ou se você tiver que ler vários desses arquivos programaticamente, a minha sugestão seria considerar usar algum pacote de banco de dados como o RODBC ou sqldf.
Quanto à lentidão no seu computador, quanta memória RAM ele tem? Ler um arquivo de 3GB exige um mínimo de 4GB, sendo que 6GB ou 8GB seria ainda melhor.
Saudações,
Thiago.
Sent from Yahoo Mail on Android
From:"Fatima do Nascimento Silva" <fatima em ccet.ufrn.br>
Date:Thu, May 14, 2015 at 7:35 PM
Subject:[R-br] eficiência de mem?==?UTF-8?Q?ória no R
prezados, boa noite.
Venho por meio deste solicitar uma dica de como fazer a
leitura(importação) de uma base de dados em formato txt, com caracteres
separados por ; e com 29 colunas e 1.520.171 linhas no R, de uma maneira
que não perca eficiência de memória.
estou fazendo a leitura usando o comando:
(dados <- read.table("SAJ_WIN1252.txt",header=T,dec=",",sep=";"))
Como o arquivo tem 3Gb, o R demora uns 10 min para abri-lo, mas não
consigo fazer mais nada porque o programa trava.
Alguém teria dicas de como me ajudar?
agradeço a atenção.
Atenciosamente,
Fátima Nascimento
Estatística - UFRN
Mestre em Ciência e Engª de Petróleo-PPGCEP/UFRN
Doutoranda no Programa de Pós-Graduação em Ciência e Engª de Petróleo-
PPGCEP/UFRN
_______________________________________________
R-br mailing list
R-br em listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20150514/c4adc84e/attachment-0001.html>
Mais detalhes sobre a lista de discussão R-br