[R-br] Trabalhar com muitos dados
Fred
eng.fredericoalvarez em gmail.com
Quarta Outubro 17 14:27:46 BRT 2012
Em 17-10-2012 11:01, Benilton Carvalho escreveu:
> Ok... Comentários específicos para suas perguntas:
>
> 1) experimente armazenar a saída do read.csv.sql numa variável... Ex
>
> X = read.csv.sql(todos os seus argumentos)
>
> Vc verá os warnings, são apenas mensagens de aviso, não erros.
>
> Alternativamente, use o sqlite na linha de comando mesmo... E vc pode
> importar o seu csv diretamente daqui, sem necessitar do sqldf.
>
> para regressões, use biglm
>
> 2) evite mexer com swap. Use isso apenas como ultimo recurso
>
> 3 para auxiliar no garbage collection, ao trabalhar com grandes
> volumes de dados, remova os objetos desnecessários e, em seguida, use
> gc(). O R não é mau o suficiente para manter em memória objetos que vc
> já removeu. Esse recurso é algo do seu sistema operacional, que mantém
> em cache objetos que vc usou recentemente, para que não precise
> carregar novamente qdo vc tentar trabalhar naqueles dados de novo. O
> gc() vai avisar ao sistema operacional que pode limpar a cache, etc
> etc etc.
>
> 4) na real, paralelismo não tem muito como te ajudar nessa tarefa.
>
> b
>
> On Wednesday, 17 October 2012, Roney Fraga wrote:
>
> Muito obrigado a todos pelas contribuições, já tenho material para
> estudar algumas semanas.
>
> Benilton, é 64 bit.
> > .Machine$sizeof.pointer
> [1] 8
>
> Abraço
> Roney
>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
A forma que encontrei de resolver o problema para se trabalhar com
grande volumes de dados foi conectando a um banco de dados.
No meu caso, estou usando o SQLite com o pacote sqldf.
Pelo menos no meu caso, o ganho de desempenho foi incrível, uma vez que
não preciso mais ficar carregando dados, sem falar que a capacidade
agora está na casa dos TB.
Saudações
--
Frederico Steinmetz Alvarez
Engenheiro Eletricista e de Produção
Mestrando em Engenharia Eólica
Laboratório Didático Pedagógico - Mecânica dos Fluidos LDP-FLU
Grupo de Mecânica dos Fluidos Ambientais da UFPE
Homepage ( www.ufpe.br/mecfluamb/ )
Universidade Federal de Pernambuco - UFPE
Departamento de Engenharia Mecânica
Fones: (48) 9143-5141 (VIVO)
(81) 8885-1105 (OI)
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20121017/ffd40ccd/attachment.html>
Mais detalhes sobre a lista de discussão R-br