[R-br] Trabalhar com muitos dados

Benilton Carvalho beniltoncarvalho em gmail.com
Quarta Outubro 17 11:01:04 BRT 2012


Ok... Comentários específicos  para suas perguntas:

1) experimente armazenar a saída do read.csv.sql numa variável... Ex

X = read.csv.sql(todos os seus argumentos)

Vc verá os warnings, são apenas mensagens de aviso, não erros.

Alternativamente, use o sqlite na linha de comando mesmo... E vc pode
importar o seu csv diretamente daqui, sem necessitar do sqldf.

para regressões, use biglm

2) evite mexer com swap. Use isso apenas como ultimo recurso

3 para auxiliar no garbage collection, ao trabalhar com grandes volumes de
dados, remova os objetos desnecessários e, em seguida, use gc(). O R não é
mau o suficiente para manter em memória objetos que vc já removeu. Esse
recurso é algo do seu sistema operacional, que mantém em cache objetos que
vc usou recentemente, para que não precise carregar novamente qdo vc tentar
trabalhar naqueles dados de  novo. O gc() vai avisar ao sistema operacional
que pode limpar a cache, etc etc etc.

4) na real, paralelismo não tem muito como te ajudar nessa tarefa.

b

On Wednesday, 17 October 2012, Roney Fraga wrote:

> Muito obrigado a todos pelas contribuições, já tenho material para estudar
> algumas semanas.
>
> Benilton, é 64 bit.
> > .Machine$sizeof.pointer
> [1] 8
>
> Abraço
> Roney
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20121017/bbb3e88e/attachment.html>


Mais detalhes sobre a lista de discussão R-br