Ok... Comentários específicos para suas perguntas:
1) experimente armazenar a saída do read.csv.sql numa
variável... Ex
X = read.csv.sql(todos os seus argumentos)
Vc verá os warnings, são apenas mensagens de aviso, não erros.
Alternativamente, use o sqlite na linha de comando mesmo... E
vc pode importar o seu csv diretamente daqui, sem necessitar do
sqldf.
para regressões, use biglm
2) evite mexer com swap. Use isso apenas como ultimo recurso
3 para auxiliar no garbage collection, ao
trabalhar com grandes volumes de dados, remova os objetos
desnecessários e, em seguida, use gc(). O R não é mau o
suficiente para manter em memória objetos que vc já removeu.
Esse recurso é algo do seu sistema operacional, que mantém em
cache objetos que vc usou recentemente, para que não precise
carregar novamente qdo vc tentar trabalhar naqueles dados de
novo. O gc() vai avisar ao sistema operacional que pode limpar
a cache, etc etc etc.
4) na real, paralelismo não tem muito como te ajudar nessa
tarefa.
b
On Wednesday, 17 October 2012, Roney Fraga wrote:
Muito obrigado a todos pelas contribuições, já tenho
material para estudar algumas semanas.
Benilton, é 64 bit.
> .Machine$sizeof.pointer
[1] 8
Abraço
Roney
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
A forma que encontrei de resolver o problema para se trabalhar com
grande volumes de dados foi conectando a um banco de dados.