[R-br] problema memória

Lucas Fernandes de Souza luc.souza em usp.br
Segunda Março 26 14:37:26 BRT 2012


A questão da memória, resolvi dividindo a planilha por tratamentos.  
Porém, quando faço o merge, reparo que ocorre repetição de várias  
linhas. Abaixo um exemplo das planilhas que quero unir:

p1 - dim: 3326 10

       TRAT RUN year DOY das dap laid yield CWAD  DTTD
14144    5 125 1979  32 216   0    0     0    0 14.78
14145    5 125 1979  33 217   1    0     0    0 15.94
14146    5 125 1979  34 218   2    0     0    0 16.24
14147    5 125 1979  35 219   3    0     0    0 17.57
14148    5 125 1979  36 220   4    0     0    0 15.94
14149    5 125 1979  37 221   5    0     0    0 17.47


p2 - dim: 9999 6

       RUN PRED SRAD PARD TMXD TMND
55840 125  0.0 16.2 32.4 26.6  6.7
55841 125  0.0 15.7 31.4 25.9  7.2
55842 125  0.2 14.6 29.2 25.9  9.9
55843 125  0.0 15.2 30.4 27.2  9.9
55844 125  0.0 15.5 31.0 27.4  9.6
55845 125  0.0 15.3 30.6 27.1  9.7

Como resultado deveria vir uma nova planilha com dim: 3326 15, porém,  
o resultado é uma planilha gigantesca, com várias linhas repetidas:


p3 - dim: 1073748      15

   RUN TRAT year DOY das dap laid yield CWAD  DTTD PRED SRAD PARD TMXD TMND
1 125    5 1979  32 216   0    0     0    0 14.78  0.0 16.2 32.4 26.6  6.7
2 125    5 1979  32 216   0    0     0    0 14.78  0.0 15.7 31.4 25.9  7.2
3 125    5 1979  32 216   0    0     0    0 14.78  0.2 14.6 29.2 25.9  9.9
4 125    5 1979  32 216   0    0     0    0 14.78  0.0 15.2 30.4 27.2  9.9
5 125    5 1979  32 216   0    0     0    0 14.78  0.0 15.5 31.0 27.4  9.6
6 125    5 1979  32 216   0    0     0    0 14.78  0.0 15.3 30.6 27.1  9.7

Alguma sugestão?
obrigado
Lucas





Citando Benilton Carvalho <beniltoncarvalho em gmail.com>:

> diga-se de passagem, se os seus arquivos forem mesmo esses q vc
> passou, eh sinal de q vc tem varias outras coisas abertas ou outros
> objectos na sua sessao do R...
>
>> x = read.csv('growth.csv', header=T, stringsAsFactors=FALSE)
>> y = read.csv('weatherobs.csv', header=T, stringsAsFactors=FALSE)
>> object.size(x)/(1024^2)
> 7.49672698974609 bytes
>> object.size(y)/(1024^2)
> 10.6303634643555 bytes
>> xy = merge(x, y)
>> object.size(xy)/(1024^2)
> 9.74518585205078 bytes
>
> se o R usar 4x mais RAM do q o reportado acima para gerenciar o
> overhead... vc precisaria de 120MB de RAM para concluir a tarefa.
>
> b
>



-- 
Lucas F. de Souza
Eng. Agrícola - CONAB
M.Sc. Produção Vegetal - UENF
Doutorando Engenharia de Sistemas Agrícolas - ESALQ/USP
tel: (19) 8160-7068



Mais detalhes sobre a lista de discussão R-br