[R-br] linas repetidas após unir duas data.frames com comando merge

Benilton Carvalho beniltoncarvalho em gmail.com
Terça Março 27 09:23:36 BRT 2012


Lucas,

o problema eh o que vc esta' passando como chave para o merge... ele deve
estar fazendo o producto de kronecker para o merge possivelmente por vc ter
uma relacao N:N entre os data.frames...

ao nos dar um exemplo (curto) reproduzivel com o codigo que vc esta'
usando, tenho certeza de que outros estarao interessados em ajudar...

para isso, leia o guia de postagem (no rodape de toda mensagem) e sinta-se
a vontade para usar as recomendacoes para codigo reproduzivel que coloquei
algum tempo atras disponivel:

http://r-br.2285057.n4.nabble.com/R-br-Produzindo-um-Codigo-Minimo-Reproduzivel-CMR-td3674188.html

benilton

2012/3/27 Lucas Fernandes de Souza <luc.souza em usp.br>

> A questão da memória, resolvi dividindo a planilha por tratamentos. Porém,
> quando faço o merge, reparo que ocorre repetição de várias linhas. Abaixo
> um exemplo das planilhas que quero unir:
>
> p1 - dim: 3326 10
>
>      TRAT RUN year DOY das dap laid yield CWAD  DTTD
> 14144    5 125 1979  32 216   0    0     0    0 14.78
> 14145    5 125 1979  33 217   1    0     0    0 15.94
> 14146    5 125 1979  34 218   2    0     0    0 16.24
> 14147    5 125 1979  35 219   3    0     0    0 17.57
> 14148    5 125 1979  36 220   4    0     0    0 15.94
> 14149    5 125 1979  37 221   5    0     0    0 17.47
>
>
> p2 - dim: 9999 6
>
>      RUN PRED SRAD PARD TMXD TMND
> 55840 125  0.0 16.2 32.4 26.6  6.7
> 55841 125  0.0 15.7 31.4 25.9  7.2
> 55842 125  0.2 14.6 29.2 25.9  9.9
> 55843 125  0.0 15.2 30.4 27.2  9.9
> 55844 125  0.0 15.5 31.0 27.4  9.6
> 55845 125  0.0 15.3 30.6 27.1  9.7
>
> Como resultado deveria vir uma nova planilha com dim: 3326 15, porém, o
> resultado é uma planilha gigantesca, com várias linhas repetidas:
>
>
> p3 - dim: 1073748      15
>
>  RUN TRAT year DOY das dap laid yield CWAD  DTTD PRED SRAD PARD TMXD TMND
> 1 125    5 1979  32 216   0    0     0    0 14.78  0.0 16.2 32.4 26.6  6.7
> 2 125    5 1979  32 216   0    0     0    0 14.78  0.0 15.7 31.4 25.9  7.2
> 3 125    5 1979  32 216   0    0     0    0 14.78  0.2 14.6 29.2 25.9  9.9
> 4 125    5 1979  32 216   0    0     0    0 14.78  0.0 15.2 30.4 27.2  9.9
> 5 125    5 1979  32 216   0    0     0    0 14.78  0.0 15.5 31.0 27.4  9.6
> 6 125    5 1979  32 216   0    0     0    0 14.78  0.0 15.3 30.6 27.1  9.7
>
> Alguma sugestão?
> obrigado
> Lucas
>
>
>
> --
> Lucas F. de Souza
> Eng. Agrícola - CONAB
> M.Sc. Produção Vegetal - UENF
> Doutorando Engenharia de Sistemas Agrícolas - ESALQ/USP
> tel: (19) 8160-7068
>
> ______________________________**_________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/**cgi-bin/mailman/listinfo/r-br<https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br>
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-**guia<http://www.leg.ufpr.br/r-br-guia>)
> e forneça código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20120327/20a29f53/attachment.html>


Mais detalhes sobre a lista de discussão R-br