<div dir="ltr"><div><div><div><div><div><div>Você quer mesmo deixar seu banco com 150 milhões de linhas?<br></div>Veja se os registros se repetem por CPF:<br><br></div>length(bancolink$CPF)<br></div>length(unique(bancolink$CPF))<br><br></div>e o mesmo para fichaAlink.<br><br></div>Abcs,<br><br></div>Manoel<br><div><div><div><div><div><div><br><div><div><div class="gmail_extra"><br><div class="gmail_quote">On Thu, Jan 14, 2016 at 2:13 PM, Wagner Tassinari <span dir="ltr"><<a href="mailto:wtassinari@gmail.com" target="_blank">wtassinari@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr">Olá pessoal, tudo bem ?<div><br></div><div>Estou com um problema, estou querendo fazer o merge entre dois bancos de dados:</div><div><br></div><div><div>> dim(bancolink)</div><div>[1] 1630328       8</div><div>> dim(fichaAlink)</div><div>[1] 2954930       6</div></div><div><br></div><div>Minha variável - chave primária está com o formato character. Daí qunado eu faço:</div><div><br></div><div><div>> CadUnico_fichaA_merge = merge(bancolink, fichaAlink, by.x=c('CPF'), by.y=c('NUMERO_CPF'))</div><div><br></div><div>Error in vecseq(f__, len__, if (allow.cartesian || notjoin || !anyDuplicated(f__,  : <br></div><div>  Join results in 150596694 rows; more than 4585258 = nrow(x)+nrow(i). Check for duplicate key values in i each of which join to the same group in x over and over again. If that's ok, try by=.EACHI to run j for each group to avoid the large allocation. If you are sure you wish to proceed, rerun with allow.cartesian=TRUE. Otherwise, please search for this error message in the FAQ, Wiki, Stack Overflow and datatable-help for advice.</div></div><div><br></div><div>Tentei fazer usando o formato data.table, daí ele dá um erro também:</div><div><br></div><div><div>> CadfAmerge = bancolink[fichaAlink] </div><div><br></div><div>Error in `[.data.table`(bancolink, fichaAlink) : </div><div>  When i is a data.table (or character vector), x must be keyed (i.e. sorted, and, marked as sorted) so data.table knows which columns to join to and take advantage of x being sorted. Call setkey(x,...) first, see ?setkey.</div></div><div><br></div><div>Desde já agradeço a todos,</div><span><font color="#888888"><div><div><br></div>-- <br><div>Wagner S. Tassinari<br>Departamento de Matemática<br>Universidade Federal Rural do Rio de Janeiro.<br>BR-465, Km 7 - Seropedica, RJ - Brasil<br>CEP: 23890-000 <br>Skype: wagner.tassinari<br><a href="mailto:wtassinari@gmail.com" target="_blank">wtassinari@gmail.com</a><br><a href="mailto:tassinari@ufrrj.br" target="_blank">tassinari@ufrrj.br</a><br>-------------------------------------------------------<br>"Statistical thinking will one day be as necessary for efficient citizenship as the ability to read and write."  (H.G.Wellis)<br></div>
</div></font></span></div>
<br>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" rel="noreferrer" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" rel="noreferrer" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br><br clear="all"><br>-- <br><div>Manoel Galdino<br><a href="https://sites.google.com/site/galdinomcz/" target="_blank">https://sites.google.com/site/galdinomcz/</a><br></div>
</div></div></div></div></div></div></div></div></div></div>