Prezados, não conheço nada no R que faça isso, mas não é difícil implementar.<div>Este tipo de problema é tratado com métricas de distâncias entre os vetores de strings, e existe bastante coisa pronta em Java, com alguns algorítimos já implementados, que quase sempre pressupõem uma base de dados que identifica que "d"  = "D" por exemplo. O retorno é , em geral, um escore que varia de 0 a 1 sendo 1 a identidade. Cabe ao usuário escolher o treshold adequado.<div>
Mas ja aviso: "Silva, João" e "João Silva" serão quase sempre diferentes em qualquer uma das técnicas.<br><br><div class="gmail_quote">Em 28 de setembro de 2011 10:00, Benilton Carvalho <span dir="ltr"><<a href="mailto:beniltoncarvalho@gmail.com">beniltoncarvalho@gmail.com</a>></span> escreveu:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">parece-me uma tarefa tipica para o Google Refine... b
<br>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br><br clear="all"><div><br></div>-- <br>
Fernando A.B. Colugnati<br>Pesquisador Associado<br><br>Instituto de Pesquisas em Tecnologia e Inovação - IPTI<br>Tel. 55 11 8704-9812<br><a href="http://www.ipti.org.br" target="_blank">www.ipti.org.br</a><br><a href="mailto:fernando@ipti.org.br" target="_blank">fernando@ipti.org.br</a><br>

</div></div>