[R-br] Identificando divergências entre nomes

Walmes Zeviani walmeszeviani em gmail.com
Sexta Agosto 25 14:47:21 -03 2017


Pelo visto você terá com fazer um misto de soluções para cada situação.
Comece com funções para distâncias entre strings. Minha dica é tomar
conhecimento do pacote stringdist (
https://cran.r-project.org/web/packages/stringdist/stringdist.pdf). Se você
criar a termDocumentMatrix para os nomes, você pode facilmente encontrar
situações de inversão de nome como a que ocorre para o ID 100, por exemplo.

À disposição.
Walmes.
​
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20170825/90098ecb/attachment.html>


Mais detalhes sobre a lista de discussão R-br