
Acredito que não foi implementado um sistema que codifique cada paciente e agora surgiu esse problema. Fica a sugestão. Date: Wed, 28 Sep 2011 10:45:44 -0300 From: fernando@ipti.org.br To: r-br@listas.c3sl.ufpr.br Subject: Re: [R-br] Distância entre strings Prezados, não conheço nada no R que faça isso, mas não é difícil implementar. Este tipo de problema é tratado com métricas de distâncias entre os vetores de strings, e existe bastante coisa pronta em Java, com alguns algorítimos já implementados, que quase sempre pressupõem uma base de dados que identifica que "d" = "D" por exemplo. O retorno é , em geral, um escore que varia de 0 a 1 sendo 1 a identidade. Cabe ao usuário escolher o treshold adequado. Mas ja aviso: "Silva, João" e "João Silva" serão quase sempre diferentes em qualquer uma das técnicas. Em 28 de setembro de 2011 10:00, Benilton Carvalho <beniltoncarvalho@gmail.com> escreveu: parece-me uma tarefa tipica para o Google Refine... b _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível. -- Fernando A.B. Colugnati Pesquisador Associado Instituto de Pesquisas em Tecnologia e Inovação - IPTI Tel. 55 11 8704-9812 www.ipti.org.br fernando@ipti.org.br _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo m�nimo reproduz�vel.