Bem acho que vou fazer como o <span class="Apple-style-span" style="color: rgb(34, 34, 34); font-family: arial, sans-serif; font-size: 13px; background-color: rgb(255, 255, 255); ">Crysttian falou, converter tudo para maiúsculo e tirar os acentos para ver se facilita minha vida. O sistema codifica cada paciente com um código de 6 dígitos contudo alguns casos particulares que sabemos que tem uma pessoa no estado com alguma doença que precisa da intervenção do estado, principalmente as doenças de notificação compulsória, e precisamos saber se esse cara tá dentro da base de dados, logo não sabemos o código do indivíduo e temos que procurar pelo nome. Esse sistema foi feito pelo DATASUS mas poderia ser mais inteligente, poderia usar o RG ou CPF do indivíduo para facilitar a procura.</span><br>
<br><div class="gmail_quote">Em 28 de setembro de 2011 11:08, Daniel Dantas [via R-br] <span dir="ltr"><<a href="mailto:ml-node%2Bs2285057n3851361h68@n4.nabble.com">ml-node+s2285057n3851361h68@n4.nabble.com</a>></span> escreveu:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">
<div dir="ltr">
Acredito que não foi implementado um sistema que codifique cada paciente e agora surgiu esse problema. <br>
<br>
Fica a sugestão.<br>
<br>
<div>
<hr>
Date: Wed, 28 Sep 2011 10:45:44 -0300<br>From: <a href="http://user/SendEmail.jtp?type=node&node=3851361&i=0" rel="nofollow" link="external" target="_blank">[hidden email]</a><br>To: <a href="http://user/SendEmail.jtp?type=node&node=3851361&i=1" rel="nofollow" link="external" target="_blank">[hidden email]</a><br>
Subject: Re: [R-br] Distância entre strings<div class="im"><br><br>Prezados, não conheço nada no R que faça isso, mas não é difícil implementar.
<div>Este tipo de problema é tratado com métricas de distâncias entre os vetores de strings, e existe bastante coisa pronta em Java, com alguns algorítimos já implementados, que quase sempre pressupõem uma base de dados que identifica que "d" = "D" por exemplo. O retorno é , em geral, um escore que varia de 0 a 1 sendo 1 a identidade. Cabe ao usuário escolher o treshold adequado.
<div>Mas ja aviso: "Silva, João" e "João Silva" serão quase sempre diferentes em qualquer uma das técnicas.<br><br>
<div>Em 28 de setembro de 2011 10:00, Benilton Carvalho <span dir="ltr"><<a href="http://user/SendEmail.jtp?type=node&node=3851361&i=2" rel="nofollow" link="external" target="_blank">[hidden email]</a>></span> escreveu:<br>
<blockquote style="padding-left:1ex;border-left:#ccc 1px solid">parece-me uma tarefa tipica para o Google Refine... b <br>_______________________________________________<br>R-br mailing list<br><a href="http://user/SendEmail.jtp?type=node&node=3851361&i=3" rel="nofollow" link="external" target="_blank">[hidden email]</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" rel="nofollow" link="external" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" rel="nofollow" link="external" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br>
</blockquote></div><br><br clear="all">
<div><br></div>-- <br>Fernando A.B. Colugnati<br>Pesquisador Associado<br><br>Instituto de Pesquisas em Tecnologia e Inovação - IPTI<br>Tel. <a href="tel:55%2011%208704-9812" value="+551187049812" target="_blank">55 11 8704-9812</a><br>
<a href="http://www.ipti.org.br/" rel="nofollow" link="external" target="_blank">www.ipti.org.br</a><br><a href="http://user/SendEmail.jtp?type=node&node=3851361&i=4" rel="nofollow" link="external" target="_blank">[hidden email]</a><br>
</div></div><br></div>_______________________________________________ R-br mailing list <a href="http://user/SendEmail.jtp?type=node&node=3851361&i=5" rel="nofollow" link="external" target="_blank">[hidden email]</a> <a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a> Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forne�a c�digo m�nimo reproduz�vel.</div>
</div><div class="im">
<br>_______________________________________________
<br>R-br mailing list
<br><a href="http://user/SendEmail.jtp?type=node&node=3851361&i=6" rel="nofollow" link="external" target="_blank">[hidden email]</a>
<br><a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" rel="nofollow" link="external" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" rel="nofollow" link="external" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.
<br>
<br>
<hr noshade size="1" color="#cccccc">
</div><div style="color:#444;font:12px tahoma,geneva,helvetica,arial,sans-serif"><div class="im">
<div style="font-weight:bold">If you reply to this email, your message will be added to the discussion below:</div>
</div><a href="http://r-br.2285057.n4.nabble.com/R-br-Distancia-entre-strings-tp3847468p3851361.html" target="_blank">http://r-br.2285057.n4.nabble.com/R-br-Distancia-entre-strings-tp3847468p3851361.html</a>
</div><div><div></div><div class="h5">
<div style="color:#666;font:11px tahoma,geneva,helvetica,arial,sans-serif;margin-top:.4em">
To unsubscribe from R-br, <a href="http://r-br.2285057.n4.nabble.com/template/NamlServlet.jtp?macro=unsubscribe_by_code&node=3357982&code=cGVkcm8ucmFmYWVsLm1hcmluaG9AZ21haWwuY29tfDMzNTc5ODJ8NTAyMjI0MDYw" target="_blank">click here</a>.
</div></div></div></blockquote></div><br><br clear="all"><div><br></div>-- <br><font color="#000099">Saudações,</font><div><font color="#000099">Pedro Rafael Diniz Marinho.</font></div><div><font color="#000099">Estatístico - Secretaria de Estado da Saúde - PB.</font></div>
<div><font color="#000099"><br></font></div><br>