[R-br] Distância entre strings
Bernardo Rangel Tura
tura em centroin.com.br
Quinta Setembro 29 16:29:15 BRT 2011
On 09/29/2011 03:45 PM, Pedro Rafael wrote:
> Tura, qual a diferença das duas funções do link que você passou. Estava
> lendo e me parece que o projeto Bioconductor
> (http://svitsrv25.epfl.ch/R-doc/library/Biostrings/html/stringDist.html)
> tem implementado a distância de levenshtein. Vi que o link que você
> passou tem a distância de Damerau-Levenshtein. Por sua experiência qual
> a melhor para problemas dessa natureza?
>
> Em 29 de setembro de 2011 14:15, Bernardo Rangel Tura [via R-br]
> <ml-node+s2285057n3856736h93 em n4.nabble.com
> <mailto:ml-node%2Bs2285057n3856736h93 em n4.nabble.com>> escreveu:
>
> Saudações,
> Pedro Rafael Diniz Marinho.
> Estatístico - Secretaria de Estado da Saúde - PB.
Pedro,
Vamos lá
1- Na primeira só tem a opção de Levenshtein enquanto na segunda você
escolhe se quer usar Damerau-Levenshtein ou não
2- Pleo help tem sim e não é surpresa pois ela é usada para estudo com
DNA...
3- sempre usei Levenshtein na verdade elas são muito semelhantes e em
alguns casos resultam no mesmo número ...
4- Nós usamos Levenshtein no instituto nacional e cardiologia sem
nenhum problema e conseguimos uma performance muito boa
(http://www.ncbi.nlm.nih.gov/pubmed/21344122)
[]s
tura
Mais detalhes sobre a lista de discussão R-br