[R-br] Distância entre strings

Bernardo Rangel Tura tura em centroin.com.br
Quinta Setembro 29 16:29:15 BRT 2011


On 09/29/2011 03:45 PM, Pedro Rafael wrote:
> Tura, qual a diferença das duas funções do link que você passou. Estava
> lendo e me parece que o projeto Bioconductor
> (http://svitsrv25.epfl.ch/R-doc/library/Biostrings/html/stringDist.html)
> tem implementado a distância de levenshtein. Vi que o link que você
> passou tem a distância de  Damerau-Levenshtein. Por sua experiência qual
> a melhor para problemas dessa natureza?
>
> Em 29 de setembro de 2011 14:15, Bernardo Rangel Tura [via R-br]
> <ml-node+s2285057n3856736h93 em n4.nabble.com
> <mailto:ml-node%2Bs2285057n3856736h93 em n4.nabble.com>> escreveu:
>
> Saudações,
> Pedro Rafael Diniz Marinho.
> Estatístico - Secretaria de Estado da Saúde - PB.


Pedro,

Vamos lá

1- Na primeira só tem a opção de Levenshtein enquanto na segunda você 
escolhe se quer usar Damerau-Levenshtein ou não

2- Pleo help tem sim e não é surpresa pois ela é usada para estudo com 
DNA...

3- sempre usei Levenshtein na verdade elas são muito semelhantes e em 
alguns casos resultam no mesmo número ...

4- Nós usamos Levenshtein no instituto nacional e cardiologia  sem 
nenhum problema e conseguimos uma performance muito boa 
(http://www.ncbi.nlm.nih.gov/pubmed/21344122)

[]s
tura


Mais detalhes sobre a lista de discussão R-br