
On 09/29/2011 03:45 PM, Pedro Rafael wrote:
Tura, qual a diferença das duas funções do link que você passou. Estava lendo e me parece que o projeto Bioconductor (http://svitsrv25.epfl.ch/R-doc/library/Biostrings/html/stringDist.html) tem implementado a distância de levenshtein. Vi que o link que você passou tem a distância de Damerau-Levenshtein. Por sua experiência qual a melhor para problemas dessa natureza?
Em 29 de setembro de 2011 14:15, Bernardo Rangel Tura [via R-br] <ml-node+s2285057n3856736h93@n4.nabble.com <mailto:ml-node%2Bs2285057n3856736h93@n4.nabble.com>> escreveu:
Saudações, Pedro Rafael Diniz Marinho. Estatístico - Secretaria de Estado da Saúde - PB.
Pedro, Vamos lá 1- Na primeira só tem a opção de Levenshtein enquanto na segunda você escolhe se quer usar Damerau-Levenshtein ou não 2- Pleo help tem sim e não é surpresa pois ela é usada para estudo com DNA... 3- sempre usei Levenshtein na verdade elas são muito semelhantes e em alguns casos resultam no mesmo número ... 4- Nós usamos Levenshtein no instituto nacional e cardiologia sem nenhum problema e conseguimos uma performance muito boa (http://www.ncbi.nlm.nih.gov/pubmed/21344122) []s tura