
On Tue, 2011-06-07 at 14:23 -0300, Leandro Marino wrote:
Caros,
Alguém saberia me dizer se o R tem alguma função implementada que forneça um percentual de concordância de textos dentro de um determinado data.frame? Preciso testar todos contra todos, em geral, são diversos conjuntos de 15 a 20 pequenos textos.
Na realidade estou preparando uma função para encontrar registros duplicados que possam ter pequenas diferenças de grafia.
Atenciosamente, Leandro Lins Marino Centro de Avaliação Fundação CESGRANRIO Rua Santa Alexandrina, 1011 - 2º andar Rio de Janeiro, RJ - CEP: 20261-903 ( (21) 2103-9600 R.:236 * leandro@cesgranrio.org.br
Leandro existe o paco tm (text mining) que permite tratar um conjunto de textos e calcular a matrix de coocorrências... Será que serve? -- []s Tura