[R-br] Semelhança de textos

Bernardo Rangel Tura tura em centroin.com.br
Quarta Junho 8 07:10:53 BRT 2011


On Tue, 2011-06-07 at 14:23 -0300, Leandro Marino wrote:
> 
> Caros,
> 
> Alguém saberia me dizer se o R tem alguma função implementada que
> forneça um percentual de concordância de textos dentro de um
> determinado data.frame? Preciso testar todos contra todos, em geral,
> são diversos conjuntos de 15 a 20 pequenos textos.
> 
> Na realidade estou preparando uma função para encontrar registros
> duplicados que possam ter pequenas diferenças de grafia.
> 
> Atenciosamente,
> Leandro Lins Marino
> Centro de Avaliação
> Fundação CESGRANRIO
> Rua Santa Alexandrina, 1011 - 2º andar
> Rio de Janeiro, RJ - CEP: 20261-903
> ( (21) 2103-9600 R.:236 
> * leandro em cesgranrio.org.br


Leandro existe o paco tm (text mining) que permite tratar um conjunto de
textos e calcular a matrix de coocorrências...

Será que serve?


-- 
[]s
Tura



Mais detalhes sobre a lista de discussão R-br