[R-br] Semelhança de textos
Bernardo Rangel Tura
tura em centroin.com.br
Quarta Junho 8 07:10:53 BRT 2011
On Tue, 2011-06-07 at 14:23 -0300, Leandro Marino wrote:
>
> Caros,
>
> Alguém saberia me dizer se o R tem alguma função implementada que
> forneça um percentual de concordância de textos dentro de um
> determinado data.frame? Preciso testar todos contra todos, em geral,
> são diversos conjuntos de 15 a 20 pequenos textos.
>
> Na realidade estou preparando uma função para encontrar registros
> duplicados que possam ter pequenas diferenças de grafia.
>
> Atenciosamente,
> Leandro Lins Marino
> Centro de Avaliação
> Fundação CESGRANRIO
> Rua Santa Alexandrina, 1011 - 2º andar
> Rio de Janeiro, RJ - CEP: 20261-903
> ( (21) 2103-9600 R.:236
> * leandro em cesgranrio.org.br
Leandro existe o paco tm (text mining) que permite tratar um conjunto de
textos e calcular a matrix de coocorrências...
Será que serve?
--
[]s
Tura
Mais detalhes sobre a lista de discussão R-br