[R-br] Semelhança de textos

Gustavo Henrique de Carvalho gustavo.bio em gmail.com
Terça Junho 7 14:29:06 BRT 2011


?agrep

Tem uma ferramente homônima no Linux/Mac OS X e etc que também é bastante
poderosa, especialmente combinada com awk, sed, grep, etc.

2011/6/7 Leandro Marino <leandro em cesgranrio.org.br>

>   Caros,
>
> Alguém saberia me dizer se o R tem alguma função implementada que forneça
> um percentual de concordância de textos dentro de um determinado data.frame?
> Preciso testar todos contra todos, em geral, são diversos conjuntos de 15 a
> 20 pequenos textos.
>
> Na realidade estou preparando uma função para encontrar registros
> duplicados que possam ter pequenas diferenças de grafia.
>
> Atenciosamente,
> *Leandro Lins Marino**
> **Centro de Avaliação**
> **Fundação CESGRANRIO**
> **Rua Santa Alexandrina, 1011 - 2º andar**
> **Rio de Janeiro, RJ - CEP: 20261-903**
> **(** **(21) 2103-9600 R.:236 **
> ***** leandro em cesgranrio.org.br*
>
>
>
> P*  **Antes de imprimir* *pense em sua responsabilidade e compromisso com
> o* *MEIO AMBIENTE*
>
>
>
> Esta mensagem, incluindo seus anexos, pode conter informacoes privilegiadas
> e/ou de carater confidencial, nao podendo ser retransmitida sem autorizacao
> do remetente. Se voce nao e o destinatario ou pessoa autorizada a recebe-la,
> informamos que o seu uso, divulgacao, copia ou arquivamento sao proibidos.
>
> Portanto, se você recebeu esta mensagem por engano, por favor, nos informe
> respondendo imediatamente a este e-mail e em seguida apague-a.
>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20110607/d42e176e/attachment.html>
-------------- Próxima Parte ----------
Um anexo não-texto foi limpo...
Nome: image001.jpg
Tipo: image/jpeg
Tamanho: 2743 bytes
Descrição: não disponível
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20110607/d42e176e/attachment.jpg>


Mais detalhes sobre a lista de discussão R-br