[R-br] RES: Semelhança de textos

Benilton Carvalho beniltoncarvalho em gmail.com
Terça Junho 7 16:17:34 BRT 2011


x = c('o rato roeu a roupa do rei de roma', 'o cachorro eh preto', 'eu nao
tenho cachoro', 'o caxoro dele eh mau', 'o passarinho canta')
comCachorro = grep("cachorro", x, value=TRUE)
comQuaseCachorro = agrep("cachorro", x, value=TRUE)
comQuaseCachorro2 = agrep("cachorro", x, value=TRUE, max.distance=.3)

b

2011/6/7 Leandro Marino <leandro em cesgranrio.org.br>

>  Gustavo, obrigado por ajudar.
>
>
>
> Aproveitando a função que estou desenvolvendo, gostaria de saber como
> localizar determinado texto no meio de uma frase. Ex.: Quero todos que
> tenham citado a palavra “cachorro” em qualquer posição de uma palavra.
> Acredito que seria possível, mas não sei trabalhar com expressões regulares.
>
>
>
>
>
>
>
> Atenciosamente,
> *Leandro Lins Marino**
> **Centro de Avaliação**
> **Fundação CESGRANRIO**
> **Rua Santa Alexandrina, 1011 - 2º andar**
> **Rio de Janeiro, RJ - CEP: 20261-903**
> **(** **(21) 2103-9600 R.:236 **
> ***** leandro em cesgranrio.org.br*
>
>
>
> P*  **Antes de imprimir* *pense em sua responsabilidade e compromisso com
> o* *MEIO AMBIENTE*
>
>
>
> Esta mensagem, incluindo seus anexos, pode conter informacoes privilegiadas
> e/ou de carater confidencial, nao podendo ser retransmitida sem autorizacao
> do remetente. Se voce nao e o destinatario ou pessoa autorizada a recebe-la,
> informamos que o seu uso, divulgacao, copia ou arquivamento sao proibidos.
>
> Portanto, se você recebeu esta mensagem por engano, por favor, nos informe
> respondendo imediatamente a este e-mail e em seguida apague-a.
>
>
>
> *De:* r-br-bounces em listas.c3sl.ufpr.br [mailto:
> r-br-bounces em listas.c3sl.ufpr.br] *Em nome de *Gustavo Henrique de
> Carvalho
> *Enviada em:* terça-feira, 7 de junho de 2011 14:29
> *Para:* r-br em listas.c3sl.ufpr.br
> *Assunto:* Re: [R-br] Semelhança de textos
>
>
>
> ?agrep
>
>
>
> Tem uma ferramente homônima no Linux/Mac OS X e etc que também é bastante
> poderosa, especialmente combinada com awk, sed, grep, etc.
>
> 2011/6/7 Leandro Marino <leandro em cesgranrio.org.br>
>
>  Caros,
>
> Alguém saberia me dizer se o R tem alguma função implementada que forneça
> um percentual de concordância de textos dentro de um determinado data.frame?
> Preciso testar todos contra todos, em geral, são diversos conjuntos de 15 a
> 20 pequenos textos.
>
> Na realidade estou preparando uma função para encontrar registros
> duplicados que possam ter pequenas diferenças de grafia.
>
> Atenciosamente,
> *Leandro Lins Marino**
> **Centro de Avaliação
> Fundação CESGRANRIO
> Rua Santa Alexandrina, 1011 - 2º andar
> Rio de Janeiro, RJ - CEP: 20261-903
> **(** (21) 2103-9600 R.:236
> ***** leandro em cesgranrio.org.br*
>
>
>
> P*  **Antes de imprimir* *pense em sua responsabilidade e compromisso com
> o* *MEIO AMBIENTE*
>
>
>
> Esta mensagem, incluindo seus anexos, pode conter informacoes privilegiadas
> e/ou de carater confidencial, nao podendo ser retransmitida sem autorizacao
> do remetente. Se voce nao e o destinatario ou pessoa autorizada a recebe-la,
> informamos que o seu uso, divulgacao, copia ou arquivamento sao proibidos.
>
> Portanto, se você recebeu esta mensagem por engano, por favor, nos informe
> respondendo imediatamente a este e-mail e em seguida apague-a.
>
>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>
>


-- 
Successful people ask better questions, and as a result, they get better
answers. (Tony Robbins)
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20110607/2761cf80/attachment.html>
-------------- Próxima Parte ----------
Um anexo não-texto foi limpo...
Nome: image001.jpg
Tipo: image/jpeg
Tamanho: 2743 bytes
Descrição: não disponível
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20110607/2761cf80/attachment.jpg>


Mais detalhes sobre a lista de discussão R-br