
x = c('o rato roeu a roupa do rei de roma', 'o cachorro eh preto', 'eu nao tenho cachoro', 'o caxoro dele eh mau', 'o passarinho canta') comCachorro = grep("cachorro", x, value=TRUE) comQuaseCachorro = agrep("cachorro", x, value=TRUE) comQuaseCachorro2 = agrep("cachorro", x, value=TRUE, max.distance=.3) b 2011/6/7 Leandro Marino <leandro@cesgranrio.org.br>
Gustavo, obrigado por ajudar.
Aproveitando a função que estou desenvolvendo, gostaria de saber como localizar determinado texto no meio de uma frase. Ex.: Quero todos que tenham citado a palavra “cachorro” em qualquer posição de uma palavra. Acredito que seria possível, mas não sei trabalhar com expressões regulares.
Atenciosamente, *Leandro Lins Marino** **Centro de Avaliação** **Fundação CESGRANRIO** **Rua Santa Alexandrina, 1011 - 2º andar** **Rio de Janeiro, RJ - CEP: 20261-903** **(** **(21) 2103-9600 R.:236 ** ***** leandro@cesgranrio.org.br*
P* **Antes de imprimir* *pense em sua responsabilidade e compromisso com o* *MEIO AMBIENTE*
Esta mensagem, incluindo seus anexos, pode conter informacoes privilegiadas e/ou de carater confidencial, nao podendo ser retransmitida sem autorizacao do remetente. Se voce nao e o destinatario ou pessoa autorizada a recebe-la, informamos que o seu uso, divulgacao, copia ou arquivamento sao proibidos.
Portanto, se você recebeu esta mensagem por engano, por favor, nos informe respondendo imediatamente a este e-mail e em seguida apague-a.
*De:* r-br-bounces@listas.c3sl.ufpr.br [mailto: r-br-bounces@listas.c3sl.ufpr.br] *Em nome de *Gustavo Henrique de Carvalho *Enviada em:* terça-feira, 7 de junho de 2011 14:29 *Para:* r-br@listas.c3sl.ufpr.br *Assunto:* Re: [R-br] Semelhança de textos
?agrep
Tem uma ferramente homônima no Linux/Mac OS X e etc que também é bastante poderosa, especialmente combinada com awk, sed, grep, etc.
2011/6/7 Leandro Marino <leandro@cesgranrio.org.br>
Caros,
Alguém saberia me dizer se o R tem alguma função implementada que forneça um percentual de concordância de textos dentro de um determinado data.frame? Preciso testar todos contra todos, em geral, são diversos conjuntos de 15 a 20 pequenos textos.
Na realidade estou preparando uma função para encontrar registros duplicados que possam ter pequenas diferenças de grafia.
Atenciosamente, *Leandro Lins Marino** **Centro de Avaliação Fundação CESGRANRIO Rua Santa Alexandrina, 1011 - 2º andar Rio de Janeiro, RJ - CEP: 20261-903 **(** (21) 2103-9600 R.:236 ***** leandro@cesgranrio.org.br*
P* **Antes de imprimir* *pense em sua responsabilidade e compromisso com o* *MEIO AMBIENTE*
Esta mensagem, incluindo seus anexos, pode conter informacoes privilegiadas e/ou de carater confidencial, nao podendo ser retransmitida sem autorizacao do remetente. Se voce nao e o destinatario ou pessoa autorizada a recebe-la, informamos que o seu uso, divulgacao, copia ou arquivamento sao proibidos.
Portanto, se você recebeu esta mensagem por engano, por favor, nos informe respondendo imediatamente a este e-mail e em seguida apague-a.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
-- Successful people ask better questions, and as a result, they get better answers. (Tony Robbins)