[R-br] RES: RES: Semelhança de textos

Leandro Marino leandro em cesgranrio.org.br
Terça Junho 7 16:24:08 BRT 2011


@Benilton, @Pedro e @Lucas obrigado pelas sugestões!

 

Quando a função ficar pronta vai ser show de bola!! Vocês ajudaram e
muito...

 

Atenciosamente,
Leandro Lins Marino
Centro de Avaliação
Fundação CESGRANRIO
Rua Santa Alexandrina, 1011 - 2º andar
Rio de Janeiro, RJ - CEP: 20261-903
( (21) 2103-9600 R.:236 
* leandro em cesgranrio.org.br

 

P  Antes de imprimir pense em sua responsabilidade e compromisso com o MEIO
AMBIENTE 

 

Esta mensagem, incluindo seus anexos, pode conter informacoes privilegiadas
e/ou de carater confidencial, nao podendo ser retransmitida sem autorizacao
do remetente. Se voce nao e o destinatario ou pessoa autorizada a recebe-la,
informamos que o seu uso, divulgacao, copia ou arquivamento sao proibidos. 

Portanto, se você recebeu esta mensagem por engano, por favor, nos informe
respondendo imediatamente a este e-mail e em seguida apague-a.

 

De: r-br-bounces em listas.c3sl.ufpr.br
[mailto:r-br-bounces em listas.c3sl.ufpr.br] Em nome de Benilton Carvalho
Enviada em: terça-feira, 7 de junho de 2011 16:18
Para: r-br em listas.c3sl.ufpr.br
Assunto: Re: [R-br] RES: Semelhança de textos

 

x = c('o rato roeu a roupa do rei de roma', 'o cachorro eh preto', 'eu nao
tenho cachoro', 'o caxoro dele eh mau', 'o passarinho canta')

comCachorro = grep("cachorro", x, value=TRUE)

comQuaseCachorro = agrep("cachorro", x, value=TRUE)

comQuaseCachorro2 = agrep("cachorro", x, value=TRUE, max.distance=.3)

b

 

2011/6/7 Leandro Marino <leandro em cesgranrio.org.br>

Gustavo, obrigado por ajudar.

 

Aproveitando a função que estou desenvolvendo, gostaria de saber como
localizar determinado texto no meio de uma frase. Ex.: Quero todos que
tenham citado a palavra “cachorro” em qualquer posição de uma palavra.
Acredito que seria possível, mas não sei trabalhar com expressões regulares.

 

 

 

Atenciosamente,
Leandro Lins Marino
Centro de Avaliação
Fundação CESGRANRIO
Rua Santa Alexandrina, 1011 - 2º andar
Rio de Janeiro, RJ - CEP: 20261-903
( (21) 2103-9600 R.:236 
* leandro em cesgranrio.org.br

 

P  Antes de imprimir pense em sua responsabilidade e compromisso com o MEIO
AMBIENTE 

 

Esta mensagem, incluindo seus anexos, pode conter informacoes privilegiadas
e/ou de carater confidencial, nao podendo ser retransmitida sem autorizacao
do remetente. Se voce nao e o destinatario ou pessoa autorizada a recebe-la,
informamos que o seu uso, divulgacao, copia ou arquivamento sao proibidos. 

Portanto, se você recebeu esta mensagem por engano, por favor, nos informe
respondendo imediatamente a este e-mail e em seguida apague-a.

 

De: r-br-bounces em listas.c3sl.ufpr.br
[mailto:r-br-bounces em listas.c3sl.ufpr.br] Em nome de Gustavo Henrique de
Carvalho
Enviada em: terça-feira, 7 de junho de 2011 14:29
Para: r-br em listas.c3sl.ufpr.br
Assunto: Re: [R-br] Semelhança de textos

 

?agrep

 

Tem uma ferramente homônima no Linux/Mac OS X e etc que também é bastante
poderosa, especialmente combinada com awk, sed, grep, etc.

2011/6/7 Leandro Marino <leandro em cesgranrio.org.br>



Caros,

Alguém saberia me dizer se o R tem alguma função implementada que forneça um
percentual de concordância de textos dentro de um determinado data.frame?
Preciso testar todos contra todos, em geral, são diversos conjuntos de 15 a
20 pequenos textos.

Na realidade estou preparando uma função para encontrar registros duplicados
que possam ter pequenas diferenças de grafia.

Atenciosamente,
Leandro Lins Marino
Centro de Avaliação
Fundação CESGRANRIO
Rua Santa Alexandrina, 1011 - 2º andar
Rio de Janeiro, RJ - CEP: 20261-903
( (21) 2103-9600 R.:236 
* leandro em cesgranrio.org.br

 

P  Antes de imprimir pense em sua responsabilidade e compromisso com o MEIO
AMBIENTE 

 

Esta mensagem, incluindo seus anexos, pode conter informacoes privilegiadas
e/ou de carater confidencial, nao podendo ser retransmitida sem autorizacao
do remetente. Se voce nao e o destinatario ou pessoa autorizada a recebe-la,
informamos que o seu uso, divulgacao, copia ou arquivamento sao proibidos. 

Portanto, se você recebeu esta mensagem por engano, por favor, nos informe
respondendo imediatamente a este e-mail e em seguida apague-a.

 


_______________________________________________
R-br mailing list
R-br em listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br

 


_______________________________________________
R-br mailing list
R-br em listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br




-- 
Successful people ask better questions, and as a result, they get better
answers. (Tony Robbins)

-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20110607/1a56a683/attachment.html>
-------------- Próxima Parte ----------
Um anexo não-texto foi limpo...
Nome: image001.jpg
Tipo: image/jpeg
Tamanho: 2743 bytes
Descrição: não disponível
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20110607/1a56a683/attachment.jpg>


Mais detalhes sobre a lista de discussão R-br