<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">

<head>
<meta http-equiv=Content-Type content="text/html; charset=utf-8">
<meta name=Generator content="Microsoft Word 12 (filtered medium)">
<!--[if !mso]>
<style>
v\:* {behavior:url(#default#VML);}
o\:* {behavior:url(#default#VML);}
w\:* {behavior:url(#default#VML);}
.shape {behavior:url(#default#VML);}
</style>
<![endif]-->
<style>
<!--
 /* Font Definitions */
 @font-face
        {font-family:Wingdings;
        panose-1:5 0 0 0 0 0 0 0 0 0;}
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
@font-face
        {font-family:"Arial Narrow";
        panose-1:2 11 5 6 2 2 2 3 2 4;}
@font-face
        {font-family:Webdings;
        panose-1:5 3 1 2 1 5 9 6 7 3;}
@font-face
        {font-family:Consolas;
        panose-1:2 11 6 9 2 2 4 3 2 4;}
@font-face
        {font-family:"Tw Cen MT";
        panose-1:2 11 6 2 2 1 4 2 6 3;}
@font-face
        {font-family:"Trebuchet MS";
        panose-1:2 11 6 3 2 2 2 2 2 4;}
@font-face
        {font-family:"Palatino Linotype";
        panose-1:2 4 5 2 5 5 5 3 3 4;}
 /* Style Definitions */
 p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
p
        {mso-style-priority:99;
        mso-margin-top-alt:auto;
        margin-right:0cm;
        mso-margin-bottom-alt:auto;
        margin-left:0cm;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
span.EstiloDeEmail18
        {mso-style-type:personal-reply;
        font-family:"Arial Narrow","sans-serif";
        color:#1F497D;}
.MsoChpDefault
        {mso-style-type:export-only;}
@page Section1
        {size:612.0pt 792.0pt;
        margin:70.85pt 3.0cm 70.85pt 3.0cm;}
div.Section1
        {page:Section1;}
-->
</style>
<!--[if gte mso 9]><xml>
 <o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
 <o:shapelayout v:ext="edit">
  <o:idmap v:ext="edit" data="1" />
 </o:shapelayout></xml><![endif]-->
</head>

<body lang=PT-BR link=blue vlink=purple>

<div class=Section1>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Arial Narrow","sans-serif";
color:#1F497D'>Gustavo, obrigado por ajudar.<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Arial Narrow","sans-serif";
color:#1F497D'><o:p> </o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Arial Narrow","sans-serif";
color:#1F497D'>Aproveitando a função que estou desenvolvendo, gostaria de saber
como localizar determinado texto no meio de uma frase. Ex.: Quero todos que
tenham citado a palavra “cachorro” em qualquer posição de uma palavra. Acredito
que seria possível, mas não sei trabalhar com expressões regulares.<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Arial Narrow","sans-serif";
color:#1F497D'><o:p> </o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Arial Narrow","sans-serif";
color:#1F497D'><o:p> </o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Arial Narrow","sans-serif";
color:#1F497D'><o:p> </o:p></span></p>

<p class=MsoNormal><span style='font-family:"Tw Cen MT","sans-serif";
color:black'>Atenciosamente,<br>
</span><b><span style='font-size:11.0pt;font-family:"Tw Cen MT","sans-serif";
color:#000040'>Leandro Lins Marino</span></b><b><span style='font-size:10.0pt;
font-family:"Tw Cen MT","sans-serif";color:#000040'><br>
</span></b><i><span style='font-size:10.0pt;font-family:"Tw Cen MT","sans-serif";
color:gray'>Centro de Avaliação</span></i><i><span style='font-size:10.0pt;
font-family:"Tw Cen MT","sans-serif";color:gray'><br>
</span></i><i><span style='font-size:10.0pt;font-family:"Tw Cen MT","sans-serif";
color:gray'>Fundação CESGRANRIO</span></i><i><span style='font-size:10.0pt;
font-family:"Tw Cen MT","sans-serif";color:gray'><br>
</span></i><i><span style='font-size:10.0pt;font-family:"Tw Cen MT","sans-serif";
color:gray'>Rua Santa Alexandrina, 1011 - 2º andar</span></i><i><span
style='font-size:10.0pt;font-family:"Tw Cen MT","sans-serif";color:gray'><br>
</span></i><i><span style='font-size:10.0pt;font-family:"Tw Cen MT","sans-serif";
color:gray'>Rio de Janeiro, RJ - CEP: 20261-903</span></i><i><span
style='font-size:10.0pt;font-family:"Tw Cen MT","sans-serif";color:gray'><br>
</span></i><i><span style='font-size:10.0pt;font-family:Wingdings;color:gray'>(</span></i><i><span
style='font-size:10.0pt;font-family:"Tw Cen MT","sans-serif";color:gray'> </span></i><i><span
style='font-size:10.0pt;font-family:"Trebuchet MS","sans-serif";color:gray'>(21)
2103-9600 R.:236 </span></i><i><span style='font-size:10.0pt;font-family:"Trebuchet MS","sans-serif";
color:gray'><br>
</span></i><i><span style='font-size:11.0pt;font-family:Wingdings;color:gray'>*</span></i><i><span
style='font-size:11.0pt;font-family:"Tw Cen MT","sans-serif";color:gray'> <a
href="mailto:leandro@cesgranrio.org.br">leandro@cesgranrio.org.br</a><o:p></o:p></span></i></p>

<p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";
color:#006666'><o:p> </o:p></span></p>

<p class=MsoNormal><span style='font-size:18.0pt;font-family:Webdings;
color:#76923C'>P</span><b><span style='font-size:7.5pt;font-family:"Palatino Linotype","serif";
color:#76923C'>  </span></b><b><span style='font-size:9.0pt;font-family:
"Calibri","sans-serif";color:#76923C'>Antes de imprimir</span></b><span
style='font-size:9.0pt;font-family:"Calibri","sans-serif";color:#76923C'> </span><b><span
style='font-size:9.0pt;font-family:"Calibri","sans-serif";color:#76923C'>pense
em sua responsabilidade e compromisso com o</span></b><span style='font-size:
9.0pt;font-family:"Calibri","sans-serif";color:#76923C'> <b>MEIO AMBIENTE</b></span><span
style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#006666'> <o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";
color:#006666'><o:p> </o:p></span></p>

<p class=MsoNormal><span style='font-size:10.5pt;font-family:Consolas;
color:#1F497D'>Esta mensagem, incluindo seus anexos, pode conter informacoes
privilegiadas e/ou de carater confidencial, nao podendo ser retransmitida sem
autorizacao do remetente. Se voce nao e o destinatario ou pessoa autorizada a
recebe-la, informamos que o seu uso, divulgacao, copia ou arquivamento sao
proibidos. <o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:10.5pt;font-family:Consolas;
color:#1F497D'>Portanto, se você recebeu esta mensagem por engano, por favor,
nos informe respondendo imediatamente a este e-mail e em seguida apague-a.<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Arial Narrow","sans-serif";
color:#1F497D'><o:p> </o:p></span></p>

<div style='border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0cm 0cm 0cm'>

<p class=MsoNormal><b><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'>De:</span></b><span
style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'>
r-br-bounces@listas.c3sl.ufpr.br [mailto:r-br-bounces@listas.c3sl.ufpr.br] <b>Em
nome de </b>Gustavo Henrique de Carvalho<br>
<b>Enviada em:</b> terça-feira, 7 de junho de 2011 14:29<br>
<b>Para:</b> r-br@listas.c3sl.ufpr.br<br>
<b>Assunto:</b> Re: [R-br] Semelhança de textos<o:p></o:p></span></p>

</div>

<p class=MsoNormal><o:p> </o:p></p>

<p class=MsoNormal>?agrep<o:p></o:p></p>

<div>

<p class=MsoNormal><o:p> </o:p></p>

</div>

<div>

<p class=MsoNormal style='margin-bottom:12.0pt'>Tem uma ferramente homônima no
Linux/Mac OS X e etc que também é bastante poderosa, especialmente combinada
com awk, sed, grep, etc.<o:p></o:p></p>

<div>

<p class=MsoNormal>2011/6/7 Leandro Marino <<a
href="mailto:leandro@cesgranrio.org.br">leandro@cesgranrio.org.br</a>><o:p></o:p></p>

<div style='margin-left:37.5pt;margin-top:15.0pt'>

<p class=MsoNormal><img border=0 width=1600 height=3 id="_x0000_i1025"
src="cid:image001.jpg@01CC2523.26FB7AC0"><o:p></o:p></p>

<div>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'><span
style='font-size:10.0pt;color:#006666'>Caros,</span><o:p></o:p></p>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'><span
style='font-size:10.0pt;color:#006666'>Alguém saberia me dizer se o R tem
alguma função implementada que forneça um percentual de concordância de textos
dentro de um determinado data.frame? Preciso testar todos contra todos, em
geral, são diversos conjuntos de 15 a 20 pequenos textos.</span><o:p></o:p></p>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'><span
style='font-size:11.0pt;color:#404040'>Na realidade estou preparando uma função
para encontrar registros duplicados que possam ter pequenas diferenças de
grafia.</span><o:p></o:p></p>

<div>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'><span
style='color:black'>Atenciosamente,<br>
</span><b><span style='font-size:11.0pt;color:#000040'>Leandro Lins Marino</span></b><b><span
style='font-size:10.0pt;color:#000040'><br>
</span></b><i><span style='font-size:10.0pt;color:gray'>Centro de Avaliação<br>
Fundação CESGRANRIO<br>
Rua Santa Alexandrina, 1011 - 2º andar<br>
Rio de Janeiro, RJ - CEP: 20261-903<br>
</span></i><i><span style='font-size:10.0pt;font-family:Wingdings;color:gray'>(</span></i><i><span
style='font-size:10.0pt;color:gray'> (21) 2103-9600 R.:236 <br>
</span></i><i><span style='font-size:11.0pt;font-family:Wingdings;color:gray'>*</span></i><i><span
style='font-size:11.0pt;color:gray'> <a href="mailto:leandro@cesgranrio.org.br"
target="_blank">leandro@cesgranrio.org.br</a></span></i><o:p></o:p></p>

<p class=MsoNormal><span style='font-size:10.0pt;color:#006666'> </span><o:p></o:p></p>

<p class=MsoNormal><span style='font-size:18.0pt;font-family:Webdings;
color:#76923C'>P</span><b><span style='font-size:7.5pt;font-family:"Palatino Linotype","serif";
color:#76923C'>  </span></b><b><span style='font-size:9.0pt;color:#76923C'>Antes
de imprimir</span></b><span style='font-size:9.0pt;color:#76923C'> <b>pense em
sua responsabilidade e compromisso com o</b> <b>MEIO AMBIENTE</b></span><span
style='font-size:10.0pt;color:#006666'> </span><o:p></o:p></p>

<p class=MsoNormal><span style='font-size:10.0pt;color:#006666'> </span><o:p></o:p></p>

<p class=MsoNormal><span style='font-size:10.5pt;font-family:Consolas;
color:#404040'>Esta mensagem, incluindo seus anexos, pode conter informacoes
privilegiadas e/ou de carater confidencial, nao podendo ser retransmitida sem
autorizacao do remetente. Se voce nao e o destinatario ou pessoa autorizada a
recebe-la, informamos que o seu uso, divulgacao, copia ou arquivamento sao
proibidos. </span><o:p></o:p></p>

<p class=MsoNormal><span style='font-size:10.5pt;font-family:Consolas;
color:#404040'>Portanto, se você recebeu esta mensagem por engano, por favor,
nos informe respondendo imediatamente a este e-mail e em seguida apague-a.</span><o:p></o:p></p>

</div>

<p><span style='font-size:10.0pt;color:#006666'> </span><o:p></o:p></p>

</div>

</div>

<p class=MsoNormal style='margin-bottom:12.0pt'><br>
_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br"
target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><o:p></o:p></p>

</div>

<p class=MsoNormal><o:p> </o:p></p>

</div>

</div>

</body>

</html>