<div dir="ltr">Dê uma olhada na documentação de <font face="monospace">grep()</font>.</div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Sun, Sep 1, 2019 at 10:43 PM Amiko Bh por (R-br) <<a href="mailto:r-br@listas.c3sl.ufpr.br">r-br@listas.c3sl.ufpr.br</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="auto">Muito obrigado pela ajuda.<div dir="auto"><br><div dir="auto">1) Entendi a importância da ”limpeza”</div><div dir="auto"><br></div><div dir="auto">2) ”Para atingir teus objetivos precisarás fazer uma busca no seu BD pela cadeia de caracteres que contenha o "ART. 14 - CP" e a partir dessa lista auxiliar ir eliminando as linhas e incluir numa nova coluna nos número de processo correspondentes”</div><div dir="auto"><br></div><div dir="auto">Estou sem saber que passo a passo considerar aqui...</div><div dir="auto"><br></div><div dir="auto"><br></div><div dir="auto"><br style="font-family:sans-serif;font-size:12.8px"></div></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">Em dom, 1 de set de 2019 15:44, Cesar Rabak por (R-br) <<a href="mailto:r-br@listas.c3sl.ufpr.br" target="_blank">r-br@listas.c3sl.ufpr.br</a>> escreveu:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr">Ellerson,<div><br></div><div>SE a amostra de dados que você passou é um bom exemplo, você tem um problema <i>anterior</i> para resolver que é o de multiplicidade de entradas com grafia levemente diferentes. . .</div><div><br></div><div>Veja as linhas cinco e seis do seu exemplo que o enquadramento, embora igual do ponto de vista legal, está escrito de forma levemente diferente e faria qualquer <i>script</i> (aliás, em qualquer linguagem, não só no R) entrar em parafuso 😶. . .</div><div><br></div><div>Há vários autores que dizem que a preparação e "limpeza" dos dados leva 80% do tempo de análise dos dados...</div><div><br></div><div>Para atingir teus objetivos precisarás fazer uma busca no seu BD pela cadeia de caracteres que contenha o "ART. 14 - CP" e a partir dessa lista auxiliar ir eliminando as linhas e incluir numa nova coluna nos número de processo correspondentes.</div><div><br></div><div>HTH</div><div>--</div><div>Cesar Rabak</div><div><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Sat, Aug 31, 2019 at 12:29 PM Elerson por (R-br) <<a href="mailto:r-br@listas.c3sl.ufpr.br" rel="noreferrer" target="_blank">r-br@listas.c3sl.ufpr.br</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
<div bgcolor="#FFFFFF">
<p>Prezados:</p>
<p> </p>
<p style="margin-bottom:0cm;line-height:100%"> Trabalho um banco
de dados com mais de 10000 linhas, representado pelo exemplo
abaixo.</p>
<p style="margin-bottom:0cm;line-height:100%"> </p>
<table cellspacing="0" border="0">
<colgroup width="86"></colgroup> <colgroup width="145"></colgroup>
<colgroup width="101"></colgroup> <colgroup width="94"></colgroup>
<colgroup width="119"></colgroup> <colgroup width="240"></colgroup>
<tbody>
<tr>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" height="17" align="center"><b>PROCESSO</b></td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center"><b>DATA_DISTRIBUICAO</b></td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center"><b>NOME_PARTE</b></td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center"><b>DATA_CRIME</b></td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center"><b>DATA_DENUNCIA</b></td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center"><b>ENQUADRAMENTO</b></td>
</tr>
<tr>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" height="17" align="center">180022121</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">A_NONIMATO</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="left">ART.33 PAR.CAPUT - 11.343/06</td>
</tr>
<tr>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" height="17" align="center">180022121</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">B_NONIMATO</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="left">ART.33 PAR.CAPUT - 11.343/06</td>
</tr>
<tr>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" height="17" align="center">180022105</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">C_NONIMATO</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">01/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="left">ART.35 - 11343/06</td>
</tr>
<tr>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" height="17" align="center">180022105</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">C_NONIMATO</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">01/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="left">ART.33 - 11343/06</td>
</tr>
<tr>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" height="17" align="center">180022097</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">D_NONIMATO</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">01/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="left">ART.155 PAR. 4º INC. II E IV
- CPB</td>
</tr>
<tr>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" height="17" align="center">180022097</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">E_NONIMATO</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">01/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="left">ART.155 PAR.4º INC.II E IV -
CPB</td>
</tr>
<tr>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" height="17" align="center">180022097</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">F_NONIMATO</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">01/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="left">ART.155 PAR. 4º INC. II E IV
- CPB</td>
</tr>
<tr>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" height="17" align="center">180022501</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">03/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">G_NONIMATO</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">03/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="left">ART.157 PAR.2 INC.I E II -
CP</td>
</tr>
<tr>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" height="17" align="center">180022501</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">03/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">G_NONIMATO</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">03/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="left">ART.14 - CP</td>
</tr>
</tbody>
</table>
<p style="margin-bottom:0cm;line-height:100%">
</p>
<p style="margin-bottom:0cm;line-height:100%"> </p>
<p style="margin-bottom:0cm;line-height:100%"> Hipóteses:</p>
<p style="margin-bottom:0cm;line-height:100%">a) mesmo PROCESSO,
NOME_PARTE diferentes, ENQUADRAMENTO igual (linhas 1 e 2)</p>
<p style="margin-bottom:0cm;line-height:100%">b) mesmo PROCESSO,
mesmo NOME_PARTE, ENQUADRAMENTO diferentes (linhas 3 e 4)</p>
<p style="margin-bottom:0cm;line-height:100%">c) mesmo PROCESSO,
mesmo NOME_PARTE, ENQUADRAMENTO diferentes (linhas 8 e 9)</p>
<p style="margin-bottom:0cm;line-height:100%">Minha questão se
refere à hipótese c: preciso criar um coluna (enquadramento2) para
transferir o art. 14 transformando o caso em apenas uma linha… sem
que se mexa na hipótese b. Em todo o banco sempre estará escrito
ART.14 – CP. </p>
<p style="margin-bottom:0cm;line-height:100%">Para ficar assim:</p>
<p style="margin-bottom:0cm;line-height:100%">
</p>
<p style="margin-bottom:0cm;line-height:100%"> </p>
<table cellspacing="0" border="0">
<colgroup width="86"></colgroup> <colgroup width="145"></colgroup>
<colgroup width="101"></colgroup> <colgroup width="94"></colgroup>
<colgroup width="119"></colgroup> <colgroup width="240"></colgroup>
<colgroup width="139"></colgroup> <tbody>
<tr>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" height="17" align="center"><b>PROCESSO</b></td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center"><b>DATA_DISTRIBUICAO</b></td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center"><b>NOME_PARTE</b></td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center"><b>DATA_CRIME</b></td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center"><b>DATA_DENUNCIA</b></td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center"><b>ENQUADRAMENTO</b></td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center"><b>ENQUADRAMENTO2</b></td>
</tr>
<tr>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" height="17" align="center">180022121</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">A_NONIMATO</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="left">ART.33 PAR.CAPUT - 11.343/06</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="left"><br>
</td>
</tr>
<tr>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" height="17" align="center">180022121</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">B_NONIMATO</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="left">ART.33 PAR.CAPUT - 11.343/06</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="left"><br>
</td>
</tr>
<tr>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" height="17" align="center">180022105</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">C_NONIMATO</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">01/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="left">ART.35 - 11343/06</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="left"><br>
</td>
</tr>
<tr>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" height="17" align="center">180022105</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">C_NONIMATO</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">01/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="left">ART.33 - 11343/06</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="left"><br>
</td>
</tr>
<tr>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" height="17" align="center">180022097</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">D_NONIMATO</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">01/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="left">ART.155 PAR. 4º INC. II E IV
- CPB</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="left"><br>
</td>
</tr>
<tr>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" height="17" align="center">180022097</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">E_NONIMATO</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">01/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="left">ART.155 PAR.4º INC.II E IV -
CPB</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="left"><br>
</td>
</tr>
<tr>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" height="17" align="center">180022097</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">F_NONIMATO</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">01/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="left">ART.155 PAR. 4º INC. II E IV
- CPB</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="left"><br>
</td>
</tr>
<tr>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" height="17" align="center">180022501</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">03/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">G_NONIMATO</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">02/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="center">03/01/2018</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="left">ART.157 PAR.2 INC.I E II -
CP</td>
<td style="border-width:1px;border-style:solid;border-color:rgb(0,0,0)" align="left">ART.14 - CP</td>
</tr>
</tbody>
</table>
<p style="margin-bottom:0cm;line-height:100%">
</p>
<p style="margin-bottom:0cm;line-height:100%">Obrigado.<br>
</p>
<p>
</p>
<p><br>
</p>
<p><br>
</p>
<p><br>
</p>
</div>
_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" rel="noreferrer" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" rel="noreferrer noreferrer" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" rel="noreferrer noreferrer" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br>
</blockquote></div>
_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" rel="noreferrer" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" rel="noreferrer noreferrer" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" rel="noreferrer noreferrer" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br>
</blockquote></div>
_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" rel="noreferrer" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" rel="noreferrer" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br>
</blockquote></div>