<div dir="ltr"><div>Leonardo, <br></div>talvez você já tenha alguma vez trilhado o caminho das pedras do webscrapping, mas, se não, recomendo os pacotes XML, RCurl e rvest (eu uso mais os dois primeiros).<br></div><div class="gmail_extra"><br clear="all"><div><div class="gmail_signature"><div dir="ltr"><div><div>Abraços,<br></div><div>Paulo<br></div></div></div></div></div>
<br><div class="gmail_quote">Em 6 de janeiro de 2016 23:45, Leonard de Assis <span dir="ltr"><<a href="mailto:assis.leonard@gmail.com" target="_blank">assis.leonard@gmail.com</a>></span> escreveu:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div link="#0563C1" vlink="#954F72" lang="PT-BR"><div><p class="MsoNormal">Boa noite a todos<u></u><u></u></p><p class="MsoNormal"><u></u> <u></u></p><p class="MsoNormal">Estou com um problema idiota em mãos. Preciso ler um arquivo .HTM dentro de um arquivo .zip.<u></u><u></u></p><p class="MsoNormal">Até agora, o jeito que achei mais produtivo foi:<u></u><u></u></p><p><u></u><span>1.<span style="font:7.0pt "Times New Roman""> </span></span><u></u>baixar o zip (posso fazer isso com o R via download.file)<u></u><u></u></p><p><u></u><span>2.<span style="font:7.0pt "Times New Roman""> </span></span><u></u>extrair o .HTM do arquivo (posso fazer isso via unzip)<u></u><u></u></p><p><u></u><span>3.<span style="font:7.0pt "Times New Roman""> </span></span><u></u>ler a tabela contida no HTM utilizando readHTMLTable (lib XML)<u></u><u></u></p><p class="MsoNormal"><u></u> <u></u></p><p class="MsoNormal">A questão que tenho é a seguinte:<u></u><u></u></p><p class="MsoNormal"><u></u> <u></u></p><p class="MsoNormal">Existe um jeito mais rápido que este? Eu já consegui ler .csv direto de arquivo .zip utilizando o comando unz e read.table. Será que funciona assim também em HTML? Se sim, qual seria a func?<u></u><u></u></p><p class="MsoNormal"><u></u> <u></u></p><p class="MsoNormal">Leonard<u></u><u></u></p><p class="MsoNormal"><u></u> <u></u></p><p class="MsoNormal">OS: ainda tenho que pensar como fazer webscrap desse htm, kkk<u></u><u></u></p><p class="MsoNormal"><u></u> <u></u></p><p class="MsoNormal"><span><img src="cid:image001.png@01D148DC.5811EDB0" height="151" width="151"><u></u><u></u></span></p><p class="MsoNormal"><u></u> <u></u></p></div></div><br>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" rel="noreferrer" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" rel="noreferrer" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br></div>