<div dir="ltr">Dê uma olhada no pacote XML, funções xpathSApply(), readHTMLTable(), htmlTreeParse()<div><br></div><div>São bem úteis pro que você precisa.</div><div><br></div><div>Abraço,</div><div><br></div><div>Leonardo.</div>
</div><div class="gmail_extra"><br><br><div class="gmail_quote">Em 25 de julho de 2014 13:02, Paulo Nogueira Starzynski <span dir="ltr"><<a href="mailto:paulons@gmail.com" target="_blank">paulons@gmail.com</a>></span> escreveu:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div><div>Senhores, como já manifestei em outras mensagens, gosto e acho útil criar algoritmos (spiders, boots, etc... tem muitos nomes) que buscam dados não estruturados na internet e depois organizam esses dados em tabelas para posterior análise.<br>
<br></div>Não vejo muito o R sendo utilizado com essa finalidade de extrair dados de forma rotineira. Gostaria de aprender mais sobre o curl (<a href="http://curl.haxx.se/" target="_blank">http://curl.haxx.se/</a>), que no R pode ser utilizado através do pacote RCurl. O link acima apresenta um bom conteúdo mas não para leigos, e tenho algumas dificuldades em digerir o material. <br>
<br></div><div>Algum de vocês conhece o assunto e pode indicar outros materiais, tutoriais, portais de conhecimento, wikis, etc, envolvendo curl? Não precisa ser necessariamente ligado ao R.<br><br></div><div>Quem sabe reunindo mais fontes eu possa evoluir o conhecimento atual.<br>
<br></div><div>Abraços,<br>Paulo<br></div></div>
<br>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br></div>