<div dir="ltr">Teodoro, bom dia!<br><div><br></div><div>Procure pelos pacotes httr, XML e RCurl.</div><div><br></div><div>Se o site não exigir login/senha, será bem mais simples e você poderá operar com os dois primeiros.</div>
<div><br></div><div>Caso seja necessário passar o login/senha vale o tópico indicado anteriormente (RCurl).</div><div><br></div><div><<span style="font-family:'times new roman','new york',times,serif;font-size:16px"> </span><a href="http://r-br.2285057.n4.nabble.com/R-br-r-baixando-dados-inmet-td4660459.html" target="_blank" style="font-family:'times new roman','new york',times,serif;font-size:12pt">http://r-br.2285057.n4.nabble.com/R-br-r-baixando-dados-inmet-td4660459.html</a>></div>
<div><br></div><div>Abaixo tem uns exemplos com os dois primeiros pacotes que peguei na net:</div><div><br></div><div><div><font face="courier new, monospace">### =======================================</font></div><div><font face="courier new, monospace"><br>
</font></div><div><font face="courier new, monospace">library(XML)</font></div><div><font face="courier new, monospace">library(httr)</font></div><div><font face="courier new, monospace">theurl <- "<a href="http://www.rout.gr/index.php?name=Rout&file=results&year=2011">http://www.rout.gr/index.php?name=Rout&file=results&year=2011</a>"</font></div>
<div><font face="courier new, monospace">doc <- htmlParse(GET(theurl, user_agent("Mozilla")))</font></div><div><font face="courier new, monospace">results <- xpathSApply(doc, "//*/table[@id='table_results_r_1']")</font></div>
<div><font face="courier new, monospace">results <- readHTMLTable(results[[1]])</font></div><div><font face="courier new, monospace">#rm(doc)</font></div><div><font face="courier new, monospace">htmlTreeParse(txt, asText = TRUE)</font></div>
<div><font face="courier new, monospace"><br></font></div><div><font face="courier new, monospace">### =======================================</font></div><div><font face="courier new, monospace"><br></font></div><div><font face="courier new, monospace">library(XML)</font></div>
<div><font face="courier new, monospace">res = htmlTreeParse("<a href="http://www.omegahat.org/RSXML/">http://www.omegahat.org/RSXML/</a>", useInternalNodes=TRUE)</font></div><div><font face="courier new, monospace">xpathApply(res, "//h1", xmlValue)</font></div>
<div><font face="courier new, monospace">xpathApply(res, "//pre", xmlValue)</font></div><div><font face="courier new, monospace">#[[1]]</font></div><div><font face="courier new, monospace">#[1] "An XML package for the S language"</font></div>
<div><font face="courier new, monospace"><br></font></div><div><font face="courier new, monospace">### =======================================</font></div></div><div class="gmail_extra"><br></div><div class="gmail_extra">
<br></div><div class="gmail_extra">-- <br><div dir="ltr">Éder Comunello <<a href="mailto:comunello.eder@gmail.com" target="_blank">e</a><a href="mailto:comunel@gmail.com" target="_blank">comunel@gmail.com</a>> <br>Dourados, MS - [22 16.5'S, 54 49'W]</div>
<div dir="ltr"><br></div><br><div class="gmail_quote">Em 2 de outubro de 2013 19:43, Teodoro Calvo <span dir="ltr"><<a href="mailto:teocalvo2@gmail.com" target="_blank">teocalvo2@gmail.com</a>></span> escreveu:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
Olá, boa noite.<br>
<br>
Como posso extrair uma parte de um texto de determinado site, utilizando o R ?<br>
É possível ? Existe algum material ?<br>
<br>
Obrigado desde já.<br>
<br>
Att Téo Calvo.<br>
______________________________<u></u>_________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/<u></u>cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-<u></u>guia</a>) e forneça código mínimo reproduzível.<br>
</blockquote></div><br><br clear="all"><div><br></div>
</div></div>