<div dir="ltr">Dá uma olhada no httr<div><br></div><div><a href="https://github.com/hadley/httr">https://github.com/hadley/httr</a><br></div><div><br></div><div>Foi desenvolvido pelo Hadley Wickham e simplifica diversos pontos na utilização do RCurl</div>
<div><br></div><div>Wilson</div><div><a href="https://github.com/wilsonfreitas">https://github.com/wilsonfreitas</a><br></div></div><div class="gmail_extra"><br><br><div class="gmail_quote">2013/10/5 Teodoro Calvo <span dir="ltr"><<a href="mailto:teocalvo2@gmail.com" target="_blank">teocalvo2@gmail.com</a>></span><br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
  
    
  
  <div bgcolor="#FFFFFF" text="#000000">
    <div>Muito obrigado mesmo !!!<br>
      <br>
      Achei de mais !<br>
      <br>
      Me indicaram dar uma olhada na linguagem Perl, e depois importar
      para o R.<br>
      <br>
      Mas podendo trabalhar com uma única linguagem seria ideal !!<br>
      <br>
      Muito obrigado novamente !<br>
      <br>
      Att Téo Calvo.<br>
      <br>
      <br>
      Em 05-10-2013 08:35, Eder Comunello escreveu:<br>
    </div><div><div class="h5">
    <blockquote type="cite">
      <div dir="ltr">Teodoro, bom dia!<br>
        <div><br>
        </div>
        <div>Procure pelos pacotes httr, XML e RCurl.</div>
        <div><br>
        </div>
        <div>Se o site não exigir login/senha, será bem mais simples e
          você poderá operar com os dois primeiros.</div>
        <div><br>
        </div>
        <div>Caso seja necessário passar o login/senha vale o tópico
          indicado anteriormente (RCurl).</div>
        <div><br>
        </div>
        <div><<span> </span><a href="http://r-br.2285057.n4.nabble.com/R-br-r-baixando-dados-inmet-td4660459.html" target="_blank">http://r-br.2285057.n4.nabble.com/R-br-r-baixando-dados-inmet-td4660459.html</a>></div>

        <div><br>
        </div>
        <div>Abaixo tem uns exemplos com os dois primeiros pacotes que
          peguei na net:</div>
        <div><br>
        </div>
        <div>
          <div><font face="courier new, monospace">###
              =======================================</font></div>
          <div><font face="courier new, monospace"><br>
            </font></div>
          <div><font face="courier new, monospace">library(XML)</font></div>
          <div><font face="courier new, monospace">library(httr)</font></div>
          <div><font face="courier new, monospace">theurl <- "<a href="http://www.rout.gr/index.php?name=Rout&file=results&year=2011" target="_blank">http://www.rout.gr/index.php?name=Rout&file=results&year=2011</a>"</font></div>

          <div><font face="courier new, monospace">doc <-
              htmlParse(GET(theurl, user_agent("Mozilla")))</font></div>
          <div><font face="courier new, monospace">results <-
              xpathSApply(doc, "//*/table[@id='table_results_r_1']")</font></div>
          <div><font face="courier new, monospace">results <-
              readHTMLTable(results[[1]])</font></div>
          <div><font face="courier new, monospace">#rm(doc)</font></div>
          <div><font face="courier new, monospace">htmlTreeParse(txt,
              asText = TRUE)</font></div>
          <div><font face="courier new, monospace"><br>
            </font></div>
          <div><font face="courier new, monospace">###
              =======================================</font></div>
          <div><font face="courier new, monospace"><br>
            </font></div>
          <div><font face="courier new, monospace">library(XML)</font></div>
          <div><font face="courier new, monospace">res = htmlTreeParse("<a href="http://www.omegahat.org/RSXML/" target="_blank">http://www.omegahat.org/RSXML/</a>",
              useInternalNodes=TRUE)</font></div>
          <div><font face="courier new, monospace">xpathApply(res,
              "//h1", xmlValue)</font></div>
          <div><font face="courier new, monospace">xpathApply(res,
              "//pre", xmlValue)</font></div>
          <div><font face="courier new, monospace">#[[1]]</font></div>
          <div><font face="courier new, monospace">#[1] "An XML package
              for the S language"</font></div>
          <div><font face="courier new, monospace"><br>
            </font></div>
          <div><font face="courier new, monospace">###
              =======================================</font></div>
        </div>
        <div class="gmail_extra"><br>
        </div>
        <div class="gmail_extra">
          <br>
        </div>
        <div class="gmail_extra">-- <br>
          <div dir="ltr">Éder Comunello <<a href="mailto:comunello.eder@gmail.com" target="_blank">e</a><a href="mailto:comunel@gmail.com" target="_blank">comunel@gmail.com</a>> <br>
            Dourados, MS - [22 16.5'S, 54 49'W]</div>
          <div dir="ltr"><br>
          </div>
          <br>
          <div class="gmail_quote">Em 2 de outubro de 2013 19:43,
            Teodoro Calvo <span dir="ltr"><<a href="mailto:teocalvo2@gmail.com" target="_blank">teocalvo2@gmail.com</a>></span>
            escreveu:<br>
            <blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">Olá,
              boa noite.<br>
              <br>
              Como posso extrair uma parte de um texto de determinado
              site, utilizando o R ?<br>
              É possível ? Existe algum material ?<br>
              <br>
              Obrigado desde já.<br>
              <br>
              Att Téo Calvo.<br>
              _______________________________________________<br>
              R-br mailing list<br>
              <a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
              <a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
              Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>)
              e forneça código mínimo reproduzível.<br>
            </blockquote>
          </div>
          <br>
          <br clear="all">
          <div><br>
          </div>
        </div>
      </div>
      <br>
      <fieldset></fieldset>
      <br>
      <pre>_______________________________________________
R-br mailing list
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.</pre>
    </blockquote>
    <br>
  </div></div></div>

<br>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br><br clear="all"><div><br></div>-- <br>
Wilson Freitas<br><a href="http://aboutwilson.net">http://aboutwilson.net</a>
</div>