[R-br] Usar R p/ importar informações da web

Eder Comunello ecomunel em gmail.com
Sábado Outubro 5 08:35:51 BRT 2013


Teodoro, bom dia!

Procure pelos pacotes httr, XML e RCurl.

Se o site não exigir login/senha, será bem mais simples e você poderá
operar com os dois primeiros.

Caso seja necessário passar o login/senha vale o tópico indicado
anteriormente (RCurl).

<
http://r-br.2285057.n4.nabble.com/R-br-r-baixando-dados-inmet-td4660459.html
>

Abaixo tem uns exemplos com os dois primeiros pacotes que peguei na net:

### =======================================

library(XML)
library(httr)
theurl <- "http://www.rout.gr/index.php?name=Rout&file=results&year=2011"
doc <- htmlParse(GET(theurl, user_agent("Mozilla")))
results <- xpathSApply(doc, "//*/table[@id='table_results_r_1']")
results <- readHTMLTable(results[[1]])
#rm(doc)
htmlTreeParse(txt, asText = TRUE)

### =======================================

library(XML)
res = htmlTreeParse("http://www.omegahat.org/RSXML/", useInternalNodes=TRUE)
xpathApply(res, "//h1", xmlValue)
xpathApply(res, "//pre", xmlValue)
#[[1]]
#[1] "An XML package for the S language"

### =======================================


-- 
Éder Comunello <e <comunello.eder em gmail.com>comunel em gmail.com>
Dourados, MS - [22 16.5'S, 54 49'W]


Em 2 de outubro de 2013 19:43, Teodoro Calvo <teocalvo2 em gmail.com> escreveu:

> Olá, boa noite.
>
> Como posso extrair uma parte de um texto de determinado site, utilizando o
> R ?
> É possível ? Existe algum material ?
>
> Obrigado desde já.
>
> Att Téo Calvo.
> ______________________________**_________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/**cgi-bin/mailman/listinfo/r-br<https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br>
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-**guia<http://www.leg.ufpr.br/r-br-guia>)
> e forneça código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20131005/d8b84a23/attachment.html>


Mais detalhes sobre a lista de discussão R-br