Re: [R-br] Usar R p/ importar informações da web

Teodoro, bom dia! Procure pelos pacotes httr, XML e RCurl. Se o site não exigir login/senha, será bem mais simples e você poderá operar com os dois primeiros. Caso seja necessário passar o login/senha vale o tópico indicado anteriormente (RCurl). < http://r-br.2285057.n4.nabble.com/R-br-r-baixando-dados-inmet-td4660459.html
Abaixo tem uns exemplos com os dois primeiros pacotes que peguei na net: ### ======================================= library(XML) library(httr) theurl <- "http://www.rout.gr/index.php?name=Rout&file=results&year=2011" doc <- htmlParse(GET(theurl, user_agent("Mozilla"))) results <- xpathSApply(doc, "//*/table[@id='table_results_r_1']") results <- readHTMLTable(results[[1]]) #rm(doc) htmlTreeParse(txt, asText = TRUE) ### ======================================= library(XML) res = htmlTreeParse("http://www.omegahat.org/RSXML/", useInternalNodes=TRUE) xpathApply(res, "//h1", xmlValue) xpathApply(res, "//pre", xmlValue) #[[1]] #[1] "An XML package for the S language" ### ======================================= -- Éder Comunello <e <comunello.eder@gmail.com>comunel@gmail.com> Dourados, MS - [22 16.5'S, 54 49'W] Em 2 de outubro de 2013 19:43, Teodoro Calvo <teocalvo2@gmail.com> escreveu:
Olá, boa noite.
Como posso extrair uma parte de um texto de determinado site, utilizando o R ? É possível ? Existe algum material ?
Obrigado desde já.
Att Téo Calvo. ______________________________**_________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/**cgi-bin/mailman/listinfo/r-br<https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-**guia<http://www.leg.ufpr.br/r-br-guia>) e forneça código mínimo reproduzível.

Muito obrigado mesmo !!! Achei de mais ! Me indicaram dar uma olhada na linguagem Perl, e depois importar para o R. Mas podendo trabalhar com uma única linguagem seria ideal !! Muito obrigado novamente ! Att Téo Calvo. Em 05-10-2013 08:35, Eder Comunello escreveu:
Teodoro, bom dia!
Procure pelos pacotes httr, XML e RCurl.
Se o site não exigir login/senha, será bem mais simples e você poderá operar com os dois primeiros.
Caso seja necessário passar o login/senha vale o tópico indicado anteriormente (RCurl).
<http://r-br.2285057.n4.nabble.com/R-br-r-baixando-dados-inmet-td4660459.html>
Abaixo tem uns exemplos com os dois primeiros pacotes que peguei na net:
### =======================================
library(XML) library(httr) theurl <- "http://www.rout.gr/index.php?name=Rout&file=results&year=2011" doc <- htmlParse(GET(theurl, user_agent("Mozilla"))) results <- xpathSApply(doc, "//*/table[@id='table_results_r_1']") results <- readHTMLTable(results[[1]]) #rm(doc) htmlTreeParse(txt, asText = TRUE)
### =======================================
library(XML) res = htmlTreeParse("http://www.omegahat.org/RSXML/", useInternalNodes=TRUE) xpathApply(res, "//h1", xmlValue) xpathApply(res, "//pre", xmlValue) #[[1]] #[1] "An XML package for the S language"
### =======================================
-- Éder Comunello <e <mailto:comunello.eder@gmail.com>comunel@gmail.com <mailto:comunel@gmail.com>> Dourados, MS - [22 16.5'S, 54 49'W]
Em 2 de outubro de 2013 19:43, Teodoro Calvo <teocalvo2@gmail.com <mailto:teocalvo2@gmail.com>> escreveu:
Olá, boa noite.
Como posso extrair uma parte de um texto de determinado site, utilizando o R ? É possível ? Existe algum material ?
Obrigado desde já.
Att Téo Calvo. _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br <mailto:R-br@listas.c3sl.ufpr.br> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Dá uma olhada no httr https://github.com/hadley/httr Foi desenvolvido pelo Hadley Wickham e simplifica diversos pontos na utilização do RCurl Wilson https://github.com/wilsonfreitas 2013/10/5 Teodoro Calvo <teocalvo2@gmail.com>
Muito obrigado mesmo !!!
Achei de mais !
Me indicaram dar uma olhada na linguagem Perl, e depois importar para o R.
Mas podendo trabalhar com uma única linguagem seria ideal !!
Muito obrigado novamente !
Att Téo Calvo.
Em 05-10-2013 08:35, Eder Comunello escreveu:
Teodoro, bom dia!
Procure pelos pacotes httr, XML e RCurl.
Se o site não exigir login/senha, será bem mais simples e você poderá operar com os dois primeiros.
Caso seja necessário passar o login/senha vale o tópico indicado anteriormente (RCurl).
< http://r-br.2285057.n4.nabble.com/R-br-r-baixando-dados-inmet-td4660459.html
Abaixo tem uns exemplos com os dois primeiros pacotes que peguei na net:
### =======================================
library(XML) library(httr) theurl <- "http://www.rout.gr/index.php?name=Rout&file=results&year=2011" doc <- htmlParse(GET(theurl, user_agent("Mozilla"))) results <- xpathSApply(doc, "//*/table[@id='table_results_r_1']") results <- readHTMLTable(results[[1]]) #rm(doc) htmlTreeParse(txt, asText = TRUE)
### =======================================
library(XML) res = htmlTreeParse("http://www.omegahat.org/RSXML/", useInternalNodes=TRUE) xpathApply(res, "//h1", xmlValue) xpathApply(res, "//pre", xmlValue) #[[1]] #[1] "An XML package for the S language"
### =======================================
-- Éder Comunello <e <comunello.eder@gmail.com>comunel@gmail.com> Dourados, MS - [22 16.5'S, 54 49'W]
Em 2 de outubro de 2013 19:43, Teodoro Calvo <teocalvo2@gmail.com>escreveu:
Olá, boa noite.
Como posso extrair uma parte de um texto de determinado site, utilizando o R ? É possível ? Existe algum material ?
Obrigado desde já.
Att Téo Calvo. _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing listR-br@listas.c3sl.ufpr.brhttps://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Wilson Freitas http://aboutwilson.net
participantes (3)
-
Eder Comunello
-
Teodoro Calvo
-
Wilson Freitas