
Teodoro, bom dia! Procure pelos pacotes httr, XML e RCurl. Se o site não exigir login/senha, será bem mais simples e você poderá operar com os dois primeiros. Caso seja necessário passar o login/senha vale o tópico indicado anteriormente (RCurl). < http://r-br.2285057.n4.nabble.com/R-br-r-baixando-dados-inmet-td4660459.html
Abaixo tem uns exemplos com os dois primeiros pacotes que peguei na net: ### ======================================= library(XML) library(httr) theurl <- "http://www.rout.gr/index.php?name=Rout&file=results&year=2011" doc <- htmlParse(GET(theurl, user_agent("Mozilla"))) results <- xpathSApply(doc, "//*/table[@id='table_results_r_1']") results <- readHTMLTable(results[[1]]) #rm(doc) htmlTreeParse(txt, asText = TRUE) ### ======================================= library(XML) res = htmlTreeParse("http://www.omegahat.org/RSXML/", useInternalNodes=TRUE) xpathApply(res, "//h1", xmlValue) xpathApply(res, "//pre", xmlValue) #[[1]] #[1] "An XML package for the S language" ### ======================================= -- Éder Comunello <e <comunello.eder@gmail.com>comunel@gmail.com> Dourados, MS - [22 16.5'S, 54 49'W] Em 2 de outubro de 2013 19:43, Teodoro Calvo <teocalvo2@gmail.com> escreveu:
Olá, boa noite.
Como posso extrair uma parte de um texto de determinado site, utilizando o R ? É possível ? Existe algum material ?
Obrigado desde já.
Att Téo Calvo. ______________________________**_________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/**cgi-bin/mailman/listinfo/r-br<https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-**guia<http://www.leg.ufpr.br/r-br-guia>) e forneça código mínimo reproduzível.