Muito obrigado mesmo !!!
Achei de mais !
Me indicaram dar uma olhada na linguagem Perl, e depois importar para o R.
Mas podendo trabalhar com uma única linguagem seria ideal !!
Muito obrigado novamente !
Att Téo Calvo.
Em 05-10-2013 08:35, Eder Comunello escreveu:
Teodoro, bom dia!
Procure pelos pacotes httr, XML e RCurl.
Se o site não exigir login/senha, será bem mais simples e você poderá operar com os dois primeiros.
Caso seja necessário passar o login/senha vale o tópico indicado anteriormente (RCurl).
Abaixo tem uns exemplos com os dois primeiros pacotes que peguei na net:
### =======================================
library(XML)library(httr)doc <- htmlParse(GET(theurl, user_agent("Mozilla")))results <- xpathSApply(doc, "//*/table[@id='table_results_r_1']")results <- readHTMLTable(results[[1]])#rm(doc)htmlTreeParse(txt, asText = TRUE)
### =======================================
library(XML)res = htmlTreeParse("http://www.omegahat.org/RSXML/", useInternalNodes=TRUE)xpathApply(res, "//h1", xmlValue)xpathApply(res, "//pre", xmlValue)#[[1]]#[1] "An XML package for the S language"
### =======================================
--
Em 2 de outubro de 2013 19:43, Teodoro Calvo <teocalvo2@gmail.com> escreveu:
Olá, boa noite.
Como posso extrair uma parte de um texto de determinado site, utilizando o R ?
É possível ? Existe algum material ?
Obrigado desde já.
Att Téo Calvo.
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.