Dá uma olhada no httr

https://github.com/hadley/httr

Foi desenvolvido pelo Hadley Wickham e simplifica diversos pontos na utilização do RCurl

Wilson
https://github.com/wilsonfreitas


2013/10/5 Teodoro Calvo <teocalvo2@gmail.com>
Muito obrigado mesmo !!!

Achei de mais !

Me indicaram dar uma olhada na linguagem Perl, e depois importar para o R.

Mas podendo trabalhar com uma única linguagem seria ideal !!

Muito obrigado novamente !

Att Téo Calvo.


Em 05-10-2013 08:35, Eder Comunello escreveu:
Teodoro, bom dia!

Procure pelos pacotes httr, XML e RCurl.

Se o site não exigir login/senha, será bem mais simples e você poderá operar com os dois primeiros.

Caso seja necessário passar o login/senha vale o tópico indicado anteriormente (RCurl).


Abaixo tem uns exemplos com os dois primeiros pacotes que peguei na net:

### =======================================

library(XML)
library(httr)
doc <- htmlParse(GET(theurl, user_agent("Mozilla")))
results <- xpathSApply(doc, "//*/table[@id='table_results_r_1']")
results <- readHTMLTable(results[[1]])
#rm(doc)
htmlTreeParse(txt, asText = TRUE)

### =======================================

library(XML)
res = htmlTreeParse("http://www.omegahat.org/RSXML/", useInternalNodes=TRUE)
xpathApply(res, "//h1", xmlValue)
xpathApply(res, "//pre", xmlValue)
#[[1]]
#[1] "An XML package for the S language"

### =======================================


-- 
Éder Comunello <ecomunel@gmail.com
Dourados, MS - [22 16.5'S, 54 49'W]


Em 2 de outubro de 2013 19:43, Teodoro Calvo <teocalvo2@gmail.com> escreveu:
Olá, boa noite.

Como posso extrair uma parte de um texto de determinado site, utilizando o R ?
É possível ? Existe algum material ?

Obrigado desde já.

Att Téo Calvo.
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.





_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.


_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.



--
Wilson Freitas
http://aboutwilson.net