[R-br] Extração de dados html
Edimeire Alexandra Pinto
economatistica em yahoo.com.br
Sex Fev 8 15:57:02 -02 2019
OI gente.
Talvez alguém possa me ajudar na extração de dados web.
Objetivo: extrair de cada página a tabela que aparece.
Meu problema: Não consigo achar o css certo que me permita colocar o botão "Next" de mudança de página que vem no site da web. Na primeira página tenho de extrair a tabela, depois, no next , mudar a pagina e extrair a segunda tabela que aparece, e assim vai...
Não consigo achar o css ou xpath que me possibilite mudar de pagina. Já tentei vários css abaixo:
“button.a-Button.a-IRR-button.a-IRR-button—pagination”
“li.a-IRR-pagination-item”
Segue um resuminho do código que tenho
library(rvest)library(xml2)
u<-"http://transparencia.pi.gov.br/apex/f?p=101:SERVIDORES::::::"
ht<-read_html(u) %>% html_nodes("span.a-Icon.icon-right-chevron") %>% html_nodes("table") %>% html_table()ht
## ou até mesmo esse código
ht<-html_session(u) %>% follow_link("span.a-Icon.icon-right-chevron") %>% html_nodes("table") %>% html_table()
## Obrigada!
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20190208/3efeee0f/attachment.html>
Mais detalhes sobre a lista de discussão R-br