OI gente.
Talvez alguém possa me ajudar na extração de dados web.
Objetivo: extrair de cada página a tabela que aparece.
Meu problema: Não consigo achar o css certo que me permita colocar o botão "Next" de mudança de página que vem no site da web. Na primeira página tenho de extrair a tabela, depois, no next , mudar a pagina e extrair a segunda tabela que aparece, e assim vai...
Não consigo achar o css ou xpath que me possibilite mudar de pagina. Já tentei vários css abaixo:
“button.a-Button.a-IRR-button.a-IRR-button—pagination”
“li.a-IRR-pagination-item”
Segue um resuminho do código que tenho
library(rvest)
library(xml2)
u<-"http://transparencia.pi.gov.br/apex/f?p=101:SERVIDORES::::::"
ht<-read_html(u) %>%
html_nodes("span.a-Icon.icon-right-chevron") %>%
html_nodes("table") %>%
html_table()
ht
## ou até mesmo esse código
ht<-html_session(u) %>%
follow_link("span.a-Icon.icon-right-chevron") %>%
html_nodes("table") %>%
html_table()
## Obrigada!