
Caros, Antes de tudo peço mil desculpas pela imensa ignorância que me assola: sou de ciências sociais e não de programação. Segui a sugestão desta lista e utilizei o rvest como indicaram. install.packages("rvest") library("rvest") Leolattes <- html("http://lattes.cnpq.br/7141811368487014") Leolattes Leolattes %>% html_nodes(".nome") %>% html_text() [1] "Leonardo Fernandes Nascimento" Deste modo, consigo extrair os dados individualizados: nome, resumo, produção, etc. do Lattes. Mas tenho alguns problemas: 1 - Como unificar as informações em uma tabela: Nome, Resumo, Endereço, etc. Não acertei usar o html_table(). 2 - Vou extrair mais de 300 CV Lattes, já tenho uma lista com todas as ID Lattes. Há como fazer um "for" utilizando o rvest e jogar tudo para uma tabela? Caso alguém responda posso colocá-lo como um dos autores do artigo. Abs Leonardo Em 22 de março de 2015 12:03, L N <leofn3@gmail.com> escreveu:
Olá Pessoal,
Alguém que saiba extrair os CV Lattes (XML) via R? Tenho listagem de todos os endereços e quero montar um banco de dado com isso. Há o ScriptLattes para Python mas eu já tentei e não consegui. Abs,
*Leonardo F. Nascimento*