Dê uma olhada no pacote XML, funções xpathSApply(), readHTMLTable(), htmlTreeParse()

São bem úteis pro que você precisa.

Abraço,

Leonardo.


Em 25 de julho de 2014 13:02, Paulo Nogueira Starzynski <paulons@gmail.com> escreveu:
Senhores, como já manifestei em outras mensagens, gosto e acho útil criar algoritmos (spiders, boots, etc... tem muitos nomes) que buscam dados não estruturados na internet e depois organizam esses dados em tabelas para posterior análise.

Não vejo muito o R sendo utilizado com essa finalidade de extrair dados de forma rotineira. Gostaria de aprender mais sobre o curl (http://curl.haxx.se/), que no R pode ser utilizado através do pacote RCurl. O link acima apresenta um bom conteúdo mas não para leigos, e tenho algumas dificuldades em digerir o material.

Algum de vocês conhece o assunto e pode indicar outros materiais, tutoriais, portais de conhecimento, wikis, etc, envolvendo curl? Não precisa ser necessariamente ligado ao R.

Quem sabe reunindo mais fontes eu possa evoluir o conhecimento atual.

Abraços,
Paulo

_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.