[R-br] Coletar informações (texto) de sites

Luís Gustavo lgsilvaesilva em gmail.com
Quinta Outubro 20 17:45:37 BRST 2011


Olá Daniel,

Tente rodar estas linhas abaixo para um município, caso dê certo,  use
alguma função da família apply para o restante dos municípios.

dados=readLines(paste("http://www.cnm.org.br/eleicao/mu_ele_prefeito.asp?iIdMun=100141004"))
prefeitos = sapply(strsplit(dados[c(2071,2124,2177)],"\t"),FUN =
function(x) paste(x,collapse=""))

Abraço

Em 20 de outubro de 2011 16:21, Daniel Dantas
<daniel.dantas em hotmail.com> escreveu:
> Boa tarde pessoal,
>
> Existe alguma maneira de "pedir" para o R entrar neste site
> http://www.cnm.org.br/eleicao/mu_ele_prefeito.asp?iIdMun=100141003 e me
> retornar o nome do prefeito de 2008 e de 2004?
>
> O objetivo disto é obter a listagem dos prefeitos de 2004 e de 2008 para ver
> quem foi reeleito, se está no 1° ou 2° mandato.
>
> Para cada município, o link muda apenas o final, então tem como programar
> para que ele abra os links de todos os municípios do estado do PARANÁ, mas
> não sei como fazer ele me retornar o nome do prefeito.
>
> Algo interessante que descobri agora, não sei é por causa do Internet
> Explorer ou é do site, mas se apertarmos com o botão direito no campo onde
> está escrito o nome do prefeito, surge-se a opção de exportar para Excel as
> informações daquele ano. Eu poderia fazer isso 399 (qtde de municípios
> do PR) vezes para o ano de 2004 e 399 para o ano de 2008 e pedir para o
> R consolidar em 1 planilha. Mas mesmo assim dá um certo trabalho salvar 798
> planilhas.
>
> Alguém sabe um procedimento mais simples? Espero que eu tenha consigo me
> fazer entender.
>
> Obrigado,
> Daniel
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código
> mínimo reproduzível.
>



-- 
Luís Gustavo Silva e Silva


Mais detalhes sobre a lista de discussão R-br