[R-br] Pegar dados de uma tabela em html

Sérgio Henrique almeida da silva ju sergio.edfisica em gmail.com
Sexta Abril 4 17:24:19 BRT 2014


O grande problema é que nessa listagem não tem as escolas federais! :(


Em 4 de abril de 2014 17:05, Sérgio Henrique almeida da silva ju <
sergio.edfisica em gmail.com> escreveu:

> Olá
>
> É verdade Marcus! Obrigado pela ajuda
>
>
> Em 4 de abril de 2014 17:02, Marcus Nunes <marcus.nunes em gmail.com>escreveu:
>
> Sérgio,
>>
>> Por que não utilizar algum dos arquivos ao final da página
>> http://portal.inep.gov.br/basica-censo ? Não sou especialista no
>> assunto, mas não percebi diferenças entre as tabelas geradas no teu link e
>> as que obtive em
>> http://download.inep.gov.br/educacao_basica/censo_escolar/resultado/2013/dados_finais_censo_escolar_2013_anexo_I.xlsx
>>
>> Particularmente, acho que será mais fácil trabalhar com arquivos .xlsx ou
>> .csv do que .html.
>>
>>
>>
>>
>>
>>
>> 2014-04-04 16:30 GMT-03:00 Sérgio Henrique almeida da silva ju <
>> sergio.edfisica em gmail.com>:
>>
>>>  Prezados
>>>
>>> Como faço para pegar os dados de uma tabela que está dentro de uma Frame
>>> em HTML usando o R?
>>>
>>> O site é esse: http://portal.inep.gov.br/basica-censo-escolar-matriculanele eu preciso dizer o estado que eu quero os dados e a pesquisa me
>>> retorna uma tabela com os dados. Não existe nenhuma opção para exportar
>>> essa tabela.
>>>
>>> Sei que existe o Rcurl e o XML, mas não tenho ideia de como fazer isso.
>>>
>>> Segue um pedaço da frame:
>>>
>>> <td >Federal</td> <td align="right" >322</td> <td align="right" >334
>>> </td> <td align="right" >3541</td> <td align="right" >6855</td> <td
>>> align="right" >16910</td> <td align="right" >10427</td>  <td align="
>>> right" >48</td> <td align="right" >1301</td> <td align="right" >0</td> <td
>>> align="right" >0</td>  <td align="right" >9</td> <td align="right" >70
>>> </td> <td align="right" >361</td> <td align="right" >311</td> <td align
>>> ="right" >209</td> <td align="right" >83</td> <td align="right" >0</td> <td
>>> align="right" >2</td>
>>>
>>>
>>>
>>> --
>>> Sérgio Henrique Almeida da Silva Junior
>>> Doutorando em Epidemiologia em Saúde Pública
>>> Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ
>>> http://lattes.cnpq.br/1611345552843383
>>> Tel: (21) 968463637
>>> http://www.linkedin.com/profile/view?id=250437145&trk=tab_pro
>>>
>>> _______________________________________________
>>> R-br mailing list
>>> R-br em listas.c3sl.ufpr.br
>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>> código mínimo reproduzível.
>>>
>>
>>
>>
>> --
>> Marcus Nunes
>> http://marcusnunes.me/
>>
>
>
>
> --
> Sérgio Henrique Almeida da Silva Junior
> Doutorando em Epidemiologia em Saúde Pública
> Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ
> http://lattes.cnpq.br/1611345552843383
> Tel: (21) 968463637
> http://www.linkedin.com/profile/view?id=250437145&trk=tab_pro
>



-- 
Sérgio Henrique Almeida da Silva Junior
Doutorando em Epidemiologia em Saúde Pública
Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ
http://lattes.cnpq.br/1611345552843383
Tel: (21) 968463637
http://www.linkedin.com/profile/view?id=250437145&trk=tab_pro
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20140404/3d68c4c0/attachment.html>


Mais detalhes sobre a lista de discussão R-br