[R-br] Lendo formato HTML

Henrique Dallazuanna wwwhsd em gmail.com
Terça Junho 21 10:08:08 BRT 2011


Leonard,

Tente assim:

library(XML)

tmp <- tempfile()
download.file("http://www1.caixa.gov.br/loterias/_arquivos/loterias/D_megase.zip",
tmp)
mega <- readHTMLTable(readLines(unz(tmp, "D_MEGA.HTM")))

2011/6/21 Leonard Assis <assis.leonard em gmail.com>:
> Bom dia
>
> Tenho que acessar uma tabela em uma página asp.
>
> tenho duas perguntas simples:
>
> 1. consigo ler estes arquivos no R sem precisar converter para, por exemplo, CSV?
> 2. Em caso positivo, existe como saltar as 2 primeiras linhas, pois os dados começam na linha 3. Cabeçalho está na linha 2.
>
> uma base de dados que pode ser usada como exemplo seriam as disponíveis pra download no site das loterias da Caixa (Diferença é que estes estão em .zip e com o htm incluido). Já lidei com esses dados, na época eu optei por importar no excel e salvar como CSV.
>
> Portanto, aguardo sugestões de como ler uma tabela no formato html direto no R.
>
> Segue o link da caixa como exemplo de base de dados similar.
>
> http://www1.caixa.gov.br/loterias/_arquivos/loterias/D_megase.zip
>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
>



-- 
Henrique Dallazuanna
Curitiba-Paraná-Brasil
25° 25' 40" S 49° 16' 22" O


Mais detalhes sobre a lista de discussão R-br