[R-br] Ler um HTM

Leonard de Assis assis.leonard em gmail.com
Quarta Janeiro 6 23:45:38 BRST 2016


Boa noite a todos

 

Estou com um problema idiota em mãos. Preciso ler um arquivo .HTM dentro de
um arquivo .zip.

Até agora, o jeito que achei mais produtivo foi:

1.       baixar o zip (posso fazer isso com o R via download.file)

2.       extrair o .HTM do arquivo (posso fazer isso via unzip)

3.       ler a tabela contida no HTM utilizando readHTMLTable (lib XML)

 

A questão que tenho é a seguinte:

 

Existe um jeito mais rápido que este? Eu já consegui ler .csv direto de
arquivo .zip utilizando o comando unz e read.table. Será que funciona assim
também em HTML? Se sim, qual seria a func?

 

Leonard

 

OS: ainda tenho que pensar como fazer webscrap desse htm, kkk

 



 

-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20160106/13ab89cc/attachment.html>
-------------- Próxima Parte ----------
Um anexo não-texto foi limpo...
Nome: image001.png
Tipo: image/png
Tamanho: 7861 bytes
Descrição: não disponível
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20160106/13ab89cc/attachment.png>


Mais detalhes sobre a lista de discussão R-br