[R-br] Ler um HTM
Leonard de Assis
assis.leonard em gmail.com
Quarta Janeiro 6 23:45:38 BRST 2016
Boa noite a todos
Estou com um problema idiota em mãos. Preciso ler um arquivo .HTM dentro de
um arquivo .zip.
Até agora, o jeito que achei mais produtivo foi:
1. baixar o zip (posso fazer isso com o R via download.file)
2. extrair o .HTM do arquivo (posso fazer isso via unzip)
3. ler a tabela contida no HTM utilizando readHTMLTable (lib XML)
A questão que tenho é a seguinte:
Existe um jeito mais rápido que este? Eu já consegui ler .csv direto de
arquivo .zip utilizando o comando unz e read.table. Será que funciona assim
também em HTML? Se sim, qual seria a func?
Leonard
OS: ainda tenho que pensar como fazer webscrap desse htm, kkk
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20160106/13ab89cc/attachment.html>
-------------- Próxima Parte ----------
Um anexo não-texto foi limpo...
Nome: image001.png
Tipo: image/png
Tamanho: 7861 bytes
Descrição: não disponível
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20160106/13ab89cc/attachment.png>
Mais detalhes sobre a lista de discussão R-br