<span style="font-family:trebuchet ms,sans-serif">Saudações,<br><br>Em sala de aula sempre destaco as funcionalidades que o R tem para facilitar a vida do usuário. Um exemplo que uso é a leitura de dados de páginas html. Encontrei pronto a leitura de uma tabela do google (matéria de blog <a href="http://bhoom.wordpress.com/2010/06/07/61/">http://bhoom.wordpress.com/2010/06/07/61/</a>). Reproduzi isso em sala de aula mas quando mudei de site não obtive êxito. Esse é o CMR que reproduzi em sala<br>
<br><span style="font-family:courier new,monospace">> library(XML)<br>> u <- "<a href="http://www.google.com/adplanner/static/top1000/">http://www.google.com/adplanner/static/top1000/</a>"<br>> tables <- readHTMLTable(u)<br>
> my.table <- tables[[2]] # The first element of the list is empty<br>> str(my.table)<br>'data.frame':    999 obs. of  7 variables:<br> $ 1                : Factor w/ 999 levels "10","100","1000",..: 112 223 334 445 556 667 778 889 1 13 ...<br>
 $ <a href="http://facebook.com">facebook.com</a>     : Factor w/ 999 levels "<a href="http://01net.com">01net.com</a>","<a href="http://10086.cn">10086.cn</a>",..: 978 957 499 566 920 161 133 548 697 153 ...<br>
 $ Social Networks  : Factor w/ 231 levels "","Accounting & Auditing",..: 149 224 173 224 59 22 173 183 224 173 ...<br> $ 880,000,000      : Factor w/ 88 levels "10,000,000","11,000,000",..: 74 52 43 39 37 32 28 24 24 21 ...<br>
 $ 51.3%            : Factor w/ 55 levels "0.3%","0.4%",..: 41 34 31 28 26 22 20 15 16 13 ...<br> $ 1,000,000,000,000: Factor w/ 149 levels "1,000,000,000",..: 3 127 133 33 108 90 8 45 72 142 ...<br>
 $ Yes              : Factor w/ 2 levels "No","Yes": 2 2 2 2 1 2 2 2 2 2 ...</span><br><br>Alguma minupalação eu tive que fazer após leitura para ficar pronto para trabalhar, como remover os % dos valores na 5ª coluna.<br>
O meu desejo é ler os dados disponíveis em <a href="http://vestibular.ufrgs.br/listao/letra_A.html">http://vestibular.ufrgs.br/listao/letra_A.html</a>. No caso eu iria ler os resultados para todas as letras (A-Z), juntar tudo em um data.frame só e fazer algumas análises. Ao partir do mesmo código resultou em<br>
<br><span style="font-family:courier new,monospace">> u <- "<a href="http://vestibular.ufrgs.br/listao/letra_A.html">http://vestibular.ufrgs.br/listao/letra_A.html</a>"<br>> tables <- readHTMLTable(u)<br>
> str(tables)<br> Named list()<br>> tables<br>named list()</span><br><br>Ou seja, não veio nada. Eu abri o código fonte da página e pelo visto a tabela está oculta ou coisa assim, ou o endereço dela não é esse link. Eu tenho quase nenhuma experiência com isso.<br>
Alguém teria alguma sugestão de como importar esses dados direto da web?<br><br>Certo de vossa atenção, agradeço.<br>Walmes.<br><br>==========================================================================<br>Walmes Marques Zeviani<br>
LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W)<br>Departamento de Estatística - Universidade Federal do Paraná<br>fone: (+55) 41 3361 3573<br>VoIP: (3361 3600) 1053 1173<br>e-mail: <a href="mailto:walmes@ufpr.br">walmes@ufpr.br</a><br>
skype: walmeszeviani<br>twitter: @walmeszeviani<br>homepage: <a href="http://www.leg.ufpr.br/~walmes">http://www.leg.ufpr.br/~walmes</a><br>linux user number: 531218<br>==========================================================================<br>
</span>