<br>
<div class="gmail_quote">Em 5 de dezembro de 2012 23:43, Marcos Silva <span dir="ltr"><<a href="mailto:marcosfs2006@gmail.com" target="_blank">marcosfs2006@gmail.com</a>></span> escreveu:<br>
<blockquote style="BORDER-LEFT:#ccc 1px solid;MARGIN:0px 0px 0px 0.8ex;PADDING-LEFT:1ex" class="gmail_quote">Caros amigos,<br><br>Estou tentando usar o pacote XML para ler alguns dados em tabelas existentes em páginas html.<br>
Especificamente, estou tentando ler páginas da previdência social contendo informações sobre o CRP (Certificado de Regularidade Previdenciária)<br>O problema é que estou obtendo uns caracteres estranhos, coisas do tipo "Situação".<br>
Estou fazendo da seguinte forma:<br><br>library(XML)<br>html <- readHTMLTable("F:\\Regime Próprio\\html\\ExtratoPrevidenciario.htm")<br>html <- html[[3]][, c('V1', 'V2')]<br><br>Já tentei o iconv() sem resultado. Já tentei ler após mudar a opção "encoding" em options(). <br>
<br>Ah, estou usando o windows velho de guerra... sorry... :)<br><br>A página pode ser vista no seguinte link:<br><br><a href="http://www1.previdencia.gov.br/sps/app/crp/ExtratoRegularidadeRegimes.asp?CD_CNPJ=28695658000184&time=23:24:56&Rel=N-L-R-D-S-E-P" target="_blank">http://www1.previdencia.gov.br/sps/app/crp/ExtratoRegularidadeRegimes.asp?CD_CNPJ=28695658000184&time=23:24:56&Rel=N-L-R-D-S-E-P</a><br clear="all">
<br>Se alguém tiver alguma idéia de corrigir...<br><br>Desde já obrigado.<br><br>Abs.<span class="HOEnZb"><font color="#888888"><br><br>-- <br>Marcos F. Silva<br><a href="http://sites.google.com/site/marcosfs2006" target="_blank">http://sites.google.com/site/marcosfs2006</a><br>
</font></span></blockquote></div><br><br clear="all"><br>-- <br>Marcos F. Silva<br><a href="http://sites.google.com/site/marcosfs2006" target="_blank">http://sites.google.com/site/marcosfs2006</a><br>