
Caros amigos, Estou tentando usar o pacote XML para ler alguns dados em tabelas existentes em páginas html. Especificamente, estou tentando ler páginas da previdência social contendo informações sobre o CRP (Certificado de Regularidade Previdenciária) O problema é que estou obtendo uns caracteres estranhos, coisas do tipo "Situação". Estou fazendo da seguinte forma: library(XML) html <- readHTMLTable("F:\\Regime Próprio\\html\\ExtratoPrevidenciario.htm") html <- html[[3]][, c('V1', 'V2')] Já tentei o iconv() sem resultado. Já tentei ler após mudar a opção "encoding" em options(). Ah, estou usando o windows velho de guerra... sorry... :) A página pode ser vista no seguinte link: http://www1.previdencia.gov.br/sps/app/crp/ExtratoRegularidadeRegimes.asp?CD... Se alguém tiver alguma idéia de corrigir... Desde já obrigado. Abs. -- Marcos F. Silva http://sites.google.com/site/marcosfs2006