[R-br] Problemas com Encoding
Marcos Silva
marcosfs2006 em gmail.com
Quarta Dezembro 5 23:43:43 BRST 2012
Caros amigos,
Estou tentando usar o pacote XML para ler alguns dados em tabelas
existentes em páginas html.
Especificamente, estou tentando ler páginas da previdência social contendo
informações sobre o CRP (Certificado de Regularidade Previdenciária)
O problema é que estou obtendo uns caracteres estranhos, coisas do tipo
"Situação".
Estou fazendo da seguinte forma:
library(XML)
html <- readHTMLTable("F:\\Regime Próprio\\html\\ExtratoPrevidenciario.htm")
html <- html[[3]][, c('V1', 'V2')]
Já tentei o iconv() sem resultado. Já tentei ler após mudar a opção
"encoding" em options().
Ah, estou usando o windows velho de guerra... sorry... :)
A página pode ser vista no seguinte link:
http://www1.previdencia.gov.br/sps/app/crp/ExtratoRegularidadeRegimes.asp?CD_CNPJ=28695658000184&time=23:24:56&Rel=N-L-R-D-S-E-P
Se alguém tiver alguma idéia de corrigir...
Desde já obrigado.
Abs.
--
Marcos F. Silva
http://sites.google.com/site/marcosfs2006
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20121205/9949cb4f/attachment.html>
Mais detalhes sobre a lista de discussão R-br