2012/12/6 Marcos Silva <marcosfs2006@gmail.com>

Em 5 de dezembro de 2012 23:43, Marcos Silva <marcosfs2006@gmail.com> escreveu:

Caros amigos,

Estou tentando usar o pacote XML para ler alguns dados em tabelas existentes em páginas html.
Especificamente, estou tentando ler páginas da previdęncia social contendo informaçőes sobre o CRP (Certificado de Regularidade Previdenciária)
O problema é que estou obtendo uns caracteres estranhos, coisas do tipo "SituaĂ§ĂŁo".
Estou fazendo da seguinte forma:

library(XML)
html <- readHTMLTable("F:\\Regime Próprio\\html\\ExtratoPrevidenciario.htm")
html <- html[[3]][, c('V1', 'V2')]

Já tentei o iconv() sem resultado. Já tentei ler após mudar a opçăo "encoding" em options().

Ah, estou usando o windows velho de guerra... sorry... :)

A página pode ser vista no seguinte link:

http://www1.previdencia.gov.br/sps/app/crp/ExtratoRegularidadeRegimes.asp?CD_CNPJ=28695658000184&time=23:24:56&Rel=N-L-R-D-S-E-P

Se alguém tiver alguma idéia de corrigir...

Desde já obrigado.

Abs.

--
Marcos F. Silva
http://sites.google.com/site/marcosfs2006

--
Marcos F. Silva
http://sites.google.com/site/marcosfs2006

_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.