Senhores, acho que a questão é simples mas eu me confundo com encodings no R. No exemplo abaixo estou utilizando a função postForm para informar um número de rastreador no site dos correios. Em seguida, utilizo o pacote XML para limpar o código fonte e ficar com o que me interessa, que são os dados da carta em trânsito, desde Foz do Iguacu até minha casa.
Está funcionando, mas eu gostaria que os acentos estivessem corretos.
O resultado que obtenho no R é esse:
[1] "\r04/06/2014 \r17:06 FOZ DO IGUACUÂ /Â PR\r\r\r\r\rObjeto postado \r \r"
Marquei o enconding como "ISO-8859-1" porque é o que aparece no começo do código fonte da página:
<meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1">
Como posso melhorar?
Segue o código:
require(RCurl)
require(XML)
src<-postForm(add, .params = c(objetos="JG310431462BR",
btnPesq="Buscar",
.enconding="ISO-8859-1"))
tree<-htmlTreeParse(src, useInternalNodes=T)
xpathSApply(tree, '//table', xmlValue)
Grato,
Paulo Nogueira Starzynski