[R-br] Encoding e função postForm
Paulo Nogueira Starzynski
paulons em gmail.com
Sábado Junho 7 14:01:24 BRT 2014
Senhores, acho que a questão é simples mas eu me confundo com encodings no
R. No exemplo abaixo estou utilizando a função postForm para informar um
número de rastreador no site dos correios. Em seguida, utilizo o pacote XML
para limpar o código fonte e ficar com o que me interessa, que são os dados
da carta em trânsito, desde Foz do Iguacu até minha casa.
Está funcionando, mas eu gostaria que os acentos estivessem corretos.
O resultado que obtenho no R é esse:
[1] "\r04/06/2014 \r17:06 FOZ DO IGUACUÂ /Â PR\r\r\r\r\rObjeto postado \r \r"
Marquei o enconding como "ISO-8859-1" porque é o que aparece no começo do
código fonte da página:
<meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1">
Como posso melhorar?
Segue o código:
require(RCurl)
require(XML)
add<-"http://www2.correios.com.br/sistemas/rastreamento/resultado.cfm"
src<-postForm(add, .params = c(objetos="JG310431462BR",
btnPesq="Buscar",
.enconding="ISO-8859-1"))
tree<-htmlTreeParse(src, useInternalNodes=T)
xpathSApply(tree, '//table', xmlValue)
Grato,
Paulo Nogueira Starzynski
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20140607/a90af27d/attachment.html>
Mais detalhes sobre a lista de discussão R-br