[R-br] Importação correta de palavras acentuadas com a gdata::read.xls()

Walmes Zeviani walmeszeviani em gmail.com
Terça Abril 12 00:25:17 BRT 2011


Saudações,

Tem pouco tempo que importo arquivos de extensão *xls. Estou com um problema
que ao importar um arquivo possuo nomes de cidades brasileiras com acentos
no nomes. Ao importar, as letras acentuadas são representadas de outra
forma. Quero saber como importar corretamente ou se é possível devolver os
nomes certos após importação. Veja o CMR que preparei

require(gdata) # contém a função read.xls() para importar planilhas
teste <- read.xls("http://www.leg.ufpr.br/~walmes/foo/teste.xls", sheet=1,
method="tab")
head(teste) # abaixo o print desse comando

  Sigla  Codigo             mun   a2000
1    AC 1200013   Acrel\xe2ndia 1042.38  # â trocado por \xe2
2    AC 1200054    Assis Brasil  429.22
3    AC 1200104    Brasil\xe9ia 2243.25
4    AC 1200138          Bujari  786.68
5    AC 1200179        Capixaba  603.84
6    AC 1200203 Cruzeiro do Sul 9363.32

Os demais acentos possuem o seu "\xe?" correspondente. Alguém tem uma
solução? Outro pacote/função? Meu sistema é Ubuntu 10.04. Os dados são um
subconjunto dos dados do ipeadata, baixados no formato.xls.

Outra coisa que percebi é que se o nome das colunas tiver acentos, a
importação falha, ex "municipio" (sem acento) importa, mas com "município"
(com acento) no nome da coluna não importa. Como evitar isso sem ter que
sair renomeando as colunas manualmente? Planilhas de sites coleta de dados
do Brasil sempre tem acentos por causa do nomo idioma. Minhas buscas no
nabble não retornaram resultado.

# sheet 2 está escrito "Município" como nome da coluna
teste <- read.xls("http://www.leg.ufpr.br/~walmes/foo/teste.xls", sheet=2,
method="tab")
Erro em make.names(col.names, unique = TRUE) :
  string multibyte inválida 3

Certo sua atenção, agradeço.
Walmes.

==========================================================================
Walmes Marques Zeviani
LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W)
Departamento de Estatística - Universidade Federal do Paraná
fone: (+55) 41 3361 3573
VoIP: (3361 3600) 1053 1173
e-mail: walmes em ufpr.br
twitter: @walmeszeviani
homepage: http://www.leg.ufpr.br/~walmes
linux user number: 531218
==========================================================================
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20110412/5e098557/attachment.html>


Mais detalhes sobre a lista de discussão R-br