[R-br] Importação correta de palavras acentuadas com a gdata::read.xls()

Leonard Assis assis.leonard em gmail.com
Quarta Abril 13 07:21:10 BRT 2011


tive um problema parecido ao ler arquivos .sav (do SPSS) uma vez. a maneira mais lógica q consegui foi salvar o arquivo em TXT e depois ler normalmente informando qual o codepage correto.
On 12/04/2011, at 00:25, Walmes Zeviani wrote:

> Saudações,
> 
> Tem pouco tempo que importo arquivos de extensão *xls. Estou com um problema
> que ao importar um arquivo possuo nomes de cidades brasileiras com acentos
> no nomes. Ao importar, as letras acentuadas são representadas de outra
> forma. Quero saber como importar corretamente ou se é possível devolver os
> nomes certos após importação. Veja o CMR que preparei
> 
> require(gdata) # contém a função read.xls() para importar planilhas
> teste <- read.xls("http://www.leg.ufpr.br/~walmes/foo/teste.xls", sheet=1,
> method="tab")
> head(teste) # abaixo o print desse comando
> 
>  Sigla  Codigo             mun   a2000
> 1    AC 1200013   Acrel\xe2ndia 1042.38  # â trocado por \xe2
> 2    AC 1200054    Assis Brasil  429.22
> 3    AC 1200104    Brasil\xe9ia 2243.25
> 4    AC 1200138          Bujari  786.68
> 5    AC 1200179        Capixaba  603.84
> 6    AC 1200203 Cruzeiro do Sul 9363.32
> 
> Os demais acentos possuem o seu "\xe?" correspondente. Alguém tem uma
> solução? Outro pacote/função? Meu sistema é Ubuntu 10.04. Os dados são um
> subconjunto dos dados do ipeadata, baixados no formato.xls.
> 
> Outra coisa que percebi é que se o nome das colunas tiver acentos, a
> importação falha, ex "municipio" (sem acento) importa, mas com "município"
> (com acento) no nome da coluna não importa. Como evitar isso sem ter que
> sair renomeando as colunas manualmente? Planilhas de sites coleta de dados
> do Brasil sempre tem acentos por causa do nomo idioma. Minhas buscas no
> nabble não retornaram resultado.
> 
> # sheet 2 está escrito "Município" como nome da coluna
> teste <- read.xls("http://www.leg.ufpr.br/~walmes/foo/teste.xls", sheet=2,
> method="tab")
> Erro em make.names(col.names, unique = TRUE) :
>  string multibyte inválida 3
> 
> Certo sua atenção, agradeço.
> Walmes.
> 
> ==========================================================================
> Walmes Marques Zeviani
> LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W)
> Departamento de Estatística - Universidade Federal do Paraná
> fone: (+55) 41 3361 3573
> VoIP: (3361 3600) 1053 1173
> e-mail: walmes em ufpr.br
> twitter: @walmeszeviani
> homepage: http://www.leg.ufpr.br/~walmes
> linux user number: 531218
> ==========================================================================
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br



Mais detalhes sobre a lista de discussão R-br