[R-br] Importação correta de palavras acentuadas com a gdata::read.xls()
Leonard Assis
assis.leonard em gmail.com
Quarta Abril 13 07:21:10 BRT 2011
tive um problema parecido ao ler arquivos .sav (do SPSS) uma vez. a maneira mais lógica q consegui foi salvar o arquivo em TXT e depois ler normalmente informando qual o codepage correto.
On 12/04/2011, at 00:25, Walmes Zeviani wrote:
> Saudações,
>
> Tem pouco tempo que importo arquivos de extensão *xls. Estou com um problema
> que ao importar um arquivo possuo nomes de cidades brasileiras com acentos
> no nomes. Ao importar, as letras acentuadas são representadas de outra
> forma. Quero saber como importar corretamente ou se é possível devolver os
> nomes certos após importação. Veja o CMR que preparei
>
> require(gdata) # contém a função read.xls() para importar planilhas
> teste <- read.xls("http://www.leg.ufpr.br/~walmes/foo/teste.xls", sheet=1,
> method="tab")
> head(teste) # abaixo o print desse comando
>
> Sigla Codigo mun a2000
> 1 AC 1200013 Acrel\xe2ndia 1042.38 # â trocado por \xe2
> 2 AC 1200054 Assis Brasil 429.22
> 3 AC 1200104 Brasil\xe9ia 2243.25
> 4 AC 1200138 Bujari 786.68
> 5 AC 1200179 Capixaba 603.84
> 6 AC 1200203 Cruzeiro do Sul 9363.32
>
> Os demais acentos possuem o seu "\xe?" correspondente. Alguém tem uma
> solução? Outro pacote/função? Meu sistema é Ubuntu 10.04. Os dados são um
> subconjunto dos dados do ipeadata, baixados no formato.xls.
>
> Outra coisa que percebi é que se o nome das colunas tiver acentos, a
> importação falha, ex "municipio" (sem acento) importa, mas com "município"
> (com acento) no nome da coluna não importa. Como evitar isso sem ter que
> sair renomeando as colunas manualmente? Planilhas de sites coleta de dados
> do Brasil sempre tem acentos por causa do nomo idioma. Minhas buscas no
> nabble não retornaram resultado.
>
> # sheet 2 está escrito "Município" como nome da coluna
> teste <- read.xls("http://www.leg.ufpr.br/~walmes/foo/teste.xls", sheet=2,
> method="tab")
> Erro em make.names(col.names, unique = TRUE) :
> string multibyte inválida 3
>
> Certo sua atenção, agradeço.
> Walmes.
>
> ==========================================================================
> Walmes Marques Zeviani
> LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W)
> Departamento de Estatística - Universidade Federal do Paraná
> fone: (+55) 41 3361 3573
> VoIP: (3361 3600) 1053 1173
> e-mail: walmes em ufpr.br
> twitter: @walmeszeviani
> homepage: http://www.leg.ufpr.br/~walmes
> linux user number: 531218
> ==========================================================================
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Mais detalhes sobre a lista de discussão R-br