
tive um problema parecido ao ler arquivos .sav (do SPSS) uma vez. a maneira mais lógica q consegui foi salvar o arquivo em TXT e depois ler normalmente informando qual o codepage correto. On 12/04/2011, at 00:25, Walmes Zeviani wrote:
Saudações,
Tem pouco tempo que importo arquivos de extensão *xls. Estou com um problema que ao importar um arquivo possuo nomes de cidades brasileiras com acentos no nomes. Ao importar, as letras acentuadas são representadas de outra forma. Quero saber como importar corretamente ou se é possível devolver os nomes certos após importação. Veja o CMR que preparei
require(gdata) # contém a função read.xls() para importar planilhas teste <- read.xls("http://www.leg.ufpr.br/~walmes/foo/teste.xls", sheet=1, method="tab") head(teste) # abaixo o print desse comando
Sigla Codigo mun a2000 1 AC 1200013 Acrel\xe2ndia 1042.38 # â trocado por \xe2 2 AC 1200054 Assis Brasil 429.22 3 AC 1200104 Brasil\xe9ia 2243.25 4 AC 1200138 Bujari 786.68 5 AC 1200179 Capixaba 603.84 6 AC 1200203 Cruzeiro do Sul 9363.32
Os demais acentos possuem o seu "\xe?" correspondente. Alguém tem uma solução? Outro pacote/função? Meu sistema é Ubuntu 10.04. Os dados são um subconjunto dos dados do ipeadata, baixados no formato.xls.
Outra coisa que percebi é que se o nome das colunas tiver acentos, a importação falha, ex "municipio" (sem acento) importa, mas com "município" (com acento) no nome da coluna não importa. Como evitar isso sem ter que sair renomeando as colunas manualmente? Planilhas de sites coleta de dados do Brasil sempre tem acentos por causa do nomo idioma. Minhas buscas no nabble não retornaram resultado.
# sheet 2 está escrito "Município" como nome da coluna teste <- read.xls("http://www.leg.ufpr.br/~walmes/foo/teste.xls", sheet=2, method="tab") Erro em make.names(col.names, unique = TRUE) : string multibyte inválida 3
Certo sua atenção, agradeço. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ========================================================================== _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br