[R-br] RES: Importação correta de palavras acentuadas com a gdata::read.xls()
Oswaldo G Cruz
oswaldo em fiocruz.br
Terça Abril 12 00:40:43 BRT 2011
Walber
Função iconv no R
iconv(x, "latin1", "UTF-8") # ou "UTF-16"
[]´s
O
De: r-br-bounces em listas.c3sl.ufpr.br
[mailto:r-br-bounces em listas.c3sl.ufpr.br] Em nome de Walmes Zeviani
Enviada em: terça-feira, 12 de abril de 2011 00:25
Para: r-br em listas.c3sl.ufpr.br
Assunto: [R-br] Importação correta de palavras acentuadas com a
gdata::read.xls()
Saudações,
Tem pouco tempo que importo arquivos de extensão *xls. Estou com um problema
que ao importar um arquivo possuo nomes de cidades brasileiras com acentos
no nomes. Ao importar, as letras acentuadas são representadas de outra
forma. Quero saber como importar corretamente ou se é possível devolver os
nomes certos após importação. Veja o CMR que preparei
require(gdata) # contém a função read.xls() para importar planilhas
teste <- read.xls("http://www.leg.ufpr.br/~walmes/foo/teste.xls", sheet=1,
method="tab")
head(teste) # abaixo o print desse comando
Sigla Codigo mun a2000
1 AC 1200013 Acrel\xe2ndia 1042.38 # â trocado por \xe2
2 AC 1200054 Assis Brasil 429.22
3 AC 1200104 Brasil\xe9ia 2243.25
4 AC 1200138 Bujari 786.68
5 AC 1200179 Capixaba 603.84
6 AC 1200203 Cruzeiro do Sul 9363.32
Os demais acentos possuem o seu "\xe?" correspondente. Alguém tem uma
solução? Outro pacote/função? Meu sistema é Ubuntu 10.04. Os dados são um
subconjunto dos dados do ipeadata, baixados no formato.xls.
Outra coisa que percebi é que se o nome das colunas tiver acentos, a
importação falha, ex "municipio" (sem acento) importa, mas com "município"
(com acento) no nome da coluna não importa. Como evitar isso sem ter que
sair renomeando as colunas manualmente? Planilhas de sites coleta de dados
do Brasil sempre tem acentos por causa do nomo idioma. Minhas buscas no
nabble não retornaram resultado.
# sheet 2 está escrito "Município" como nome da coluna
teste <- read.xls("http://www.leg.ufpr.br/~walmes/foo/teste.xls", sheet=2,
method="tab")
Erro em make.names(col.names, unique = TRUE) :
string multibyte inválida 3
Certo sua atenção, agradeço.
Walmes.
==========================================================================
Walmes Marques Zeviani
LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W)
Departamento de Estatística - Universidade Federal do Paraná
fone: (+55) 41 3361 3573
VoIP: (3361 3600) 1053 1173
e-mail: walmes em ufpr.br
twitter: @walmeszeviani
homepage: http://www.leg.ufpr.br/~walmes
linux user number: 531218
==========================================================================
--
Esta mensagem foi verificada pelo sistema de antivírus e
acredita-se estar livre de perigo.
Mais detalhes sobre a lista de discussão R-br