[R-br] Problemas com encoding Linux vs Windows

Leonard de Assis assis.leonard em gmail.com
Domingo Fevereiro 26 15:21:41 BRT 2012


O problema é onde?

1. No vetor? Resolve com o Encoding
2. No nome da variável? também resolve com o Encoding, mas com ajuda do
colnames
3. Se for geral, melhor saída é olhar o read.table, ele dá também de
mudar o encoding

Mas o Benilton está certo: o importante é saber qual codificação de seus
dados para poder consertar

referências:

?Encoding
?colnames
?read.table

[]s
Leonard de Assis
assis <dot> leonard <at> gmail <dot> com


Em 26/02/2012 13:44, Daniel C Bezerra escreveu:
> Agradeço a ajuda de ambos, mas ainda não consegui resolver. 
>
> A função Encoding permite mudar apenas um vetor de caracteres e não
> todo o data frame. 
>
> Quanto as variáveis locais o output no windows foi:
> >Sys.getlocale()
> [1] "LC_COLLATE=English_United States.1252;LC_CTYPE=English_United
> States.1252;LC_MONETARY=English_United
> States.1252;LC_NUMERIC=C;LC_TIME=English_United States.1252"
>
> e no Ubuntu:
> Sys.getlocale()
> [1]
> "LC_CTYPE=en_US.UTF-8;LC_NUMERIC=C;LC_TIME=en_US.UTF-8;LC_COLLATE=en_US.UTF-8;LC_MONETARY=en_US.UTF-8;LC_MESSAGES=en_US.UTF-8;LC_PAPER=C;LC_NAME=C;LC_ADDRESS=C;LC_TELEPHONE=C;LC_MEASUREMENT=en_US.UTF-8;LC_IDENTIFICATION=C"
>
> Entretanto, ao tentar mudar o locale no Linux tenho a seguinte
> mensagem de erro:
> Sys.setlocale(category = "LC_ALL", locale = "English_United States.1252")
> [1] ""
> Warning message:
> In Sys.setlocale(category = "LC_ALL", locale = "English_United
> States.1252") :
>   OS reports request to set locale to "English_United States.1252"
> cannot be honored
>
> Alguma sugestão?
>
> Muito obrigado,
>
> D
>
> 2012/2/26 Leonard de Assis <assis.leonard em gmail.com
> <mailto:assis.leonard em gmail.com>>
>
>     ?Encoding
>
>     []s
>     Leonard de Assis
>     assis <dot> leonard <at> gmail <dot> com
>
>
>     Em 26/02/2012 12:30, Daniel C Bezerra escreveu:
>>     Prezados amigos do R,
>>
>>     Eu uso emacs + ess muitas vezes alterno entre Windows (XP, 32
>>     Bits) e Linux (Ubuntu 64bit 11.04). Ambos os sistemas
>>     operacionais estão em inglês.
>>
>>     Recentemente eu importei uma planilha de excel pelo read.xls
>>     (pacote gdata) no windows e fiz as análises sem problemas. Ao
>>     carregar o mesmo workspace (sem importar os dados novamente) no
>>     linux, vários caracteres apareceram de modo bizarro. O problema é
>>     o mesmo seja rodando o R dentro do emacs ou diretamente no terminal.
>>
>>     Por exemplo, a palavra "não" usada em algumas variáveis aparece
>>     como "n\xe3o", embora eu consiga escrevê-la e colocá-la em
>>     títulos de gráficos, etc.
>>
>>     Alguém tem alguma sugestão de como corrigir este problema?
>>
>>     Desde já agradeço. Abs,
>>
>>     D
>>
>>
>>     _______________________________________________
>>     R-br mailing list
>>     R-br em listas.c3sl.ufpr.br <mailto:R-br em listas.c3sl.ufpr.br>
>>     https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>     Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
>
>     _______________________________________________
>     R-br mailing list
>     R-br em listas.c3sl.ufpr.br <mailto:R-br em listas.c3sl.ufpr.br>
>     https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>     Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e
>     forneça código mínimo reproduzível.
>
>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20120226/0b502387/attachment.html>


Mais detalhes sobre a lista de discussão R-br