[R-br] Diferença no resultado da função sort() entre windows e linux
salah
salah3.1416 em gmail.com
Sexta Fevereiro 19 14:04:24 BRST 2016
olá Luciano
segue sugestão:
## linux
"AB CD" > "ABCD"
sort(c("AB CD","ABCD"))
order(c("AB CD","ABCD"))
old = Sys.getlocale("LC_COLLATE")
Sys.setlocale("LC_COLLATE", "C")
"AB CD" > "ABCD"
sort(c("AB CD","ABCD"))
order(c("AB CD","ABCD"))
Sys.setlocale("LC_COLLATE", old)
aqui há uma boa discussão sobre o assunto:
http://r.789695.n4.nabble.com/difference-in-sort-order-linux-Windows-R-2-11-0-td2234251.html
aqui um pouco sobre unicode:
https://pt.wikipedia.org/wiki/Unicode
saudações
Em 19/02/2016 13:19, Luciano F. Sgarbi escreveu:
> Boa tarde pessoal.
>
> Tentei ordenar um mesmo vetor no R usando Linux ou Windows e os
> resultados foram diferentes.
>
> #linux
> > sort(c('AB CD','ABCD'))
> [1] "ABCD" "AB CD"
>
> #windows
> > sort(c('AB CD','ABCD'))
> [1] "AB CD" "ABCD"
>
> Pelo que eu consegui entender, o problema está relacionado ao "LOCALE"
> usado por cada uma dos sistemas... estou certo?
> Alguém saberia dizer qual o motivo disso, e como posso fazer com que
> os dois sistemas gerem os mesmos resultados?
> De preferência quero tornar o resultado do Linux igual ao do Windows.
> Ou seja, quero alterar as configurações do R no Linux
>
> Abraços,
> Luciano
>
>
> ps:
> Informações das seções:
> ##UBUNTU
> > sessionInfo()
> R version 3.2.2 (2015-08-14)
> Platform: i686-pc-linux-gnu (32-bit)
> Running under: Ubuntu precise (12.04.5 LTS)
>
> locale:
> [1] LC_CTYPE=pt_BR.UTF-8 LC_NUMERIC=C
> LC_TIME=pt_BR.UTF-8 LC_COLLATE=pt_BR.UTF-8
> [5] LC_MONETARY=pt_BR.UTF-8 LC_MESSAGES=pt_BR.UTF-8
> LC_PAPER=pt_BR.UTF-8 LC_NAME=C
> [9] LC_ADDRESS=C LC_TELEPHONE=C
> LC_MEASUREMENT=pt_BR.UTF-8 LC_IDENTIFICATION=C
>
> attached base packages:
> [1] stats graphics grDevices utils datasets methods base
>
> loaded via a namespace (and not attached):
> [1] tools_3.2.2
>
> > sort(c('AB CD','ABCD'))
> [1] "ABCD" "AB CD"
>
>
> ###WINDOWS
> > sessionInfo()
> R version 3.2.1 (2015-06-18)
> Platform: x86_64-w64-mingw32/x64 (64-bit)
> Running under: Windows 7 x64 (build 7601) Service Pack 1
>
> locale:
> [1] LC_COLLATE=Portuguese_Brazil.1252 LC_CTYPE=Portuguese_Brazil.1252
> LC_MONETARY=Portuguese_Brazil.1252
> [4] LC_NUMERIC=C LC_TIME=Portuguese_Brazil.1252
>
> attached base packages:
> [1] stats graphics grDevices utils datasets methods base
>
> loaded via a namespace (and not attached):
> [1] tools_3.2.1
>
> > sort(c('AB CD','ABCD'))
> [1] "AB CD" "ABCD"
>
> --
> Luciano F. Sgarbi
> Currículo Lattes
> <http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4299200T7>
> Laboratório de Ecologia Teórica e Síntese
> Departamento de Ecologia, Instituto de Ciências Biológicas V.
> Universidade Federal de Goiás, campus II, Goiânia-GO, Brasil
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo m�nimo reproduz�vel.
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20160219/cf307320/attachment.html>
Mais detalhes sobre a lista de discussão R-br