[R-br] Diferença no resultado da função sort() entre windows e linux

salah salah3.1416 em gmail.com
Sexta Fevereiro 19 14:04:24 BRST 2016


olá Luciano

segue sugestão:

## linux
"AB CD" > "ABCD"
sort(c("AB CD","ABCD"))
order(c("AB CD","ABCD"))

old = Sys.getlocale("LC_COLLATE")
Sys.setlocale("LC_COLLATE", "C")

"AB CD" > "ABCD"
sort(c("AB CD","ABCD"))
order(c("AB CD","ABCD"))

Sys.setlocale("LC_COLLATE", old)

aqui há uma boa discussão sobre o assunto:
http://r.789695.n4.nabble.com/difference-in-sort-order-linux-Windows-R-2-11-0-td2234251.html

aqui um pouco sobre unicode:
https://pt.wikipedia.org/wiki/Unicode

saudações

Em 19/02/2016 13:19, Luciano F. Sgarbi escreveu:
> Boa tarde pessoal.
>
> Tentei ordenar um mesmo vetor no R usando Linux ou Windows e os 
> resultados foram diferentes.
>
> #linux
> > sort(c('AB CD','ABCD'))
> [1] "ABCD"  "AB CD"
>
> #windows
> > sort(c('AB CD','ABCD'))
> [1] "AB CD" "ABCD"
>
> Pelo que eu consegui entender, o problema está relacionado ao "LOCALE" 
> usado por cada uma dos sistemas... estou certo?
> Alguém saberia dizer qual o motivo disso, e como posso fazer com que 
> os dois sistemas gerem os mesmos resultados?
> De preferência quero tornar o resultado do Linux igual ao do Windows. 
> Ou seja, quero alterar as configurações do R no Linux
>
> Abraços,
> Luciano
>
>
> ps:
> Informações das seções:
> ##UBUNTU
> > sessionInfo()
> R version 3.2.2 (2015-08-14)
> Platform: i686-pc-linux-gnu (32-bit)
> Running under: Ubuntu precise (12.04.5 LTS)
>
> locale:
>  [1] LC_CTYPE=pt_BR.UTF-8       LC_NUMERIC=C             
> LC_TIME=pt_BR.UTF-8  LC_COLLATE=pt_BR.UTF-8
>  [5] LC_MONETARY=pt_BR.UTF-8  LC_MESSAGES=pt_BR.UTF-8   
>  LC_PAPER=pt_BR.UTF-8 LC_NAME=C
>  [9] LC_ADDRESS=C               LC_TELEPHONE=C             
> LC_MEASUREMENT=pt_BR.UTF-8 LC_IDENTIFICATION=C
>
> attached base packages:
> [1] stats     graphics  grDevices utils datasets  methods   base
>
> loaded via a namespace (and not attached):
> [1] tools_3.2.2
>
> > sort(c('AB CD','ABCD'))
> [1] "ABCD"  "AB CD"
>
>
> ###WINDOWS
> > sessionInfo()
> R version 3.2.1 (2015-06-18)
> Platform: x86_64-w64-mingw32/x64 (64-bit)
> Running under: Windows 7 x64 (build 7601) Service Pack 1
>
> locale:
> [1] LC_COLLATE=Portuguese_Brazil.1252  LC_CTYPE=Portuguese_Brazil.1252 
>  LC_MONETARY=Portuguese_Brazil.1252
> [4] LC_NUMERIC=C LC_TIME=Portuguese_Brazil.1252
>
> attached base packages:
> [1] stats     graphics  grDevices utils datasets  methods   base
>
> loaded via a namespace (and not attached):
> [1] tools_3.2.1
>
> > sort(c('AB CD','ABCD'))
> [1] "AB CD" "ABCD"
>
> -- 
> Luciano F. Sgarbi
> Currículo Lattes 
> <http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4299200T7>
> Laboratório de Ecologia Teórica e Síntese
> Departamento de Ecologia, Instituto de Ciências Biológicas V.
> Universidade Federal de Goiás, campus II, Goiânia-GO, Brasil
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo m�nimo reproduz�vel.

-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20160219/cf307320/attachment.html>


Mais detalhes sobre a lista de discussão R-br