[R-br] Eliminar outliers de uma planilha.

Paulo Justiniano paulojus em leg.ufpr.br
Terça Agosto 7 14:10:17 BRT 2012


Os algoritmos (padrao) de quantile() e fivenum() são diferentes paera 
calculos de quantis.
salvo engano
A 1a supoe correcoes com interpolacoes lineares entre os valores, em 
quanto que a 2a trabalha mesmo com os dados apenas


On Tue, 7 Aug 2012, Ivan Bezerra Allaman wrote:

> Oi Walmes!
> 
> Exatamente! Já haviam me alertando aqui no grupo quanto a isso. O boxplot por default usa 1.5, mais eu sempre altero para 2.5, e
> esqueci de alterar no código que enviei. O valor de 2.5 foi um concenso que cheguei junto com o Faria, achamos mais flexível. 
> 
> (S,f,P)
> Allaman
> 
>  
> 
> 
>
>                                                            \begin{signature}
>
>                                                                  <<>>=
>
>                                                     Prof. Dr. Ivan Bezerra Allaman
>
>                                                   Universidade Estadual de Santa Cruz
>
>                                            Departamento de Ciências Exatas e Tecnológicas
>
>                                                           Ilhéus/BA - Brasil
>
>                                                         Fone: +55 73 3680-5596
>
>                                          E-mail: ivanalaman em yahoo.com.br/ivanalaman em gmail.com
>
>                                                                    @
>
>                                                             \end{signature}
> 
> 
> _______________________________________________________________________________________________________________________________________
> De: Walmes Zeviani <walmeszeviani em gmail.com>
> Para: r-br em listas.c3sl.ufpr.br; Ivan Bezerra Allaman <ivanalaman em yahoo.com.br>
> Enviadas: Terça-feira, 7 de Agosto de 2012 11:02
> Assunto: Re: [R-br] Eliminar outliers de uma planilha.
> 
> Ivan,
> 
> Ao contrario do que eu também pensava, a boxplot() não usa a quantile() para encontrar os quantis, ela usa a fivenum(). Para grandes
> amostras não dá diferença mas para amostras pequenas dá. Você usou 2.5 mas o boxplot() usa 1.5. Eu fiz uma função também, veja
> 
> set.seed(12345)
> y <- rbeta(100, 1, 5)
> boxplot(y)
> abline(h=fivenum(y))
> x <- gl(4, 25)
> bp <- boxplot(y~x)
> bp
> bp$out
> bp$group
> 
> f <- function(x){
>   qrtl <- fivenum(x)[c(2,4)]
>   iqr <- diff(qrtl)
>   limt <- qrtl+c(-1,1)*1.5*iqr
>   findInterval(x, limt)-1
> }
> 
> f(y)
> 
> tapply(y, x, f)
> 
> À disposição.
> Walmes.
> 
> ==========================================================================
> Walmes Marques Zeviani
> LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W)
> Departamento de Estatística - Universidade Federal do Paraná
> fone: (+55) 41 3361 3573
> VoIP: (3361 3600) 1053 1173
> e-mail: walmes em ufpr.br
> twitter: @walmeszeviani
> homepage: http://www.leg.ufpr.br/~walmes
> linux user number: 531218
> ==========================================================================
> 
> 
> 
>


Mais detalhes sobre a lista de discussão R-br