[R-br] Eliminar outliers de uma planilha.

Walmes Zeviani walmeszeviani em gmail.com
Terça Agosto 7 11:02:28 BRT 2012


Ivan,

Ao contrario do que eu também pensava, a boxplot() não usa a quantile()
para encontrar os quantis, ela usa a fivenum(). Para grandes amostras não
dá diferença mas para amostras pequenas dá. Você usou 2.5 mas o boxplot()
usa 1.5. Eu fiz uma função também, veja

set.seed(12345)
y <- rbeta(100, 1, 5)
boxplot(y)
abline(h=fivenum(y))
x <- gl(4, 25)
bp <- boxplot(y~x)
bp
bp$out
bp$group

f <- function(x){
  qrtl <- fivenum(x)[c(2,4)]
  iqr <- diff(qrtl)
  limt <- qrtl+c(-1,1)*1.5*iqr
  findInterval(x, limt)-1
}

f(y)

tapply(y, x, f)

À disposição.
Walmes.

==========================================================================
Walmes Marques Zeviani
LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W)
Departamento de Estatística - Universidade Federal do Paraná
fone: (+55) 41 3361 3573
VoIP: (3361 3600) 1053 1173
e-mail: walmes em ufpr.br
twitter: @walmeszeviani
homepage: http://www.leg.ufpr.br/~walmes
linux user number: 531218
==========================================================================
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20120807/8fb65fda/attachment.html>


Mais detalhes sobre a lista de discussão R-br