[R-br] Regressão linear - Excluindo outliers

Paulo Dick paulopcdick em gmail.com
Sexta Outubro 14 14:31:03 BRT 2016


David,

Depende de como você identifica os outliers. Coloquei um exemplo usando a
distancia de Cook, mas da para generalizar com outros critérios

# gera dados e forca outlier
x <- 1:20
y <- 2*x + 5 + rnorm(20)
dados <- data.frame(x,y)
dados$y[c(7,11)] <- dados$y[c(7,11)] + 15

# modelo inicial e sem outliers
mod <- lm(y~x, dados)
outliers <- (cooks.distance(mod) > 0.2)
mod2 <- lm(y~x, subset(dados, !outliers))



*Paulo Dick*
Estatístico / Epidemiologia em Saúde Pública
Tel.: (55 21) 99591-2716

Em 14 de outubro de 2016 11:26, Mac David S. Pinto via R-br <
r-br em listas.c3sl.ufpr.br> escreveu:

> Pessoal, bom dia
>
> Estou fazendo algumas regressões lineares entre Comprimento x Peso de
> peixes com um conjunto de dados bastante extenso (+- 1000 linhas).
>
> Acontece que alguns destes valores são outliers (+- 50) e na analise, eles
> não são importantes.
>
> Tem alguma função no R que eu consiga "selecionar" os outliers e pedir que
> não seja considerado na analise? Sem precisa mudar minha planilha original
> (já que vou utilizar para outras coisas futuramente)
>
> Tem alguns valores que estão no meio dos planilhas de dados.
>
> Eu consegui resolver os extremos selecionado um conjunto de linhas
>
> Exemplo:
>
> Local.F.1<-lm(pt[4:970,7]~ls[4:970,6])
>
> ## Com este comando eu retire os outliers dos extremos (linhas 1 a 3 e
> linhas 971 a 1000), mais ainda tem alguns valores no meio do analise (+-
> entre as linhas  251 a 260)
>
> De já, eu agradeço a ajuda
>
> David
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20161014/28cd5cad/attachment.html>


Mais detalhes sobre a lista de discussão R-br