David,

Depende de como você identifica os outliers. Coloquei um exemplo usando a distancia de Cook, mas da para generalizar com outros critérios

# gera dados e forca outlier
x <- 1:20
y <- 2*x + 5 + rnorm(20)
dados <- data.frame(x,y)
dados$y[c(7,11)] <- dados$y[c(7,11)] + 15

# modelo inicial e sem outliers
mod <- lm(y~x, dados)
outliers <- (cooks.distance(mod) > 0.2)
mod2 <- lm(y~x, subset(dados, !outliers))



Paulo Dick
Estatístico / Epidemiologia em Saúde Pública
Tel.: (55 21) 99591-2716

Em 14 de outubro de 2016 11:26, Mac David S. Pinto via R-br <r-br@listas.c3sl.ufpr.br> escreveu:
Pessoal, bom dia

Estou fazendo algumas regressões lineares entre Comprimento x Peso de peixes com um conjunto de dados bastante extenso (+- 1000 linhas).

Acontece que alguns destes valores são outliers (+- 50) e na analise, eles não são importantes.

Tem alguma função no R que eu consiga "selecionar" os outliers e pedir que não seja considerado na analise? Sem precisa mudar minha planilha original (já que vou utilizar para outras coisas futuramente)

Tem alguns valores que estão no meio dos planilhas de dados. 

Eu consegui resolver os extremos selecionado um conjunto de linhas

Exemplo:

Local.F.1<-lm(pt[4:970,7]~ls[4:970,6])

## Com este comando eu retire os outliers dos extremos (linhas 1 a 3 e linhas 971 a 1000), mais ainda tem alguns valores no meio do analise (+- entre as linhas  251 a 260)

De já, eu agradeço a ajuda

David

_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.