
David, Depende de como você identifica os outliers. Coloquei um exemplo usando a distancia de Cook, mas da para generalizar com outros critérios # gera dados e forca outlier x <- 1:20 y <- 2*x + 5 + rnorm(20) dados <- data.frame(x,y) dados$y[c(7,11)] <- dados$y[c(7,11)] + 15 # modelo inicial e sem outliers mod <- lm(y~x, dados) outliers <- (cooks.distance(mod) > 0.2) mod2 <- lm(y~x, subset(dados, !outliers)) *Paulo Dick* Estatístico / Epidemiologia em Saúde Pública Tel.: (55 21) 99591-2716 Em 14 de outubro de 2016 11:26, Mac David S. Pinto via R-br < r-br@listas.c3sl.ufpr.br> escreveu:
Pessoal, bom dia
Estou fazendo algumas regressões lineares entre Comprimento x Peso de peixes com um conjunto de dados bastante extenso (+- 1000 linhas).
Acontece que alguns destes valores são outliers (+- 50) e na analise, eles não são importantes.
Tem alguma função no R que eu consiga "selecionar" os outliers e pedir que não seja considerado na analise? Sem precisa mudar minha planilha original (já que vou utilizar para outras coisas futuramente)
Tem alguns valores que estão no meio dos planilhas de dados.
Eu consegui resolver os extremos selecionado um conjunto de linhas
Exemplo:
Local.F.1<-lm(pt[4:970,7]~ls[4:970,6])
## Com este comando eu retire os outliers dos extremos (linhas 1 a 3 e linhas 971 a 1000), mais ainda tem alguns valores no meio do analise (+- entre as linhas 251 a 260)
De já, eu agradeço a ajuda
David
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.