<div dir="ltr">David,<div><br></div><div>Depende de como você identifica os outliers. Coloquei um exemplo usando a distancia de Cook, mas da para generalizar com outros critérios<br></div><div><br></div><div><div># gera dados e forca outlier</div><div>x <- 1:20</div><div>y <- 2*x + 5 + rnorm(20)</div><div>dados <- data.frame(x,y)</div><div>dados$y[c(7,11)] <- dados$y[c(7,11)] + 15</div><div><br></div><div># modelo inicial e sem outliers</div><div>mod <- lm(y~x, dados)</div><div>outliers <- (cooks.distance(mod) > 0.2)</div><div>mod2 <- lm(y~x, subset(dados, !outliers))</div></div><div><br></div></div><div class="gmail_extra"><br clear="all"><div><div class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><b><br></b></div><div dir="ltr"><b>Paulo Dick</b><div>Estatístico / <span style="font-size:12.8px">Epidemiologia em Saúde Pública</span></div><div>Tel.: (55 21) 99591-2716</div></div></div></div></div></div></div></div></div>
<br><div class="gmail_quote">Em 14 de outubro de 2016 11:26, Mac David S. Pinto via R-br <span dir="ltr"><<a href="mailto:r-br@listas.c3sl.ufpr.br" target="_blank">r-br@listas.c3sl.ufpr.br</a>></span> escreveu:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div><div style="color:#000;background-color:#fff;font-family:HelveticaNeue,Helvetica Neue,Helvetica,Arial,Lucida Grande,sans-serif;font-size:16px"><div id="m_1584091386566493218yui_3_16_0_ym19_1_1476451540720_34329">Pessoal, bom dia</div><div id="m_1584091386566493218yui_3_16_0_ym19_1_1476451540720_34329"><br></div><div id="m_1584091386566493218yui_3_16_0_ym19_1_1476451540720_34329">Estou fazendo algumas regressões lineares entre Comprimento x Peso de peixes com um conjunto de dados bastante extenso (+- 1000 linhas).</div><div id="m_1584091386566493218yui_3_16_0_ym19_1_1476451540720_34329"><br></div><div id="m_1584091386566493218yui_3_16_0_ym19_1_1476451540720_34329">Acontece que alguns destes valores são outliers (+- 50) e na analise, eles não são importantes.</div><div id="m_1584091386566493218yui_3_16_0_ym19_1_1476451540720_34329"><br></div><div id="m_1584091386566493218yui_3_16_0_ym19_1_1476451540720_34329">Tem alguma função no R que eu consiga "selecionar" os outliers e pedir que não seja considerado na analise? Sem precisa mudar minha planilha original (já que vou utilizar para outras coisas futuramente)</div><div id="m_1584091386566493218yui_3_16_0_ym19_1_1476451540720_34329"><br></div><div id="m_1584091386566493218yui_3_16_0_ym19_1_1476451540720_34329">Tem alguns valores que estão no meio dos planilhas de dados. </div><div id="m_1584091386566493218yui_3_16_0_ym19_1_1476451540720_34329"><br></div><div id="m_1584091386566493218yui_3_16_0_ym19_1_1476451540720_34329">Eu consegui resolver os extremos selecionado um conjunto de linhas</div><div id="m_1584091386566493218yui_3_16_0_ym19_1_1476451540720_34329"><br></div><div id="m_1584091386566493218yui_3_16_0_ym19_1_1476451540720_34329">Exemplo:</div><div id="m_1584091386566493218yui_3_16_0_ym19_1_1476451540720_34329"><br></div><div id="m_1584091386566493218yui_3_16_0_ym19_1_1476451540720_34329" dir="ltr">Local.F.1<-lm(pt[4:970,7]~ls[<wbr>4:970,6])</div><div id="m_1584091386566493218yui_3_16_0_ym19_1_1476451540720_34329" dir="ltr"><br></div><div id="m_1584091386566493218yui_3_16_0_ym19_1_1476451540720_34329" dir="ltr">## Com este comando eu retire os outliers dos extremos (linhas 1 a 3 e linhas 971 a 1000), mais ainda tem alguns valores no meio do analise (+- entre as linhas  251 a 260)</div><div id="m_1584091386566493218yui_3_16_0_ym19_1_1476451540720_34329" dir="ltr"><br></div><div id="m_1584091386566493218yui_3_16_0_ym19_1_1476451540720_34329" dir="ltr">De já, eu agradeço a ajuda</div><span class="HOEnZb"><font color="#888888"><div id="m_1584091386566493218yui_3_16_0_ym19_1_1476451540720_34329" dir="ltr"><br></div><div id="m_1584091386566493218yui_3_16_0_ym19_1_1476451540720_34329" dir="ltr">David</div></font></span></div></div><br>______________________________<wbr>_________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" rel="noreferrer" target="_blank">https://listas.inf.ufpr.br/<wbr>cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" rel="noreferrer" target="_blank">http://www.leg.ufpr.br/r-br-<wbr>guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br></div>