<div dir="ltr">Esses diagnósticos "sintéticos" sobre um objeto matemático são <i>avisos</i> para o pesquisador, mas não substituem a compreensão do assunto no domínio do problema.<div><br></div><div>Usando o MIto da Caverna como ideia, sua regressão seria a <i>sombra</i> e o problema real não totalmente visível para você.</div><div><br></div><div>A distância de Cook, e outras medidas das assim denominadas "de influência" avisam que o procedimento matemático tem aspectos que justificam uma revisão que pode ser desde um descarte do ponto (se ao reanalisar a forma como foi obtido pode ser um ponto contaminado e tachável de "aberrante" (<i>outlier</i>) a rever a estratégia toda da análise (matemática) e buscar outra regressão que ajuste melhor aos dados (com uma possível, e talvez necessária, reinterpretação do fenômeno subjacente à modelagem).</div><div><br></div><div>A primeira abordagem pode advir de crítica direta da medida versus a razoabilidade dela (sardinha de dez quilos[?]), enquanto a segunda, mais sutil pode indicar uma necessidade de aprimorar uma teoria, como J. Kepler fez ao reconhecer com os dados que possuía que a órbita de Marte devia ser elíptica e não circular, como ele acreditava.</div><div><br></div><div>Voltando ao âmago da sua questão: um dos diagnósticos que se obtém no R é um cálculo dos pontos de influência, onde a regressão é refeita sem cada um dos pontos marcados. Veja esses resultados e decida se em adição ao raciocínio acima se os resultados, que obviamente mudam numericamente, significam interpretar diferente o experimento (afinal a ração dada a estes peixes engordam-os ou os emagrecem?).</div><div><br></div><div>HTH</div><div>--</div><div>Cesar Rabak</div><div><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Fri, Aug 7, 2020 at 1:32 AM Fernando Souza por (R-br) <<a href="mailto:r-br@listas.c3sl.ufpr.br">r-br@listas.c3sl.ufpr.br</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div>Prezados colegas,</div><br><div>Gostaria de saber como vocês definem o ponto de corte para a distância de Cook? Na literatura e listas de discussão tenho vistos várias sugestões, como valores de cook > 1 , valores maiores que 4/n , valor de cook maior que 3x a média, entre outros.</div><br><div>Como eu devo proceder para definir o melhor ponto de corte. Eu estou analisando uma variável onde do total de 35 observações , 6 observações etão acima de 0.10 e dessas duas, as mais distantes estão entre 0.25 e 0.30.</div><br><div>Eu deveria considerar as 6 observações como pontos de influencia? </div><br><div>Se eu utilizar a regra de 4/35 = 0.11 então às 6 observações seriam removidas;</div><div>Se eu considerar D>1, então nenhuma observação será removida</div><br><div>Gostaria de saber sobre a experiencia de vocês e como procedem</div><br><div>ATt</div><br>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" rel="noreferrer" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" rel="noreferrer" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br>
</blockquote></div>