Esses diagnósticos "sintéticos" sobre um objeto matemático são
avisos para o pesquisador, mas não substituem a compreensão do assunto no domínio do problema.
Usando o MIto da Caverna como ideia, sua regressão seria a sombra e o problema real não totalmente visível para você.
A distância de Cook, e outras medidas das assim denominadas "de influência" avisam que o procedimento matemático tem aspectos que justificam uma revisão que pode ser desde um descarte do ponto (se ao reanalisar a forma como foi obtido pode ser um ponto contaminado e tachável de "aberrante" (outlier) a rever a estratégia toda da análise (matemática) e buscar outra regressão que ajuste melhor aos dados (com uma possível, e talvez necessária, reinterpretação do fenômeno subjacente à modelagem).
A primeira abordagem pode advir de crítica direta da medida versus a razoabilidade dela (sardinha de dez quilos[?]), enquanto a segunda, mais sutil pode indicar uma necessidade de aprimorar uma teoria, como J. Kepler fez ao reconhecer com os dados que possuía que a órbita de Marte devia ser elíptica e não circular, como ele acreditava.
Voltando ao âmago da sua questão: um dos diagnósticos que se obtém no R é um cálculo dos pontos de influência, onde a regressão é refeita sem cada um dos pontos marcados. Veja esses resultados e decida se em adição ao raciocínio acima se os resultados, que obviamente mudam numericamente, significam interpretar diferente o experimento (afinal a ração dada a estes peixes engordam-os ou os emagrecem?).
HTH
--
Cesar Rabak
Prezados colegas,
Gostaria de saber como vocês definem o ponto de corte para a distância de Cook? Na literatura e listas de discussão tenho vistos várias sugestões, como valores de cook > 1 , valores maiores que 4/n , valor de cook maior que 3x a média, entre outros.
Como eu devo proceder para definir o melhor ponto de corte. Eu estou analisando uma variável onde do total de 35 observações , 6 observações etão acima de 0.10 e dessas duas, as mais distantes estão entre 0.25 e 0.30.
Eu deveria considerar as 6 observações como pontos de influencia?
Se eu utilizar a regra de 4/35 = 0.11 então às 6 observações seriam removidas;
Se eu considerar D>1, então nenhuma observação será removida
Gostaria de saber sobre a experiencia de vocês e como procedem
ATt
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.