Na minha parca experiência, isso acontece em duas situações:
Uma delas é quando você está inadvertidamente misturando duas populações diferentes. Se você separar pela variável certa (se é que ela foi coletada), vai individualizar duas ou mais nuvens de dados, e aí certas relações podem desaparecer. Digamos, uma espécie tem pétalas mais largas e mais longas do que outra, mas quando você controla pela espécie, uma coisa pode não estar correlacionada à outra.
Outra situação é quando, deliberadamente, a amostragem incluiu apenas certos intervalos de uma as variáveis. Por exemplo, apenas flores de com pétalas mais estreitas do que 0,5cm e mais largas do que 1,0cm tiveram o comprimento de suas pétalas medido. Aí é bem provável que, após ajustar para as variáveis de confundimento adequadas, a correlação vá persistir.
Espero não ter atrapalhado :)
Leonardo Ferreira Fontenelle
Em Seg 30 jun. 2014, às 09:40, Helder Gramacho escreveu:
Bom dia pessoal,
Estava realizando um tutorial que utilizava o dataset: Iris.
Após a análise de regressão o gráfico dos resíduos x valores ajustados mostrava que os pontos estavam dois grupos separados, como na figura abaixo:
Gostaria de saber quando este gráfico apresenta este padrão, quais seriam as causas e quais as possíveis soluções.
Segue o cmr:
### <code r>
data(iris)
attach(iris)
iris.lm<-lm(Petal.Width ~ Petal.Length, data=iris)
iris.lm
summary(iris.lm)
confint(iris.lm)
par(mfrow=c(2,2),xpd=F)
plot(iris.lm)
### </code>
Desde já agradeço as contribuições,
_______________________________________________
R-br mailing list
Email had 1 attachment:
image.png
- 22k (image/png)