Na minha parca experiência, isso acontece em duas situações:

Uma delas é quando você está inadvertidamente misturando duas populações diferentes. Se você separar pela variável certa (se é que ela foi coletada), vai individualizar duas ou mais nuvens de dados, e aí certas relações podem desaparecer. Digamos, uma espécie tem pétalas mais largas e mais longas do que outra, mas quando você controla pela espécie, uma coisa pode não estar correlacionada à outra.

Outra situação é quando, deliberadamente, a amostragem incluiu apenas certos intervalos de uma as variáveis. Por exemplo, apenas flores de com pétalas mais estreitas do que 0,5cm e mais largas do que 1,0cm tiveram o comprimento de suas pétalas medido. Aí é bem provável que, após ajustar para as variáveis de confundimento adequadas, a correlação vá persistir.

Espero não ter atrapalhado :)

Leonardo Ferreira Fontenelle

http://lattes.cnpq.br/9234772336296638

Em Seg 30 jun. 2014, às 09:40, Helder Gramacho escreveu:

Bom dia pessoal,

Estava realizando um tutorial que utilizava o dataset: Iris.

Após a análise de regressão o gráfico dos resíduos x valores ajustados mostrava que os pontos estavam dois grupos separados, como na figura abaixo:

Gostaria de saber quando este gráfico apresenta este padrão, quais seriam as causas e quais as possíveis soluções.

Segue o cmr:

### <code r>

data(iris)

attach(iris)

iris.lm<-lm(Petal.Width ~ Petal.Length, data=iris)

iris.lm

summary(iris.lm)

confint(iris.lm)

par(mfrow=c(2,2),xpd=F)

plot(iris.lm)

### </code>

Desde já agradeço as contribuições,

Hélder Gramacho

Recife-PE / agrohelder@gmail.com

_______________________________________________

R-br mailing list

R-br@listas.c3sl.ufpr.br

https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br

Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Email had 1 attachment:
image.png
22k (image/png)