
Em 2/6/2011 10:31, Walmes Zeviani escreveu:
Cesar,
As coisas estão meio confusas (pelo menos para mim). Uma coisa é distribuição marginal dos dados f(Y), outra coisa é a distribuição condicional dos dados como função das regressoras f(Y|x).
Correto.
Quando assumimos normalidade, estamos nos referindo a f(Y|x), e pelo fato do erro (E) ser aditivo nesses modelos, então f(E) é normal. A f(Y) não vem ao caso.
Sim, E tem que ser N(0,e) para que se possa fazer a regressão linear.
Usando o seu exemplo, é necessário que f(consumo|velocidade) tenha distribuição normal,mas sobre a f(consumo) não há nenhuma suposição.
Sim.
Muitas pessoas pensam que a normalidade deve ser nos dados, e elas aplicam testes de normalidade aos dados (Y), mas a normalidade deve estar presente em Y|x.
Não poderia estar mais correto e sucintamente explicado. O raio é você ver gente aplicar testes de normalidade em Y... O único jeito de sair dessa enrascada (especialmente agora que fazer isso é 'dois palitos', como dizem meus filhos, num SW como R, é fazer a regressão e ver o diagnóstico nos resíduos. []s -- Cesar Rabak GNU/Linux User 52247. Get counted: http://counter.li.org/