[R-br] análise de reísduo

Segunda Junho 16 15:27:28 BRT 2014

Caro Hélio,

É do meu conhecimento que muitas pessoas adotam a aplicação de testes de
hipótese aos resíduos para se assegurarem da validade dos pressupostos.
Aqui vão algumas preocupações da minha parte sobre essa abordagem e
recomendações gerais.

   1. Teste de normalidade para os resíduos. Os resíduos crus não são
   independentes. Sua covariância é proporcional aos elementos fora da
   diagonal da matriz de projeção H = X (X'X)^{-1} X'. Os testes de
   normalidade assumem uma amostra aleatória independente. Os resíduos crus
   não são. Logo, inferência a partir do teste não é segura.
   2. Caso queira fazê-lo, considere os resíduos studentizados ou
   externamente padronizados, pois estes corrigem para os elementos da matriz
   H.
   3. Embora esses resíduos satisfaçam os requisitos dos testes, ainda não
   o considero útil aplicá-los. Suponha que o teste de normalidade rejeite a
   hipótese nula. Qual será sua decisão? Abandonar a análise? Ou procurar
   identificar a causa da rejeição para tentar corrigir/amenizar? Se for
   procurar pela causa você certamente fará gráficos desses resíduos. Ou seja,
   o teste de hipótese não é informativo quando há rejeição da hipótese. A
   análise visual é muito mais interessante pois, no caso de afastamento dos
   pressupostos, você pode ter alguma indicação de como proceder: remover
   observação influente, aplicar transformação, ir para um modelo com
   suposições mais relaxadas/condizentes.
   4. O argumento mais frequente contra a análise gráfica é a sua
   subjetividade. De fato, pessoas olham para os gráficos e tem impressões
   diferentes. Já considerar um p-valor menor ou não que 5% parece ser, para a
   maioria, livre de subjetividade. Mas se decidir por um p-valor retornado
   por um teste subjetivamente escolhido e aplicado em situações muitas vezes
   fora das assumidas pelo teste não é subjetivo? Não é subjetivo adotar um
   Shapiro-Wilk, Anderson-Darling, Kolmogorv-Smirnov ou outro? Um Levene ou
   Bartlett? Subjetividade por subjetividade na minha consideração.
   5. O mais importante é que uma análise gráfica pode ser conduzida para
   uma ampla classe de modelos enquanto que testes de hipótese como esse
   perdem campo  para modelos mais gerais ou delineamento mais complexos. Como
   avaliar a homogeneidade de variâncias para um experimento fatorial?
   Combinar os níveis dos fatores? E se for um fatorial fracionado ou ensaio
   com uma única repetição por cédula? Se os resíduos de deviance de um modelo
   Poisson, por exemplo, sé terá distribuição normal para amostras grandes,
   então qual a validade de o teste para uma amostra pequena? O que é uma
   amostra pequena/grande?
   6. Uma coisa que eu realmente sou contra é o exagero na aplicação dos
   testes de hipótese. Vejamos o caso clássico da análise de experimentos.
   Para concluir a análise tem-se que: Testar normalidade (1), testar
   homogeneidade de variâncias (2), testar o efeitos dos termos do modelo
   (pela anova, 3) e aplicar contrastes entre médias (4). Eu não acho que a
   investigação estatística seja um conjunto de procedimentos como esse.
   7. A análise gráfica é útil. Afastamentos realmente comprometedores são
   identificados via uma análise gráfica até mesmo por pessoas não treinadas.
   O que fazer diante dos possíveis cenários requer um pouco de treino.
   Simples recomendações são: Q-q norm com disposição curvada -> assimetria ->
   transformar? Resíduos~ajustados em forma de cone -> relação média variância
   -> transformar? Resíduos de desvio grande e/ou alta alavancagem -> remover?
   E assim vai.

À disposição.
Walmes.
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20140616/14d43bc5/attachment.html>