<div dir="ltr"><div class="gmail_default" style="font-family:trebuchet ms,sans-serif">Caro Hélio,<br><br>É do meu conhecimento que muitas pessoas adotam a aplicação de testes de hipótese aos resíduos para se assegurarem da validade dos pressupostos. Aqui vão algumas preocupações da minha parte sobre essa abordagem e recomendações gerais.<br>
<ol><li>Teste de normalidade para os resíduos. Os resíduos crus não são independentes. Sua covariância é proporcional aos elementos fora da diagonal da matriz de projeção H = X (X'X)^{-1} X'. Os testes de normalidade assumem uma amostra aleatória independente. Os resíduos crus não são. Logo, inferência a partir do teste não é segura.</li>
<li>Caso queira fazê-lo, considere os resíduos studentizados ou externamente padronizados, pois estes corrigem para os elementos da matriz H.<br></li><li>Embora esses resíduos satisfaçam os requisitos dos testes, ainda não o considero útil aplicá-los. Suponha que o teste de normalidade rejeite a hipótese nula. Qual será sua decisão? Abandonar a análise? Ou procurar identificar a causa da rejeição para tentar corrigir/amenizar? Se for procurar pela causa você certamente fará gráficos desses resíduos. Ou seja, o teste de hipótese não é informativo quando há rejeição da hipótese. A análise visual é muito mais interessante pois, no caso de afastamento dos pressupostos, você pode ter alguma indicação de como proceder: remover observação influente, aplicar transformação, ir para um modelo com suposições mais relaxadas/condizentes.<br>
</li><li>O argumento mais frequente contra a análise gráfica é a sua subjetividade. De fato, pessoas olham para os gráficos e tem impressões diferentes. Já considerar um p-valor menor ou não que 5% parece ser, para a maioria, livre de subjetividade. Mas se decidir por um p-valor retornado por um teste subjetivamente escolhido e aplicado em situações muitas vezes fora das assumidas pelo teste não é subjetivo? Não é subjetivo adotar um Shapiro-Wilk, Anderson-Darling, Kolmogorv-Smirnov ou outro? Um Levene ou Bartlett? Subjetividade por subjetividade na minha consideração.</li>
<li>O mais importante é que uma análise gráfica pode ser conduzida para uma ampla classe de modelos enquanto que testes de hipótese como esse perdem campo para modelos mais gerais ou delineamento mais complexos. Como avaliar a homogeneidade de variâncias para um experimento fatorial? Combinar os níveis dos fatores? E se for um fatorial fracionado ou ensaio com uma única repetição por cédula? Se os resíduos de deviance de um modelo Poisson, por exemplo, sé terá distribuição normal para amostras grandes, então qual a validade de o teste para uma amostra pequena? O que é uma amostra pequena/grande?<br>
</li><li>Uma coisa que eu realmente sou contra é o exagero na aplicação dos testes de hipótese. Vejamos o caso clássico da análise de experimentos. Para concluir a análise tem-se que: Testar normalidade (1), testar homogeneidade de variâncias (2), testar o efeitos dos termos do modelo (pela anova, 3) e aplicar contrastes entre médias (4). Eu não acho que a investigação estatística seja um conjunto de procedimentos como esse.</li>
<li>A análise gráfica é útil. Afastamentos realmente comprometedores são identificados via uma análise gráfica até mesmo por pessoas não treinadas. O que fazer diante dos possíveis cenários requer um pouco de treino. Simples recomendações são: Q-q norm com disposição curvada -> assimetria -> transformar? Resíduos~ajustados em forma de cone -> relação média variância -> transformar? Resíduos de desvio grande e/ou alta alavancagem -> remover? E assim vai.</li>
</ol>À disposição.<br>Walmes.</div></div>