[R-br] análise de reísduo
walmes .
walmeszeviani em gmail.com
Segunda Junho 16 15:27:28 BRT 2014
Caro Hélio,
É do meu conhecimento que muitas pessoas adotam a aplicação de testes de
hipótese aos resíduos para se assegurarem da validade dos pressupostos.
Aqui vão algumas preocupações da minha parte sobre essa abordagem e
recomendações gerais.
1. Teste de normalidade para os resíduos. Os resíduos crus não são
independentes. Sua covariância é proporcional aos elementos fora da
diagonal da matriz de projeção H = X (X'X)^{-1} X'. Os testes de
normalidade assumem uma amostra aleatória independente. Os resíduos crus
não são. Logo, inferência a partir do teste não é segura.
2. Caso queira fazê-lo, considere os resíduos studentizados ou
externamente padronizados, pois estes corrigem para os elementos da matriz
H.
3. Embora esses resíduos satisfaçam os requisitos dos testes, ainda não
o considero útil aplicá-los. Suponha que o teste de normalidade rejeite a
hipótese nula. Qual será sua decisão? Abandonar a análise? Ou procurar
identificar a causa da rejeição para tentar corrigir/amenizar? Se for
procurar pela causa você certamente fará gráficos desses resíduos. Ou seja,
o teste de hipótese não é informativo quando há rejeição da hipótese. A
análise visual é muito mais interessante pois, no caso de afastamento dos
pressupostos, você pode ter alguma indicação de como proceder: remover
observação influente, aplicar transformação, ir para um modelo com
suposições mais relaxadas/condizentes.
4. O argumento mais frequente contra a análise gráfica é a sua
subjetividade. De fato, pessoas olham para os gráficos e tem impressões
diferentes. Já considerar um p-valor menor ou não que 5% parece ser, para a
maioria, livre de subjetividade. Mas se decidir por um p-valor retornado
por um teste subjetivamente escolhido e aplicado em situações muitas vezes
fora das assumidas pelo teste não é subjetivo? Não é subjetivo adotar um
Shapiro-Wilk, Anderson-Darling, Kolmogorv-Smirnov ou outro? Um Levene ou
Bartlett? Subjetividade por subjetividade na minha consideração.
5. O mais importante é que uma análise gráfica pode ser conduzida para
uma ampla classe de modelos enquanto que testes de hipótese como esse
perdem campo para modelos mais gerais ou delineamento mais complexos. Como
avaliar a homogeneidade de variâncias para um experimento fatorial?
Combinar os níveis dos fatores? E se for um fatorial fracionado ou ensaio
com uma única repetição por cédula? Se os resíduos de deviance de um modelo
Poisson, por exemplo, sé terá distribuição normal para amostras grandes,
então qual a validade de o teste para uma amostra pequena? O que é uma
amostra pequena/grande?
6. Uma coisa que eu realmente sou contra é o exagero na aplicação dos
testes de hipótese. Vejamos o caso clássico da análise de experimentos.
Para concluir a análise tem-se que: Testar normalidade (1), testar
homogeneidade de variâncias (2), testar o efeitos dos termos do modelo
(pela anova, 3) e aplicar contrastes entre médias (4). Eu não acho que a
investigação estatística seja um conjunto de procedimentos como esse.
7. A análise gráfica é útil. Afastamentos realmente comprometedores são
identificados via uma análise gráfica até mesmo por pessoas não treinadas.
O que fazer diante dos possíveis cenários requer um pouco de treino.
Simples recomendações são: Q-q norm com disposição curvada -> assimetria ->
transformar? Resíduos~ajustados em forma de cone -> relação média variância
-> transformar? Resíduos de desvio grande e/ou alta alavancagem -> remover?
E assim vai.
À disposição.
Walmes.
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20140616/14d43bc5/attachment.html>
Mais detalhes sobre a lista de discussão R-br