[R-br] análise de reísduo

Cesar Rabak cesar.rabak em gmail.com
Segunda Junho 16 18:24:22 BRT 2014


Que fazendo coro às observações do Walmes, lembro que os gráficos para as
análises citadas *já* estão disponíveis a um simples:
> plot(objeto_retornado_pela_regressão_ou_anova)

tipicamente ele retorna quatro gráficos (mais usados na opinão dos
implementadores) mas se for chamada:
> plot(objeto, which=<número>) onde número pode ir de 1 a 6, temos mais
dois gráficos, em particular os que mostram a alavancagem.

Uma descrição dos testes subjacentes a esses gráficos pode ser visto na
obra de Julian J. Faraway, "Practical Regression and Anova using R", 2002.
(esse e-book pode ser baixado do site CRAN).

HTH

--
Cesar Rabak





2014-06-16 15:27 GMT-03:00 walmes . <walmeszeviani em gmail.com>:

> Caro Hélio,
>
> É do meu conhecimento que muitas pessoas adotam a aplicação de testes de
> hipótese aos resíduos para se assegurarem da validade dos pressupostos.
> Aqui vão algumas preocupações da minha parte sobre essa abordagem e
> recomendações gerais.
>
>    1. Teste de normalidade para os resíduos. Os resíduos crus não são
>    independentes. Sua covariância é proporcional aos elementos fora da
>    diagonal da matriz de projeção H = X (X'X)^{-1} X'. Os testes de
>    normalidade assumem uma amostra aleatória independente. Os resíduos crus
>    não são. Logo, inferência a partir do teste não é segura.
>    2. Caso queira fazê-lo, considere os resíduos studentizados ou
>    externamente padronizados, pois estes corrigem para os elementos da matriz
>    H.
>    3. Embora esses resíduos satisfaçam os requisitos dos testes, ainda
>    não o considero útil aplicá-los. Suponha que o teste de normalidade rejeite
>    a hipótese nula. Qual será sua decisão? Abandonar a análise? Ou procurar
>    identificar a causa da rejeição para tentar corrigir/amenizar? Se for
>    procurar pela causa você certamente fará gráficos desses resíduos. Ou seja,
>    o teste de hipótese não é informativo quando há rejeição da hipótese. A
>    análise visual é muito mais interessante pois, no caso de afastamento dos
>    pressupostos, você pode ter alguma indicação de como proceder: remover
>    observação influente, aplicar transformação, ir para um modelo com
>    suposições mais relaxadas/condizentes.
>    4. O argumento mais frequente contra a análise gráfica é a sua
>    subjetividade. De fato, pessoas olham para os gráficos e tem impressões
>    diferentes. Já considerar um p-valor menor ou não que 5% parece ser, para a
>    maioria, livre de subjetividade. Mas se decidir por um p-valor retornado
>    por um teste subjetivamente escolhido e aplicado em situações muitas vezes
>    fora das assumidas pelo teste não é subjetivo? Não é subjetivo adotar um
>    Shapiro-Wilk, Anderson-Darling, Kolmogorv-Smirnov ou outro? Um Levene ou
>    Bartlett? Subjetividade por subjetividade na minha consideração.
>    5. O mais importante é que uma análise gráfica pode ser conduzida para
>    uma ampla classe de modelos enquanto que testes de hipótese como esse
>    perdem campo  para modelos mais gerais ou delineamento mais complexos. Como
>    avaliar a homogeneidade de variâncias para um experimento fatorial?
>    Combinar os níveis dos fatores? E se for um fatorial fracionado ou ensaio
>    com uma única repetição por cédula? Se os resíduos de deviance de um modelo
>    Poisson, por exemplo, sé terá distribuição normal para amostras grandes,
>    então qual a validade de o teste para uma amostra pequena? O que é uma
>    amostra pequena/grande?
>    6. Uma coisa que eu realmente sou contra é o exagero na aplicação dos
>    testes de hipótese. Vejamos o caso clássico da análise de experimentos.
>    Para concluir a análise tem-se que: Testar normalidade (1), testar
>    homogeneidade de variâncias (2), testar o efeitos dos termos do modelo
>    (pela anova, 3) e aplicar contrastes entre médias (4). Eu não acho que a
>    investigação estatística seja um conjunto de procedimentos como esse.
>    7. A análise gráfica é útil. Afastamentos realmente comprometedores
>    são identificados via uma análise gráfica até mesmo por pessoas não
>    treinadas. O que fazer diante dos possíveis cenários requer um pouco de
>    treino. Simples recomendações são: Q-q norm com disposição curvada ->
>    assimetria -> transformar? Resíduos~ajustados em forma de cone -> relação
>    média variância -> transformar? Resíduos de desvio grande e/ou alta
>    alavancagem -> remover? E assim vai.
>
> À disposição.
> Walmes.
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20140616/449c123e/attachment.html>


Mais detalhes sobre a lista de discussão R-br