[R-br] análise de reísduo
Cesar Rabak
cesar.rabak em gmail.com
Segunda Junho 16 18:24:22 BRT 2014
Que fazendo coro às observações do Walmes, lembro que os gráficos para as
análises citadas *já* estão disponíveis a um simples:
> plot(objeto_retornado_pela_regressão_ou_anova)
tipicamente ele retorna quatro gráficos (mais usados na opinão dos
implementadores) mas se for chamada:
> plot(objeto, which=<número>) onde número pode ir de 1 a 6, temos mais
dois gráficos, em particular os que mostram a alavancagem.
Uma descrição dos testes subjacentes a esses gráficos pode ser visto na
obra de Julian J. Faraway, "Practical Regression and Anova using R", 2002.
(esse e-book pode ser baixado do site CRAN).
HTH
--
Cesar Rabak
2014-06-16 15:27 GMT-03:00 walmes . <walmeszeviani em gmail.com>:
> Caro Hélio,
>
> É do meu conhecimento que muitas pessoas adotam a aplicação de testes de
> hipótese aos resíduos para se assegurarem da validade dos pressupostos.
> Aqui vão algumas preocupações da minha parte sobre essa abordagem e
> recomendações gerais.
>
> 1. Teste de normalidade para os resíduos. Os resíduos crus não são
> independentes. Sua covariância é proporcional aos elementos fora da
> diagonal da matriz de projeção H = X (X'X)^{-1} X'. Os testes de
> normalidade assumem uma amostra aleatória independente. Os resíduos crus
> não são. Logo, inferência a partir do teste não é segura.
> 2. Caso queira fazê-lo, considere os resíduos studentizados ou
> externamente padronizados, pois estes corrigem para os elementos da matriz
> H.
> 3. Embora esses resíduos satisfaçam os requisitos dos testes, ainda
> não o considero útil aplicá-los. Suponha que o teste de normalidade rejeite
> a hipótese nula. Qual será sua decisão? Abandonar a análise? Ou procurar
> identificar a causa da rejeição para tentar corrigir/amenizar? Se for
> procurar pela causa você certamente fará gráficos desses resíduos. Ou seja,
> o teste de hipótese não é informativo quando há rejeição da hipótese. A
> análise visual é muito mais interessante pois, no caso de afastamento dos
> pressupostos, você pode ter alguma indicação de como proceder: remover
> observação influente, aplicar transformação, ir para um modelo com
> suposições mais relaxadas/condizentes.
> 4. O argumento mais frequente contra a análise gráfica é a sua
> subjetividade. De fato, pessoas olham para os gráficos e tem impressões
> diferentes. Já considerar um p-valor menor ou não que 5% parece ser, para a
> maioria, livre de subjetividade. Mas se decidir por um p-valor retornado
> por um teste subjetivamente escolhido e aplicado em situações muitas vezes
> fora das assumidas pelo teste não é subjetivo? Não é subjetivo adotar um
> Shapiro-Wilk, Anderson-Darling, Kolmogorv-Smirnov ou outro? Um Levene ou
> Bartlett? Subjetividade por subjetividade na minha consideração.
> 5. O mais importante é que uma análise gráfica pode ser conduzida para
> uma ampla classe de modelos enquanto que testes de hipótese como esse
> perdem campo para modelos mais gerais ou delineamento mais complexos. Como
> avaliar a homogeneidade de variâncias para um experimento fatorial?
> Combinar os níveis dos fatores? E se for um fatorial fracionado ou ensaio
> com uma única repetição por cédula? Se os resíduos de deviance de um modelo
> Poisson, por exemplo, sé terá distribuição normal para amostras grandes,
> então qual a validade de o teste para uma amostra pequena? O que é uma
> amostra pequena/grande?
> 6. Uma coisa que eu realmente sou contra é o exagero na aplicação dos
> testes de hipótese. Vejamos o caso clássico da análise de experimentos.
> Para concluir a análise tem-se que: Testar normalidade (1), testar
> homogeneidade de variâncias (2), testar o efeitos dos termos do modelo
> (pela anova, 3) e aplicar contrastes entre médias (4). Eu não acho que a
> investigação estatística seja um conjunto de procedimentos como esse.
> 7. A análise gráfica é útil. Afastamentos realmente comprometedores
> são identificados via uma análise gráfica até mesmo por pessoas não
> treinadas. O que fazer diante dos possíveis cenários requer um pouco de
> treino. Simples recomendações são: Q-q norm com disposição curvada ->
> assimetria -> transformar? Resíduos~ajustados em forma de cone -> relação
> média variância -> transformar? Resíduos de desvio grande e/ou alta
> alavancagem -> remover? E assim vai.
>
> À disposição.
> Walmes.
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20140616/449c123e/attachment.html>
Mais detalhes sobre a lista de discussão R-br