[R-br] teste de Homogeneidade e Normalidade

Walmes Zeviani walmeszeviani em gmail.com
Terça Maio 31 22:53:19 BRT 2011


Eduardo,

Salve engano da minha parte, essa transformação é estabilizadora da
variância, ou seja, o foco é corrigir heterocedasticidade e não olha para
normalidade dos dados. Uma vez disse em um curso que essas transformações
eram coisas do passado e fui por alguns instantes odiado (por aqueles mais
tradicionais obviamente). Depois passou.

Acontece que essa transformação é a recomendada quando seu dado é do tipo
binomial (ou seja, já se sabe que o dado não é normal), dai parte algumas
álgebras, integrais, até que se obtém essa função estabilizadora da
variância. Transformação estabilizadora da variãncia existe para
distribuição binomial e Poisson. Não lembro das funções porque nunca usei.

Considero isso metodologia do passo porque, se você sabe que seu dado é
binomial (ou Poisson), hoje já existe implementado nos aplicativos
estatísticos modelos capazes de considerar essa característica inerente do
dado. Esse conjunto de métodos, enfim, se chama modelos lineares
generalizados, do qual a distribuição normal é um caso particular (com
propriedades bem interessantes).

Com essa metodologia você pode obter todos os resultados experimentais que
obteria com a distribuição normal, diga-se a dobradinha anova e teste de
médias (com algumas adaptações). Então, não há complicações e motivos para
não se usar modelos lineares generalizados.

Ainda é possível, caso o número de sementes colocadas para germinar seja
grande (n, normalmente é 25 ou 50), e caso a probalidade de germinação não
esteja na borda (próximo de 0 ou 1), de assumir que o dado é normal e
analisa-lo assim. Porém, caso p mude muito entre tratamentos pode as
variâncias amostrais serem muito discrepântes. Você pode tentar uma
transformação Box-Cox. Verificar os resíduos.

Em termos de funções do R, você pode usar a glm(, family=binomial), fazer a
análise de resíduos usuais, obter teste (sequencial) para os efeitos fixos
via anova() (que não é anova mas quadro de análise de deviance), se for
comparar "médias" você pode usar a multcomp::glht() e contrast::contrast().
Verifique a documentação dessas funções para saber como usa-las.

Para um começo, você pode rodar o CMR disponível nas Ridículas do LEG.
http://www.leg.ufpr.br/doku.php/ridiculas?&#analise_de_dados_de_proporcao_usando_modelo_linear_generalizado

À disposição.
Walmes.

==========================================================================
Walmes Marques Zeviani
LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W)
Departamento de Estatística - Universidade Federal do Paraná
fone: (+55) 41 3361 3573
VoIP: (3361 3600) 1053 1173
e-mail: walmes em ufpr.br
twitter: @walmeszeviani
homepage: http://www.leg.ufpr.br/~walmes
linux user number: 531218
==========================================================================
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20110531/849b27e7/attachment.html>


Mais detalhes sobre a lista de discussão R-br