Soma de Quadrado Tipo III no R para analisar um fatorial desbalaceado

Pessoal, mais uma vez recorro a experiência de vocês. Estou analisando um conjunto de dados de um experimento em esquema fatorial com dois fatores e em DBC. Os dados estão desbalanceados, porém sem caselas vazias. Quero testar a seguinte hipótese: efeito de determinado parâmetro corrigido para todos os outros. Que é a famosa soma de quadrados tipo III (estou certo ?). Mas como testar esta hipótese no R? segue meu CMR: #################### library(car) dados <- read.table("material.txt",header = TRUE) names(dados)
names(dados) [1] "Lamina" "Dose" "Bloco" "V1"
M1<- lm(V1~ Bloco + Lamina*Dose, data=dados) # soma de quadrados tipo I anova(M1) # soma de quadrados tipo II Anova(M1, type="II") # soma de quadrados tipo III Anova(M1, type="III") ################### O meu problema é que: a SQ tipo I bate com a tipo I do SAS; a SQ tipo II bate com a tipo II do SAS, mas a SQ tipo III não bate com a tipo III do SAS. E eu sei que a soma de quadrado correta para testar a minha hipótese é a SQ tipo III, mas não quero usar o SAS. Aquele tipo III da função Anova da biblioteca car corresponde ao mesmo tipo III do SAS ? Posso usar seus resultados como se fossem a SQ tipo III? Então porque os resultados são diferentes? Outra questão: Neste mesmo experimento foram avaliadas outras variáveis, e em uma delas não foi possível medir todas as combinações, gerando 2 caselas vazias. Daí quando faço a Anova tipo III dá o seguinte erro:
Anova(M2, type="III") Erro em Anova.III.lm(mod, error, singular.ok = singular.ok, ...) : there are aliased coefficients in the model
Alguém sabe o que significa este erro ? Muito obrigado! Tales Jesus Fernandes Doutorando em Estatística UFLA Universidade Federal de Lavras

Verifique a função drop1(). O erro é se você tem caselas pedidas então o efeito é não estimado e isso gera estrutura de confundimento etc. Você disse que a hipótese que você quer testar tem que usar a SQ tipo III, ou seja, todos os efeitos ajustados para os demais do modelo. Sejam os efeitos A e B, então você tem a interação ajustada para os efeitos principais, A*B|A e B, coisa que você testa com a SQ I. Agora, faz sentido testar o efeito de A ajustado para uma interação que contém A, A|B e A*B? Existe um modelo onde B interage com A mas sem o efeito principal de A? Não existe, então porque essa hipótese é relevante? Para mim existe mais mistério na insistências das pessoas em porque usar/ensinar essa SQ III do que como calculá-la. Recomendo que leia http://www.stats.ox.ac.uk/pub/MASS3/Exegeses.pdf À disposição. Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br skype: walmeszeviani twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================

Walmes, muito obrigado. Concordo que o problema realmente está em formular a hipóteses e não em como calcular as diferentes SQ. Seguindo suas sugestões então devo fazer as SQ Tipo II, também acho mais adequado. Mas isso não responde minha dúvida inicial: Se por algum motivo eu preciso/desejo analisar um experimento no R, usando a SQ tipo III, posso confiar que o comando Anova(objeto, type="III") do pacote car está fazendo estas reduções? E que por algum motivo (alguém sabe qual?) fornece resultados diferentes do SAS. Alguém conhece as reduções que são feitas nesta função, ou sabe onde posso encontrá-las? Atenciosamente; Tales Jesus Fernandes Doutorando em Estatística UFLA Universidade Federal de Lavras ________________________________ De: walmes . <walmeszeviani@gmail.com> Para: r-br@listas.c3sl.ufpr.br; Tales Fernandes <talesest@yahoo.com.br> Enviadas: Quarta-feira, 10 de Julho de 2013 10:03 Assunto: Re: [R-br] Soma de Quadrado Tipo III no R para analisar um fatorial desbalaceado Verifique a função drop1(). O erro é se você tem caselas pedidas então o efeito é não estimado e isso gera estrutura de confundimento etc. Você disse que a hipótese que você quer testar tem que usar a SQ tipo III, ou seja, todos os efeitos ajustados para os demais do modelo. Sejam os efeitos A e B, então você tem a interação ajustada para os efeitos principais, A*B|A e B, coisa que você testa com a SQ I. Agora, faz sentido testar o efeito de A ajustado para uma interação que contém A, A|B e A*B? Existe um modelo onde B interage com A mas sem o efeito principal de A? Não existe, então porque essa hipótese é relevante? Para mim existe mais mistério na insistências das pessoas em porque usar/ensinar essa SQ III do que como calculá-la. Recomendo que leia http://www.stats.ox.ac.uk/pub/MASS3/Exegeses.pdf À disposição. Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br skype: walmeszeviani twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================

Um CMR na primeira mensagem teria resolvido a questão. Veja a comparação entre Anova(, type="III") e drop1() que foi minha sugestão. Verifique se "batem". da <- expand.grid(bloco=gl(4,1), A=gl(3,1), B=gl(5,1)) da$y <- rnorm(da$A) set.seed(123) da$y[sample(1:nrow(da), 5)] <- NA da <- na.omit(da) xtabs(~A+B, da) # observações perdidas m0 <- lm(y~bloco+A*B, da) anova(m0) car::Anova(m0, type="II") car::Anova(m0, type="III") drop1(m0, test="F", scope=.~.) # idem ao type="III" db <- expand.grid(bloco=gl(4,1), A=gl(3,1), B=gl(5,1)) db$y <- rnorm(db$A) db <- subset(db, A!="1" | B!="1") db <- na.omit(db) xtabs(~A+B, db) # casela pedida m1 <- lm(y~bloco+A*B, db) anova(m1) car::Anova(m1, type="II") car::Anova(m1, type="III") # erro summary(m1) # tem NA drop1(m1, test="F", scope=.~.) # sem problemas À disposição. Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br skype: walmeszeviani twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
participantes (2)
-
Tales Fernandes
-
walmes .