Re: [R-br] ANOVA - dados desbalanceados

Bom dia Walmes!! Dá uma olhadinha novamente no seu exemplo de dados extremamente desbalanceados. Acho que há um equívoco na utilização da drop1, pois como o próprio help da função informa, ela testa a hipótese do tipo II, e no caso do seu exemplo, como nós já sabemos, a hipótese mais correta a ser testada é a do tipo IV. Ainda, no help da função tem a seguinte mensagem: ''Only use these functions with data containing missing values with great care''. Pode ser que eu esteja equivocado, por que não? Mais como eu uso diariamente os seus exemplos, e tenho certeza que muitas pessoas também recorrem-nos, acho que vale a pena você dar uma olhadinha lá. Abraço!! Allaman (S,f,P) M.Sc Ivan Bezerra Allaman Zootecnista Doutorando em Produção Animal/Aquicultura - UFLA email e msn - ivanalaman@yahoo.com.br Tel: (35)3826-6608/9900-2924

Ivan, Você tá se referindo ao exemplo exemplo das ridículas ( http://www.leg.ufpr.br/doku.php/ridiculas#experimento_com_dois_fatores_de_ef... )? Nesse caso o experimento tem 2 fatores de efeito aditivo (sem interação, como o caso de bloco e tratamento). A função drop1(), como você falou, abandona um termo de cada vez do modelo e aplica o teste F obtido da redução na soma de quadrados. Como você falou, é hipótese tipo II, ou seja, hipóteses sobre efeitos marginais, o efeito de um fator ajustado para os demais precedentes. Não é caso de hipótese tipo IV, que eu nem sei definir o que é que nunca usei de fato. Desconheço função R para isso. Só sei que existe uma argumentação a favor do uso desse tipo de hipótese para testar efeito principal de fatores na presença de interações quando haver perca de caselas, ou seja, combinações inteiras entre níveis dos fatores não disponível. Esse não é o caso do meu exemplo, que tem 2 fatores sem interação. Já que estamos falando disso, minha opinião sobre a tipo IV é a seguinte: (1) testar efeito principal na presença de interação é sem sentido para a maioria dos casos, salvo no genética onde essas interações representam coisas como "capacidade geral e específica de combinação", na presença de interação significativa nem olhe para os efeitos principais, (2) se a interação é não significativa, abandone o termo interação, ajuste um modelo aditivo e use a drop1() para testar hipóteses marginais nesse modelo aditivo. Se foi a esse exemplo que você se referiu, desconsidere minhas argumentações. Recomendo aos interessados a leitura do documento http://www.stats.ox.ac.uk/pub/MASS3/Exegeses.pdf À disposição. Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================

eu sinceramente acho que a busca da simplificacao nao trouxe la esses beneficios para os usuarios de estatistica, que estao sempre procurando "diferentes" somas de quadrados I, II, III ou IV (soma de quadrados eh uma apenas: x1^2+x2^2+...+xn^2). a maioria acaba por esquecer que a teoria unificadora (neste caso) e' a verossimilhanca... o tudo o que precisamos olhar e' a magnitude da mudanca de verossimilhanca ao sair de um modelo mais complexo para um mais simples... b 2011/7/21 Walmes Zeviani <walmeszeviani@gmail.com>:
Ivan,
Você tá se referindo ao exemplo exemplo das ridículas (http://www.leg.ufpr.br/doku.php/ridiculas#experimento_com_dois_fatores_de_ef... Nesse caso o experimento tem 2 fatores de efeito aditivo (sem interação, como o caso de bloco e tratamento). A função drop1(), como você falou, abandona um termo de cada vez do modelo e aplica o teste F obtido da redução na soma de quadrados. Como você falou, é hipótese tipo II, ou seja, hipóteses sobre efeitos marginais, o efeito de um fator ajustado para os demais precedentes. Não é caso de hipótese tipo IV, que eu nem sei definir o que é que nunca usei de fato. Desconheço função R para isso. Só sei que existe uma argumentação a favor do uso desse tipo de hipótese para testar efeito principal de fatores na presença de interações quando haver perca de caselas, ou seja, combinações inteiras entre níveis dos fatores não disponível. Esse não é o caso do meu exemplo, que tem 2 fatores sem interação. Já que estamos falando disso, minha opinião sobre a tipo IV é a seguinte: (1) testar efeito principal na presença de interação é sem sentido para a maioria dos casos, salvo no genética onde essas interações representam coisas como "capacidade geral e específica de combinação", na presença de interação significativa nem olhe para os efeitos principais, (2) se a interação é não significativa, abandone o termo interação, ajuste um modelo aditivo e use a drop1() para testar hipóteses marginais nesse modelo aditivo. Se foi a esse exemplo que você se referiu, desconsidere minhas argumentações.
Recomendo aos interessados a leitura do documento
http://www.stats.ox.ac.uk/pub/MASS3/Exegeses.pdf
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Successful people ask better questions, and as a result, they get better answers. (Tony Robbins)

Benilton, Concordo plenamente com você. Grande parte desses conceitos são heranças da época em que o método de mínimos quadrados era dominante e haviam poucos aplicativos disponíveis. Esse aplicativos acabaram por inserir nomenclaturas e significados que hoje não são mais consistentes/úteis/relevantes dado o ferramental e métodos que temos. Hoje ainda me impressiona a quantidade de gente que julga um ajuste ou análise de um experimento por coeficiente de variação (cv) ou de determinação (R²) ou que ainda aplica aquelas transformações paleozóicas, tipo arco seno da raíz para dados de proporção. As transformações já foram úteis na época em que anova dominava, hoje temos glm em quase todos aplicativos, cv era uma medida indireta de qualidade ajuste quando não tínhamos recursos para análise dos resíduos. Acontece que uma parte das pessoas que usavam essa estatística não acompanhou a evolução e insiste em ainda hoje reclamar um cv de 30%, em aplicar teste de médias para fatores quantitativos, a fazer estimação/inputação/desespero de parcela perdida. As ciências agrárias sofre disso e essas discussões são relevantes no sentido de expor o cenário atual e o cenário ideal. Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================

Pô li aqui o texto do venables... muito interessante mesmo! Valeu Walmes! abraço, FH 2011/7/21 Walmes Zeviani <walmeszeviani@gmail.com>
Benilton,
Concordo plenamente com você. Grande parte desses conceitos são heranças da época em que o método de mínimos quadrados era dominante e haviam poucos aplicativos disponíveis. Esse aplicativos acabaram por inserir nomenclaturas e significados que hoje não são mais consistentes/úteis/relevantes dado o ferramental e métodos que temos. Hoje ainda me impressiona a quantidade de gente que julga um ajuste ou análise de um experimento por coeficiente de variação (cv) ou de determinação (R²) ou que ainda aplica aquelas transformações paleozóicas, tipo arco seno da raíz para dados de proporção. As transformações já foram úteis na época em que anova dominava, hoje temos glm em quase todos aplicativos, cv era uma medida indireta de qualidade ajuste quando não tínhamos recursos para análise dos resíduos. Acontece que uma parte das pessoas que usavam essa estatística não acompanhou a evolução e insiste em ainda hoje reclamar um cv de 30%, em aplicar teste de médias para fatores quantitativos, a fazer estimação/inputação/desespero de parcela perdida. As ciências agrárias sofre disso e essas discussões são relevantes no sentido de expor o cenário atual e o cenário ideal.
Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
participantes (4)
-
Benilton Carvalho
-
Fernando Henrique Toledo
-
Ivan Bezerra Allaman
-
Walmes Zeviani