Referências para justificar o uso de teste de médias baseados em preditores lineares [OFF-TOPIC]

Prezados membros, Utilizo de maneira rotineira o ajuste de modelos GLM (normalmente para as famílias de Poisson e binomial) e realizo para variáveis qualitativas comparações múltiplas de médias baseada em funções como glht() do pacote multicomp. No entanto, tenho encontrado bastante dificuldade em convencer revisores de periódicos na minha área, onde a estatística parou nos anos 50, a aceitar o o uso de teste de médias baseados em preditores lineares para variáveis qualitativas. Alguém poderia sugerir algumas referências de peso nessas abordagem para uma melhor justificação das abordagem estatísticas escolhidas por mim? Obrigado, Alexandre -- ====================================================================== Alexandre dos Santos Proteção Florestal IFMT - Instituto Federal de Educação, Ciência e Tecnologia de Mato Grosso Campus Cáceres Caixa Postal 244 Avenida dos Ramires, s/n Bairro: Distrito Industrial Cáceres - MT CEP: 78.200-000 Fone: (+55) 65 99686-6970 (VIVO) (+55) 65 3221-2674 (FIXO) e-mails:alexandresantosbr@yahoo.com.br alexandre.santos@cas.ifmt.edu.br Lattes: http://lattes.cnpq.br/1360403201088680 OrcID: orcid.org/0000-0001-8232-6722 - ResearcherID: A-5790-2016 Researchgate: www.researchgate.net/profile/Alexandre_Santos10 LinkedIn: br.linkedin.com/in/alexandre-dos-santos-87961635 Mendeley:www.mendeley.com/profiles/alexandre-dos-santos6/ ======================================================================

Alexandre, Às vezes é bem difícil, senão impossível, argumentar contra a ignorância de certos revisores. Eu partiria do seguinte ponto. Em modelos lineares gaussianos, as médias amostrais são funções lineares das observações para estimar as médias dos tratamentos. Isso pode ser obtido de forma equivalente por meio dos efeitos estimados do modelo, sem nenhum prejuízo, pelo contrário. Já que os efeitos são funções lineares das observações, médias que resultam de funções lineares dos efeitos nada mais são, por consequência, funções lineares das observações no final das contas. Acontece que isso não se preserva em modelos lineares generalizados, devido a presença da função de ligação ser não linear (quebra o circuito de funções lineares) e a função de variância não ser mais constante (observações tem pesos diferentes na média). Dessa forma, uma função linear dos efeitos é o jeito correto de obter médias ajustadas, haja visto que ela incorpora os diferentes pesos da função de variância do modelo utilizado (Poisson, Binomial) coisa que as médias amostrais não fazem nesse caso. Existe toda uma literatura sobre isso. Recomendo mencionar Analysis of Messy Data, volume 1, 2 e 3, George A. Milliken, Dallas E. Johnson Linear Models, Shayle R. Searle, Marvin H. J. Gruber Generalized, Linear, and Mixed Models, Charles E. McCulloch, Shayle R. Searle Contemporary Statistical Models for the Plant and Soil Sciences, Oliver Schabenberger, Francis J. Pierce Multiple Comparisons Using R, Frank Bretz, Torsten Hothorn, Peter Westfall http://users.iems.northwestern.edu/~nelsonb/Publications/HsuNelson.pdf À disposição. Walmes.

Walmes, Mais uma vez prestou um claro e didático esclarecimento da questão levantada, obrigado pela explanação e referências apontadas, Redobrados agradecimentos, Alexandre -- ====================================================================== Alexandre dos Santos Proteção Florestal IFMT - Instituto Federal de Educação, Ciência e Tecnologia de Mato Grosso Campus Cáceres Caixa Postal 244 Avenida dos Ramires, s/n Bairro: Distrito Industrial Cáceres - MT CEP: 78.200-000 Fone: (+55) 65 99686-6970 (VIVO) (+55) 65 3221-2674 (FIXO) e-mails:alexandresantosbr@yahoo.com.br alexandre.santos@cas.ifmt.edu.br Lattes: http://lattes.cnpq.br/1360403201088680 OrcID: orcid.org/0000-0001-8232-6722 - ResearcherID: A-5790-2016 Researchgate: www.researchgate.net/profile/Alexandre_Santos10 LinkedIn: br.linkedin.com/in/alexandre-dos-santos-87961635 Mendeley:www.mendeley.com/profiles/alexandre-dos-santos6/ ====================================================================== Em 24/02/2017 16:35, Walmes Zeviani escreveu:
Alexandre,
Às vezes é bem difícil, senão impossível, argumentar contra a ignorância de certos revisores. Eu partiria do seguinte ponto. Em modelos lineares gaussianos, as médias amostrais são funções lineares das observações para estimar as médias dos tratamentos. Isso pode ser obtido de forma equivalente por meio dos efeitos estimados do modelo, sem nenhum prejuízo, pelo contrário. Já que os efeitos são funções lineares das observações, médias que resultam de funções lineares dos efeitos nada mais são, por consequência, funções lineares das observações no final das contas. Acontece que isso não se preserva em modelos lineares generalizados, devido a presença da função de ligação ser não linear (quebra o circuito de funções lineares) e a função de variância não ser mais constante (observações tem pesos diferentes na média). Dessa forma, uma função linear dos efeitos é o jeito correto de obter médias ajustadas, haja visto que ela incorpora os diferentes pesos da função de variância do modelo utilizado (Poisson, Binomial) coisa que as médias amostrais não fazem nesse caso. Existe toda uma literatura sobre isso. Recomendo mencionar
Analysis of Messy Data, volume 1, 2 e 3, George A. Milliken, Dallas E. Johnson Linear Models, Shayle R. Searle, Marvin H. J. Gruber Generalized, Linear, and Mixed Models, Charles E. McCulloch, Shayle R. Searle Contemporary Statistical Models for the Plant and Soil Sciences, Oliver Schabenberger, Francis J. Pierce Multiple Comparisons Using R, Frank Bretz, Torsten Hothorn, Peter Westfall http://users.iems.northwestern.edu/~nelsonb/Publications/HsuNelson.pdf <http://users.iems.northwestern.edu/%7Enelsonb/Publications/HsuNelson.pdf>
À disposição. Walmes.

Prez@dos, Como a resposta do Walmes está completa, no meu [humilde] ponto de vista (e bate com minha experiência), gostaria de tentar aditar oferecendo uma abordagem complementar mais intuitiva, mas que pode abrir a famosa lata de minhocas (*can of worms*) como gostam de colocar os americanos: Antes de mais nada é necessário que a gente tenha consciência e clareza do objetivo do porquê se está a comparar as médias em primeiro lugar: SE a comparação das médias serve para obter uma estimativa a granel da população (*bulk*) como, por exemplo, um sociólogo que quer discorrer sobre quanto cada cidadão de vários países contribui da sua renda *per capita* com os gastos militares do seu país, então a comparação das médias usando-se a distribuição gaussiana e invocando o CLT seria suficiente para atingir os objetivos, mesmo sabendo-se que distribuição da renda nas populações deve ser outra (talvez Pareto fosse mais apropriada). SE a comparação das médias é um artifício para fazer um *teste paramétrico* entre várias distribuições, então a primeira coisa que precisamos encontrar é qual seria a distribuição teórica dessas populações e então achar os parâmetros, do qual a média finda sendo a rainha do baile, embora a gente deveria prestar a atenção nos outros, mas isto é para debater em outro post. . .! Portanto, na minha opinião enquanto o Alexandre não esclarecer qual é objetivo da sua análise, tanto os revisores como a explicação data acima são veredicto cujo juri não pode decidir. HTH -- Cesar Rabak 2017-02-24 17:46 GMT-03:00 ASANTOS via R-br <r-br@listas.c3sl.ufpr.br>:
Walmes,
Mais uma vez prestou um claro e didático esclarecimento da questão levantada, obrigado pela explanação e referências apontadas,
Redobrados agradecimentos,
Alexandre
-- ====================================================================== Alexandre dos Santos Proteção Florestal IFMT - Instituto Federal de Educação, Ciência e Tecnologia de Mato Grosso Campus Cáceres Caixa Postal 244 Avenida dos Ramires, s/n Bairro: Distrito Industrial Cáceres - MT CEP: 78.200-000 Fone: (+55) 65 99686-6970 (VIVO) (+55) 65 3221-2674 (FIXO)e-mails:alexandresantosbr@yahoo.com.br alexandre.santos@cas.ifmt.edu.br Lattes: http://lattes.cnpq.br/1360403201088680 OrcID: orcid.org/0000-0001-8232-6722 - ResearcherID: A-5790-2016 Researchgate: www.researchgate.net/profile/Alexandre_Santos10 LinkedIn: br.linkedin.com/in/alexandre-dos-santos-87961635 Mendeley:www.mendeley.com/profiles/alexandre-dos-santos6/ ======================================================================
Em 24/02/2017 16:35, Walmes Zeviani escreveu:
Alexandre,
Às vezes é bem difícil, senão impossível, argumentar contra a ignorância de certos revisores. Eu partiria do seguinte ponto. Em modelos lineares gaussianos, as médias amostrais são funções lineares das observações para estimar as médias dos tratamentos. Isso pode ser obtido de forma equivalente por meio dos efeitos estimados do modelo, sem nenhum prejuízo, pelo contrário. Já que os efeitos são funções lineares das observações, médias que resultam de funções lineares dos efeitos nada mais são, por consequência, funções lineares das observações no final das contas. Acontece que isso não se preserva em modelos lineares generalizados, devido a presença da função de ligação ser não linear (quebra o circuito de funções lineares) e a função de variância não ser mais constante (observações tem pesos diferentes na média). Dessa forma, uma função linear dos efeitos é o jeito correto de obter médias ajustadas, haja visto que ela incorpora os diferentes pesos da função de variância do modelo utilizado (Poisson, Binomial) coisa que as médias amostrais não fazem nesse caso. Existe toda uma literatura sobre isso. Recomendo mencionar
Analysis of Messy Data, volume 1, 2 e 3, George A. Milliken, Dallas E. Johnson Linear Models, Shayle R. Searle, Marvin H. J. Gruber Generalized, Linear, and Mixed Models, Charles E. McCulloch, Shayle R. Searle Contemporary Statistical Models for the Plant and Soil Sciences, Oliver Schabenberger, Francis J. Pierce Multiple Comparisons Using R, Frank Bretz, Torsten Hothorn, Peter Westfall http://users.iems.northwestern.edu/~nelsonb/Publications/HsuNelson.pdf
À disposição. Walmes.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
participantes (3)
-
ASANTOS
-
Cesar Rabak
-
Walmes Zeviani