Re: [R-br] Heterocedasticidade e teste de média

Prezados Walmes e WagnerCostumo trabalhar com conjuntos de dados em que todos os pressupostos são violados (os dados e os resíduos desviam muito da normalidade além de heterocedasticidade que conforme o Walmes mencionou a solução transformação Box-Cox não resolve). Além disso não posso excluir ou agrupar os tratamentos porque os mesmos representam resultados (medições) de laboratórios. Preciso compará-los com um tratamento (laboratório) considerado de "referência".O modelo gls() é capaz de abarcar esses problemas? Desde já agradeçoLuiz On Monday, November 7, 2016 10:34 PM, Mauro Sznelwar via R-br <r-br@listas.c3sl.ufpr.br> wrote: Ele não reconhece estes comandos 'mcglm','gof', tem alguma bibliotéca para isto? Caros, Alguém postou esse conjunto de dados com problema de pressupostos, principalmente heterocedasticidade. Agora a pouco veio outro e-mail com um problema similar. Fiz um exemplo um pouco mais detalhado de como isso podeser facilmente resolvido e mostrando o efeito disso no modelo. # Example 2 ------------------------------------------------------------ Fenois = c(337.311, 344.874, 342.353, 325.546, 333.950, 330.588, 328.067, 328.067, 318.824, 331.429, 333.950, 334.790, 336.471, 338.151, 342.353, 259.160, 252.437, 268.403, 265.882, 266.723, 287.731, 88.571, 88.571, 90.252, 41.513, 52.437, 49.076, 88.571, 88.571, 90.252, 64.202, 60.000, 61.681) Cor = factor(c(rep("ambar",6), rep("ambar_claro",3), rep("ambar",6), rep("ambar_claro",6),rep("branco",6), rep("extra_ambar_claro",3),rep("branco",3))) # Exploratory analysis boxplot(Fenois ~ Cor) tapply(Fenois, Cor, sd) dados <- data.frame(Fenois, Cor) dados$id <- 1 # Fitting fit1 <- mcglm(c(Fenois ~ Cor), list(mc_id(dados)), data = dados) fit2 <- mcglm(c(Fenois ~ Cor), list(mc_dglm(~ Cor, id = "id", data = dados)), covariance = "expm", data = dados) # Goodness-of-fit gof(fit1) gof(fit2) # Comparing estimates and standard errors coef(fit1, type = "beta", std.error = TRUE) coef(fit2, type = "beta", std.error = TRUE) O interessante é que a estimativa pontual é exatamente a mesma, porém olha a enorme diferença nos erros padrões dos betas. -- Wagner Hugo Bonat ---------------------------------------------------------------------------------------------- Department of Mathematics and Computer Science (IMADA) University of Southern Denmark (SDU) and Laboratório de Estatística e Geoinformação (LEG) Universidade Federal do Paraná (UFPR) _______________________________________________ _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne� c�igo m�imo reproduz�el.

Luiz, Malgrado você tenha endereçado a pergunta, dou meu "pitaco" enquanto os outros colegas não se manifestam. Todas as regressões necessitam que em última análise os erros aleatórios possam ser modelados por um processo cuja melhor representação é a distribuição gaussiana com média zero e alguma dispersão em torno desse zero (que gera o "ruído" nas respostas versus a modelagem matemática da regressão). A grande contribuição dos modelos generalizados é identificação de diversas funções de ligação que permitem modelar processos com respostas diferentes da média pura (ligação == identidade) de tal forma que quando você analisa os resíduos eles "ficam" normais (gaussianos). No script que você enviou em anexo ao e-mail, você está aplicando testes com a suposição ("modelagem") de um processo que deveria ter uma relação "linear" entre x e y. Ora, você tem três amostras para todos os grupos "x" com exceção do grupo "0" que tem 14 casos, como você espera obter alguma coisa razoável em relação aos resíduos? Uma análise exploratória dos seus dados mostra algo interessante, veja no seu ambiente:
library(gplots) plotmeans(y ~ x, data=dados)
Uma outra instrutiva visualização dos seus dados é a seguinte:
dotchart(dados$y, groups=dados$x)
HTH -- Cesar Rabak 2016-11-08 11:11 GMT-02:00 Luiz Leal via R-br <r-br@listas.c3sl.ufpr.br>:
Prezados Walmes e Wagner Costumo trabalhar com conjuntos de dados em que todos os pressupostos são violados (os dados e os resíduos desviam muito da normalidade além de heterocedasticidade que conforme o Walmes mencionou a solução transformação Box-Cox não resolve). Além disso não posso excluir ou agrupar os tratamentos porque os mesmos representam resultados (medições) de laboratórios. Preciso compará-los com um tratamento (laboratório) considerado de "referência". O modelo gls() é capaz de abarcar esses problemas? Desde já agradeço Luiz
On Monday, November 7, 2016 10:34 PM, Mauro Sznelwar via R-br < r-br@listas.c3sl.ufpr.br> wrote:
Ele não reconhece estes comandos 'mcglm','gof', tem alguma bibliotéca para isto?
Caros,
Alguém postou esse conjunto de dados com problema de pressupostos, principalmente heterocedasticidade. Agora a pouco veio outro e-mail com um problema similar. Fiz um exemplo um pouco mais detalhado de como isso pode ser facilmente resolvido e mostrando o efeito disso no modelo.
# Example 2 ------------------------------------------------------------ Fenois = c(337.311, 344.874, 342.353, 325.546, 333.950, 330.588, 328.067, 328.067, 318.824, 331.429, 333.950, 334.790, 336.471, 338.151, 342.353, 259.160, 252.437, 268.403, 265.882, 266.723, 287.731, 88.571, 88.571, 90.252, 41.513, 52.437, 49.076, 88.571, 88.571, 90.252, 64.202, 60.000, 61.681) Cor = factor(c(rep("ambar",6), rep("ambar_claro",3), rep("ambar",6), rep("ambar_claro",6),rep("branco",6), rep("extra_ambar_claro",3),rep("branco",3)))
# Exploratory analysis boxplot(Fenois ~ Cor) tapply(Fenois, Cor, sd) dados <- data.frame(Fenois, Cor) dados$id <- 1
# Fitting fit1 <- mcglm(c(Fenois ~ Cor), list(mc_id(dados)), data = dados) fit2 <- mcglm(c(Fenois ~ Cor), list(mc_dglm(~ Cor, id = "id", data = dados)), covariance = "expm", data = dados) # Goodness-of-fit gof(fit1) gof(fit2)
# Comparing estimates and standard errors coef(fit1, type = "beta", std.error = TRUE) coef(fit2, type = "beta", std.error = TRUE)
O interessante é que a estimativa pontual é exatamente a mesma, porém olha a enorme diferença nos erros padrões dos betas.
-- Wagner Hugo Bonat ------------------------------------------------------------ ---------------------------------- Department of Mathematics and Computer Science (IMADA) University of Southern Denmark (SDU) and Laboratório de Estatística e Geoinformação (LEG) Universidade Federal do Paraná (UFPR)
_______________________________________________
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne� c�igo m�imo reproduz�el.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
participantes (3)
-
Cesar Rabak
-
Luiz Leal
-
sznelwar@uol.com.br