Re: [R-br] Heterocedasticidade e teste de média

mais recente
Re: [R-br] Heterocedasticidade e...

mais antigo
Re: [R-br] Regressão linear -...

sznelwar＠uol.com.br

7 Nov 2016 7 Nov '16

22:34

Anexos:

attachment.htm (text/html — 2,5 KB)

Resposta

Faça login para responder on-line Usar software de e-mail

Mostrar respostas por data

Luiz Leal

8 Nov 8 Nov

11:11

Novo assunto: Heterocedasticidade e teste de média

Prezados Walmes e WagnerCostumo trabalhar com conjuntos de dados em que todos os pressupostos são violados (os dados e os resíduos desviam muito da normalidade além de heterocedasticidade que conforme o Walmes mencionou a solução transformação Box-Cox não resolve). Além disso não posso excluir ou agrupar os tratamentos porque os mesmos representam resultados (medições) de laboratórios. Preciso compará-los com um tratamento (laboratório) considerado de "referência".O modelo gls() é capaz de abarcar esses problemas? Desde já agradeçoLuiz On Monday, November 7, 2016 10:34 PM, Mauro Sznelwar via R-br <r-br@listas.c3sl.ufpr.br> wrote: Ele não reconhece estes comandos 'mcglm','gof', tem alguma bibliotéca para isto? Caros, Alguém postou esse conjunto de dados com problema de pressupostos, principalmente heterocedasticidade. Agora a pouco veio outro e-mail com um problema similar. Fiz um exemplo um pouco mais detalhado de como isso podeser facilmente resolvido e mostrando o efeito disso no modelo. # Example 2 ------------------------------------------------------------ Fenois = c(337.311, 344.874, 342.353, 325.546, 333.950, 330.588, 328.067, 328.067, 318.824, 331.429, 333.950, 334.790, 336.471, 338.151, 342.353, 259.160, 252.437, 268.403, 265.882, 266.723, 287.731, 88.571, 88.571, 90.252, 41.513, 52.437, 49.076, 88.571, 88.571, 90.252, 64.202, 60.000, 61.681) Cor = factor(c(rep("ambar",6), rep("ambar_claro",3), rep("ambar",6), rep("ambar_claro",6),rep("branco",6), rep("extra_ambar_claro",3),rep("branco",3))) # Exploratory analysis boxplot(Fenois ~ Cor) tapply(Fenois, Cor, sd) dados <- data.frame(Fenois, Cor) dados$id <- 1 # Fitting fit1 <- mcglm(c(Fenois ~ Cor), list(mc_id(dados)), data = dados) fit2 <- mcglm(c(Fenois ~ Cor), list(mc_dglm(~ Cor, id = "id", data = dados)), covariance = "expm", data = dados) # Goodness-of-fit gof(fit1) gof(fit2) # Comparing estimates and standard errors coef(fit1, type = "beta", std.error = TRUE) coef(fit2, type = "beta", std.error = TRUE) O interessante é que a estimativa pontual é exatamente a mesma, porém olha a enorme diferença nos erros padrões dos betas. -- Wagner Hugo Bonat ---------------------------------------------------------------------------------------------- Department of Mathematics and Computer Science (IMADA) University of Southern Denmark (SDU) and Laboratório de Estatística e Geoinformação (LEG) Universidade Federal do Paraná (UFPR) _______________________________________________ _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne� c�igo m�imo reproduz�el.

Resposta

Faça login para responder on-line Usar software de e-mail

Cesar Rabak

20:13

Novo assunto: Heterocedasticidade e teste de média

Luiz, Malgrado você tenha endereçado a pergunta, dou meu "pitaco" enquanto os outros colegas não se manifestam. Todas as regressões necessitam que em última análise os erros aleatórios possam ser modelados por um processo cuja melhor representação é a distribuição gaussiana com média zero e alguma dispersão em torno desse zero (que gera o "ruído" nas respostas versus a modelagem matemática da regressão). A grande contribuição dos modelos generalizados é identificação de diversas funções de ligação que permitem modelar processos com respostas diferentes da média pura (ligação == identidade) de tal forma que quando você analisa os resíduos eles "ficam" normais (gaussianos). No script que você enviou em anexo ao e-mail, você está aplicando testes com a suposição ("modelagem") de um processo que deveria ter uma relação "linear" entre x e y. Ora, você tem três amostras para todos os grupos "x" com exceção do grupo "0" que tem 14 casos, como você espera obter alguma coisa razoável em relação aos resíduos? Uma análise exploratória dos seus dados mostra algo interessante, veja no seu ambiente:

...

library(gplots) plotmeans(y ~ x, data=dados)

Uma outra instrutiva visualização dos seus dados é a seguinte:

...

dotchart(dados$y, groups=dados$x)

HTH -- Cesar Rabak 2016-11-08 11:11 GMT-02:00 Luiz Leal via R-br <r-br@listas.c3sl.ufpr.br>:

...

Prezados Walmes e Wagner Costumo trabalhar com conjuntos de dados em que todos os pressupostos são violados (os dados e os resíduos desviam muito da normalidade além de heterocedasticidade que conforme o Walmes mencionou a solução transformação Box-Cox não resolve). Além disso não posso excluir ou agrupar os tratamentos porque os mesmos representam resultados (medições) de laboratórios. Preciso compará-los com um tratamento (laboratório) considerado de "referência". O modelo gls() é capaz de abarcar esses problemas? Desde já agradeço Luiz

On Monday, November 7, 2016 10:34 PM, Mauro Sznelwar via R-br < r-br@listas.c3sl.ufpr.br> wrote:

Ele não reconhece estes comandos 'mcglm','gof', tem alguma bibliotéca para isto?

Caros,

Alguém postou esse conjunto de dados com problema de pressupostos, principalmente heterocedasticidade. Agora a pouco veio outro e-mail com um problema similar. Fiz um exemplo um pouco mais detalhado de como isso pode ser facilmente resolvido e mostrando o efeito disso no modelo.

# Example 2 ------------------------------------------------------------ Fenois = c(337.311, 344.874, 342.353, 325.546, 333.950, 330.588, 328.067, 328.067, 318.824, 331.429, 333.950, 334.790, 336.471, 338.151, 342.353, 259.160, 252.437, 268.403, 265.882, 266.723, 287.731, 88.571, 88.571, 90.252, 41.513, 52.437, 49.076, 88.571, 88.571, 90.252, 64.202, 60.000, 61.681) Cor = factor(c(rep("ambar",6), rep("ambar_claro",3), rep("ambar",6), rep("ambar_claro",6),rep("branco",6), rep("extra_ambar_claro",3),rep("branco",3)))

# Exploratory analysis boxplot(Fenois ~ Cor) tapply(Fenois, Cor, sd) dados <- data.frame(Fenois, Cor) dados$id <- 1

# Fitting fit1 <- mcglm(c(Fenois ~ Cor), list(mc_id(dados)), data = dados) fit2 <- mcglm(c(Fenois ~ Cor), list(mc_dglm(~ Cor, id = "id", data = dados)), covariance = "expm", data = dados) # Goodness-of-fit gof(fit1) gof(fit2)

# Comparing estimates and standard errors coef(fit1, type = "beta", std.error = TRUE) coef(fit2, type = "beta", std.error = TRUE)

O interessante é que a estimativa pontual é exatamente a mesma, porém olha a enorme diferença nos erros padrões dos betas.

-- Wagner Hugo Bonat ------------------------------------------------------------ ---------------------------------- Department of Mathematics and Computer Science (IMADA) University of Southern Denmark (SDU) and Laboratório de Estatística e Geoinformação (LEG) Universidade Federal do Paraná (UFPR)

_______________________________________________

_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne� c�igo m�imo reproduz�el.

_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Resposta

Faça login para responder on-line Usar software de e-mail

3433

Idade (dias atrás)

3433

Última atividade (dias atrás)

Visão geral da lista

Baixar

2 comentários

3 participantes

participantes (3)

Cesar Rabak
Luiz Leal
sznelwar＠uol.com.br