[R-br] Dúvida equação GLM e Anova
Paulo Justiniano
paulojus em leg.ufpr.br
Terça Janeiro 17 22:34:08 BRST 2012
Carol
sugiro uma revisao de modelos lineares geeneralizados em algum texto
introdutorio que vai esclarecer muitas coisas
(por exemlo o livro Extending Linear Models in R)
Mas rapidamente:
O modelo linear que voce menciona y = a+bx
Pode ser reescrito como explicitando a distribuicao da resposta Y e
definindo uma funcao de sua média (no caso identidade) como uma funcao
linear de sua variavel explicativa
Y ~ N(mu, sigma^2)
E(Y) = mu = nu = a + bx
O GLM geeneraliza isto entao de 2 maneiras:
- a distribuição nao precisa ser normal
- a relacao de mu e nu nao precisa ser identidade
No seu caso:
Y ~ N(n, p)
E(Y) = p
log(p/(1-p)) = nu = a + bx
Quanto a comparar com modelo nulo é só ajustado e usar a funcao anova para
comparar, semelahnte aos lm no R
ex:
mod0 <- glm(y ~ 1, family = binomial)
mod1 <- glm(y ~ x, family = binomial)
anova(mod0, mod1)
On Tue, 17 Jan 2012, Caroline Figueiredo wrote:
>
> Olá pessoal,
>
> Estou com uma dúvida, que na verdade deve ser bem ridícula, mas realmente não sei a resposta. A questão é a
> seguinte:
>
> Tenho dados binários como variável resposta ( 1 – vivo; 0 - morto), e variáveis contínuas como explicativas, e vi
> no The R book do Crawley que poderia usar GLM para construir um modelo, tendo binomial como família. Usei o seguinte
> código (os valores são fictícios, pois li meus dados direto da tabela, pois são muitas linhas).
>
> status<-c(0,1,0,1,1,1,1,1,0,1)
>
> altura<-c(2.2,1.3,4.5,6.7,1.3,4.5,1.2,2.0,7.8,1.2)
>
> newy<-c(5.5,1.2,7.8,1.4,1.3,2.3,3.2,1.3,6.7,1.4)
>
> m1<-glm(status~altura+newy+altura*newy, binomial)
>
> E o summary deu isso:
>
>
>
> Call:
>
> glm(formula = status ~ altura + newy + altura * newy, family = binomial)
>
>
>
> Deviance Residuals:
>
> Min 1Q Median 3Q Max
>
> -3.3122 0.1586 0.1969 0.2486 0.6394
>
>
>
> Coefficients:
>
> Estimate Std. Error z value Pr(>|z|)
>
> (Intercept) 0.24827 0.52797 0.470 0.63818
>
> altura 0.80654 0.20006 4.032 5.54e-05 ***
>
> newy 0.23918 0.05101 4.689 2.74e-06 ***
>
> altura:newy -0.04578 0.01753 -2.611 0.00903 **
>
> ---
>
> Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
>
>
>
> (Dispersion parameter for binomial family taken to be 1)
>
>
>
> Null deviance: 1705.0 on 7191 degrees of freedom
>
> Residual deviance: 1610.4 on 7188 degrees of freedom
>
> AIC: 1618.4
>
>
>
> Number of Fisher Scoring iterations: 7
>
>
>
> Minha dúvida é a seguinte: Qual é a equação ajustada para esse modelo? P. ex., se fosse uma regressão linear o
> modelo seria y~x, e a equação y=a + bx, mas e para esse modelo?
>
> A outra dúvida é se poderia fazer uma anova para comparar esse modelo com o modelo nulo, e qual teste poderia usar,
> pois no exemplo do livro ele usa o test= chi, porém está comparando dois modelos diferentes, e queria saber se
> posso usar para comparar com o modelo nulo também. Bem é isso pessoal, espero que possam me ajudar.
>
> Obrigada,
>
> Carol Figueiredo
>
>
>
Mais detalhes sobre a lista de discussão R-br