[R-br] Dúvida equação GLM e Anova

Paulo Justiniano paulojus em leg.ufpr.br
Terça Janeiro 17 22:34:08 BRST 2012


Carol

sugiro uma revisao de modelos lineares geeneralizados em algum texto 
introdutorio que vai esclarecer muitas coisas
(por exemlo o livro Extending Linear Models in R)

Mas rapidamente:

O modelo linear que voce menciona y = a+bx

Pode ser reescrito como explicitando a distribuicao da resposta Y e
definindo uma funcao de sua média (no caso identidade) como uma funcao 
linear de sua variavel explicativa

Y ~ N(mu, sigma^2)
E(Y) = mu = nu = a + bx

O GLM geeneraliza isto entao de 2 maneiras:
  - a distribuição nao precisa ser normal
  - a relacao de mu e nu nao precisa ser identidade

No seu caso:

Y ~ N(n, p)
E(Y) = p
log(p/(1-p)) = nu = a + bx

Quanto a comparar com modelo nulo é só ajustado e usar a funcao anova para 
comparar, semelahnte aos lm no R

ex:

mod0 <- glm(y ~ 1, family = binomial)
mod1 <- glm(y ~ x, family = binomial)

anova(mod0, mod1)




On Tue, 17 Jan 2012, Caroline Figueiredo wrote:

> 
> Olá pessoal,
> 
> Estou com uma dúvida, que na verdade deve ser bem ridícula, mas realmente não sei a resposta. A questão é a
> seguinte:
> 
> Tenho dados binários como variável resposta ( 1 – vivo; 0 -  morto), e variáveis contínuas como  explicativas, e vi
> no The R book do Crawley que poderia usar GLM para construir um modelo, tendo binomial como família. Usei o seguinte
> código (os valores são fictícios, pois li meus dados direto da tabela, pois são muitas linhas).
> 
> status<-c(0,1,0,1,1,1,1,1,0,1)
> 
> altura<-c(2.2,1.3,4.5,6.7,1.3,4.5,1.2,2.0,7.8,1.2)
> 
> newy<-c(5.5,1.2,7.8,1.4,1.3,2.3,3.2,1.3,6.7,1.4)
> 
> m1<-glm(status~altura+newy+altura*newy, binomial)
> 
> E o summary deu isso:
> 
> 
> 
> Call:
> 
> glm(formula = status ~ altura + newy + altura * newy, family = binomial)
> 
>  
> 
> Deviance Residuals:
> 
>     Min       1Q   Median       3Q      Max 
> 
> -3.3122   0.1586   0.1969   0.2486   0.6394 
> 
>  
> 
> Coefficients:
> 
>             Estimate Std. Error z value Pr(>|z|)   
> 
> (Intercept)  0.24827    0.52797   0.470  0.63818   
> 
> altura       0.80654    0.20006   4.032 5.54e-05 ***
> 
> newy         0.23918    0.05101   4.689 2.74e-06 ***
> 
> altura:newy -0.04578    0.01753  -2.611  0.00903 **
> 
> ---
> 
> Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> 
>  
> 
> (Dispersion parameter for binomial family taken to be 1)
> 
>  
> 
>     Null deviance: 1705.0  on 7191  degrees of freedom
> 
> Residual deviance: 1610.4  on 7188  degrees of freedom
> 
> AIC: 1618.4
> 
>  
> 
> Number of Fisher Scoring iterations: 7
> 
>  
> 
> Minha dúvida é a seguinte: Qual é a equação ajustada para esse modelo? P. ex., se fosse uma regressão linear o
> modelo seria y~x, e a equação y=a + bx, mas e para esse modelo?
> 
> A outra dúvida é se poderia fazer uma anova para comparar esse modelo com o modelo nulo, e qual teste poderia usar,
> pois no exemplo do livro ele usa o test= chi, porém está comparando dois modelos diferentes,  e queria saber se
> posso usar para comparar com o modelo nulo também. Bem é isso pessoal, espero que possam me ajudar.
> 
> Obrigada,
> 
> Carol Figueiredo
> 
> 
>


Mais detalhes sobre a lista de discussão R-br