
Carol sugiro uma revisao de modelos lineares geeneralizados em algum texto introdutorio que vai esclarecer muitas coisas (por exemlo o livro Extending Linear Models in R) Mas rapidamente: O modelo linear que voce menciona y = a+bx Pode ser reescrito como explicitando a distribuicao da resposta Y e definindo uma funcao de sua média (no caso identidade) como uma funcao linear de sua variavel explicativa Y ~ N(mu, sigma^2) E(Y) = mu = nu = a + bx O GLM geeneraliza isto entao de 2 maneiras: - a distribuição nao precisa ser normal - a relacao de mu e nu nao precisa ser identidade No seu caso: Y ~ N(n, p) E(Y) = p log(p/(1-p)) = nu = a + bx Quanto a comparar com modelo nulo é só ajustado e usar a funcao anova para comparar, semelahnte aos lm no R ex: mod0 <- glm(y ~ 1, family = binomial) mod1 <- glm(y ~ x, family = binomial) anova(mod0, mod1) On Tue, 17 Jan 2012, Caroline Figueiredo wrote:
Olá pessoal,
Estou com uma dúvida, que na verdade deve ser bem ridícula, mas realmente não sei a resposta. A questão é a seguinte:
Tenho dados binários como variável resposta ( 1 – vivo; 0 - morto), e variáveis contínuas como explicativas, e vi no The R book do Crawley que poderia usar GLM para construir um modelo, tendo binomial como família. Usei o seguinte código (os valores são fictícios, pois li meus dados direto da tabela, pois são muitas linhas).
status<-c(0,1,0,1,1,1,1,1,0,1)
altura<-c(2.2,1.3,4.5,6.7,1.3,4.5,1.2,2.0,7.8,1.2)
newy<-c(5.5,1.2,7.8,1.4,1.3,2.3,3.2,1.3,6.7,1.4)
m1<-glm(status~altura+newy+altura*newy, binomial)
E o summary deu isso:
Call:
glm(formula = status ~ altura + newy + altura * newy, family = binomial)
Deviance Residuals:
Min 1Q Median 3Q Max
-3.3122 0.1586 0.1969 0.2486 0.6394
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.24827 0.52797 0.470 0.63818
altura 0.80654 0.20006 4.032 5.54e-05 ***
newy 0.23918 0.05101 4.689 2.74e-06 ***
altura:newy -0.04578 0.01753 -2.611 0.00903 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 1705.0 on 7191 degrees of freedom
Residual deviance: 1610.4 on 7188 degrees of freedom
AIC: 1618.4
Number of Fisher Scoring iterations: 7
Minha dúvida é a seguinte: Qual é a equação ajustada para esse modelo? P. ex., se fosse uma regressão linear o modelo seria y~x, e a equação y=a + bx, mas e para esse modelo?
A outra dúvida é se poderia fazer uma anova para comparar esse modelo com o modelo nulo, e qual teste poderia usar, pois no exemplo do livro ele usa o test= chi, porém está comparando dois modelos diferentes, e queria saber se posso usar para comparar com o modelo nulo também. Bem é isso pessoal, espero que possam me ajudar.
Obrigada,
Carol Figueiredo