Coeficiente de correlação em glm é correto?

Boa noite pessoal, Venho colocar uma questão para os colegas estatísticos, até onde sei os modelos ajustados com GLM não são representados com o R^2. Porém, normalmente em revistas de entomologia (minha área) contam com editores da velha escola estatística que ficam batendo o pé para se colocar o R2 em todos os modelos ajustados, onde coloco a questão esta correto?Bom, tentei realizar o cálculo do R^2 usando aquelas abordagens que inúmeras vezes apareceram nas listasdo grupo do R sobre R^2 para modelos não lineares e fiz o seguinte cálculo: ##Ajustando o modelo com distribuição de erros binomial
m.model4<-glm((par/100)~densidade+I(densidade^2)+I(densidade^3), data=dados2,family="quasibinomial") > SQEm1<-summary(m.model4)$deviance^2*summary(m.model4)$df.residual#Soma de quadrados do erro > SQEm1 [1] 2387.366 > SQTm1<-var(par)*(length(par)-1)#Soma de quadrados total corrigida > R2<-1-SQEm1/SQTm1 > R2 [1] 0.8679119
Diante do problema apresentado isso esta correto? Obrigado, Alexandre dos Santos Engenheiro Florestal, MSc. Universidade Federal de Lavras Departamento de Entomologia Laboratório de Entomologia Florestal Caixa Postal 3037 37200-000 - Lavras/MG Fone: +55 (35) 3829-5122

Alexandre, Deviance é uma "soma de quadrados" e não um quadrado médio. Então você não precisa multiplicar pelo grau de liberdade. Veja y <- rnorm(20) m0 <- lm(y~1) m1 <- glm(y~1, family=gaussian) deviance(m0) deviance(m1) summary(m0)$sigma^2*df.residual(m0) summary(m1)$deviance Essas coisas de R² são complicadas. Pessoas da velha escola (ou não) sempre adorar uma medida em porcentagem. Deve trazer um certo conforto, sei lá. Penso que você deva argumentar outros aspectos da análise do que tentar justificar que tá tudo ok porque uma espécia de R² foi alto (ou não). De qualquer forma, uma media seria a porcentagem de deviance do modelo final contra o modelo nulo, algo como x <- 1:30 y <- rpois(x, x/4) m0 <- glm(y~1, family=poisson) m1 <- glm(y~x, family=poisson) 1-deviance(m1)/deviance(m0) À disposição. Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================

voce pode, de fato, usar algo como um R^2 marginal: R2M = 1 - soma((y - y.predito)^2)/soma((y-y.barra)^2) preocupa-me, entretanto, sua definicao do modelo. para familia (quasi-)binomial, a variavel resposta e' algo binario ou uma matrix de 2 colunas com o numero de sucessos/fracassos. par/100 definitivamente nao e' binario, a menos que a variavel (nao-descrita) assuma apenas 0 ou 100. b 2011/8/21 Alexandre Santos <alexandresantosbr@yahoo.com.br>:
Boa noite pessoal,
Venho colocar uma questão para os colegas estatísticos, até onde sei os modelos ajustados com GLM não são representados com o R^2. Porém, normalmente em revistas de entomologia (minha área) contam com editores da velha escola estatística que ficam batendo o pé para se colocar o R2 em todos os modelos ajustados, onde coloco a questão esta correto? Bom, tentei realizar o cálculo do R^2 usando aquelas abordagens que inúmeras vezes apareceram nas listas do grupo do R sobre R^2 para modelos não lineares e fiz o seguinte cálculo:
##Ajustando o modelo com distribuição de erros binomial
m.model4<-glm((par/100)~densidade+I(densidade^2)+I(densidade^3), data=dados2,family="quasibinomial")
SQEm1<-summary(m.model4)$deviance^2*summary(m.model4)$df.residual#Soma de quadrados do erro SQEm1 [1] 2387.366 SQTm1<-var(par)*(length(par)-1)#Soma de quadrados total corrigida R2<-1-SQEm1/SQTm1 R2 [1] 0.8679119
Diante do problema apresentado isso esta correto? Obrigado,
Alexandre dos Santos Engenheiro Florestal, MSc. Universidade Federal de Lavras Departamento de Entomologia Laboratório de Entomologia Florestal Caixa Postal 3037 37200-000 - Lavras/MG Fone: +55 (35) 3829-5122
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Successful people ask better questions, and as a result, they get better answers. (Tony Robbins)

Obrigado Walmes e Benilton foi bem esclarecedor. E Benilton sobre a variável par que utilizei para ajustar o modelo quasebinomial do exemplo eram valores entre 0 e 100 que dividi por 100. Redobrados agradecimentos, Alexandre dos Santos Engenheiro Florestal, MSc. Universidade Federal de Lavras Departamento de Entomologia Laboratório de Entomologia Florestal Caixa Postal 3037 37200-000 - Lavras/MG Fone: +55 (35) 3829-5122 ________________________________ De: Benilton Carvalho <beniltoncarvalho@gmail.com> Para: r-br@listas.c3sl.ufpr.br; Alexandre Santos <alexandresantosbr@yahoo.com.br> Enviadas: Domingo, 21 de Agosto de 2011 19:19 Assunto: Re: [R-br] Coeficiente de correlação em glm é correto? voce pode, de fato, usar algo como um R^2 marginal: R2M = 1 - soma((y - y.predito)^2)/soma((y-y.barra)^2) preocupa-me, entretanto, sua definicao do modelo. para familia (quasi-)binomial, a variavel resposta e' algo binario ou uma matrix de 2 colunas com o numero de sucessos/fracassos. par/100 definitivamente nao e' binario, a menos que a variavel (nao-descrita) assuma apenas 0 ou 100. b 2011/8/21 Alexandre Santos <alexandresantosbr@yahoo.com.br>:
Boa noite pessoal,
Venho colocar uma questão para os colegas estatísticos, até onde sei os modelos ajustados com GLM não são representados com o R^2. Porém, normalmente em revistas de entomologia (minha área) contam com editores da velha escola estatística que ficam batendo o pé para se colocar o R2 em todos os modelos ajustados, onde coloco a questão esta correto? Bom, tentei realizar o cálculo do R^2 usando aquelas abordagens que inúmeras vezes apareceram nas listas do grupo do R sobre R^2 para modelos não lineares e fiz o seguinte cálculo:
##Ajustando o modelo com distribuição de erros binomial
m.model4<-glm((par/100)~densidade+I(densidade^2)+I(densidade^3), data=dados2,family="quasibinomial")
SQEm1<-summary(m.model4)$deviance^2*summary(m.model4)$df.residual#Soma de quadrados do erro SQEm1 [1] 2387.366 SQTm1<-var(par)*(length(par)-1)#Soma de quadrados total corrigida R2<-1-SQEm1/SQTm1 R2 [1] 0.8679119
Diante do problema apresentado isso esta correto? Obrigado,
Alexandre dos Santos Engenheiro Florestal, MSc. Universidade Federal de Lavras Departamento de Entomologia Laboratório de Entomologia Florestal Caixa Postal 3037 37200-000 - Lavras/MG Fone: +55 (35) 3829-5122
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Successful people ask better questions, and as a result, they get better answers. (Tony Robbins)

Alexandre, Voce precisa rever o seu ajuste. Valores entre 0 e 100 divididos por 100 nao e' a forma correta de ajustar um modelo binomial, conforme eu expliquei no email anterior. b
participantes (3)
-
Alexandre Santos
-
Benilton Carvalho
-
Walmes Zeviani