GLM com alta proporção de zeros

Prezados, boa tarde. Estou com dificuldade para cálculo de Razão de Prevalência, com respectivos IC95% para meus dados. Meus dados estão com a seguinte estrutura: Variável resposta: - ocorrência de AVC (0: Não, 1: Sim) Variáveis independentes: - Faixa Etária (18 a 28 - referência, 29 a 39, 40 a 59, 60 a 79 e 80 ou mais) - Escolaridade (Nunca estudou - referência, Ens Fun, Ens Med, Ens Sup) - Saúde (Excelente - referência, Muito Boa, Boa, Regular, Ruim) - Número Doenças Crônicas (Nenhuma - referência, Uma, Duas ou mais) - Automedicação (Não - referência, Sim) Importante dizer que tenho alta proporção de zeros na variável resposta: 371 zeros e 11 uns. *Tentei inicialmente a regressão de poisson da seguinte forma:* library(sandwich) library(lmtest) fit.poisson=glm(AVC~FE+Esc+Saude+NDC+Auto,data=dados,family=poisson) *Obtive a seguinte mensagem:* glm.fit: taxas ajustadas numericamente 0 ocorreu *Vi que o problema pode ser o excesso de zeros. Então, lendo algumas postagens aqui da lista tentei o seguinte:* library(pscl) fit.hurdle<-hurdle(AVC~FE+Esc+Saude+NDC+Auto,dist="poisson",zero.dist="poisson",data=dados) *Obtive a seguinte mensagem:* Warning messages: 1: glm.fit: fitted rates numerically 0 occurred 2: glm.fit: fitted rates numerically 0 occurred 3: In value[[3L]](cond) : Lapack routine dgesv: system is exactly singular: U[7,7] = 0FALSE *Tentei então* fit.zeroinflPoisson<-zeroinfl(AVC~FE+Esc+Saude+NDC+Auto,dist="poisson",link="logit",data=dados) *Obtive a seguinte mensagem:* Warning messages: 1: glm.fit: fitted probabilities numerically 0 or 1 occurred 2: In value[[3L]](cond) : sistema é computacionalmente singular: condição recíproca número = 8.9423e-20FALSE Não consigo encontrar uma saída. Alguém pode me dar uma dica? Agradeço imensamente. Atenciosamente, *Emerson*

Prezado Emerson, Veja se este pacote te ajuda a avançar. https://cran.r-project.org/web/packages/ZIM/ZIM.pdf Att, On Wed, Jul 22, 2020 at 5:03 PM Emerson Cotta Bodevan por (R-br) < r-br@listas.c3sl.ufpr.br> wrote:
Prezados, boa tarde.
Estou com dificuldade para cálculo de Razão de Prevalência, com respectivos IC95% para meus dados.
Meus dados estão com a seguinte estrutura: Variável resposta: - ocorrência de AVC (0: Não, 1: Sim) Variáveis independentes: - Faixa Etária (18 a 28 - referência, 29 a 39, 40 a 59, 60 a 79 e 80 ou mais) - Escolaridade (Nunca estudou - referência, Ens Fun, Ens Med, Ens Sup) - Saúde (Excelente - referência, Muito Boa, Boa, Regular, Ruim) - Número Doenças Crônicas (Nenhuma - referência, Uma, Duas ou mais) - Automedicação (Não - referência, Sim)
Importante dizer que tenho alta proporção de zeros na variável resposta: 371 zeros e 11 uns.
*Tentei inicialmente a regressão de poisson da seguinte forma:* library(sandwich) library(lmtest) fit.poisson=glm(AVC~FE+Esc+Saude+NDC+Auto,data=dados,family=poisson) *Obtive a seguinte mensagem:* glm.fit: taxas ajustadas numericamente 0 ocorreu
*Vi que o problema pode ser o excesso de zeros. Então, lendo algumas postagens aqui da lista tentei o seguinte:* library(pscl)
fit.hurdle<-hurdle(AVC~FE+Esc+Saude+NDC+Auto,dist="poisson",zero.dist="poisson",data=dados) *Obtive a seguinte mensagem:* Warning messages: 1: glm.fit: fitted rates numerically 0 occurred 2: glm.fit: fitted rates numerically 0 occurred 3: In value[[3L]](cond) : Lapack routine dgesv: system is exactly singular: U[7,7] = 0FALSE *Tentei então*
fit.zeroinflPoisson<-zeroinfl(AVC~FE+Esc+Saude+NDC+Auto,dist="poisson",link="logit",data=dados) *Obtive a seguinte mensagem:* Warning messages: 1: glm.fit: fitted probabilities numerically 0 or 1 occurred 2: In value[[3L]](cond) : sistema é computacionalmente singular: condição recíproca número = 8.9423e-20FALSE
Não consigo encontrar uma saída. Alguém pode me dar uma dica? Agradeço imensamente. Atenciosamente,
*Emerson* _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Rodrigo Campos

Prezado Rodrigo, boa tarde. Ainda estou tentando entender o pacote. Qualquer novidade, retorno aqui. Obrigado. *Emerson* Em qua., 22 de jul. de 2020 às 18:06, Rodrigo Campos por (R-br) < r-br@listas.c3sl.ufpr.br> escreveu:
Prezado Emerson, Veja se este pacote te ajuda a avançar. https://cran.r-project.org/web/packages/ZIM/ZIM.pdf Att,
On Wed, Jul 22, 2020 at 5:03 PM Emerson Cotta Bodevan por (R-br) < r-br@listas.c3sl.ufpr.br> wrote:
Prezados, boa tarde.
Estou com dificuldade para cálculo de Razão de Prevalência, com respectivos IC95% para meus dados.
Meus dados estão com a seguinte estrutura: Variável resposta: - ocorrência de AVC (0: Não, 1: Sim) Variáveis independentes: - Faixa Etária (18 a 28 - referência, 29 a 39, 40 a 59, 60 a 79 e 80 ou mais) - Escolaridade (Nunca estudou - referência, Ens Fun, Ens Med, Ens Sup) - Saúde (Excelente - referência, Muito Boa, Boa, Regular, Ruim) - Número Doenças Crônicas (Nenhuma - referência, Uma, Duas ou mais) - Automedicação (Não - referência, Sim)
Importante dizer que tenho alta proporção de zeros na variável resposta: 371 zeros e 11 uns.
*Tentei inicialmente a regressão de poisson da seguinte forma:* library(sandwich) library(lmtest) fit.poisson=glm(AVC~FE+Esc+Saude+NDC+Auto,data=dados,family=poisson) *Obtive a seguinte mensagem:* glm.fit: taxas ajustadas numericamente 0 ocorreu
*Vi que o problema pode ser o excesso de zeros. Então, lendo algumas postagens aqui da lista tentei o seguinte:* library(pscl)
fit.hurdle<-hurdle(AVC~FE+Esc+Saude+NDC+Auto,dist="poisson",zero.dist="poisson",data=dados) *Obtive a seguinte mensagem:* Warning messages: 1: glm.fit: fitted rates numerically 0 occurred 2: glm.fit: fitted rates numerically 0 occurred 3: In value[[3L]](cond) : Lapack routine dgesv: system is exactly singular: U[7,7] = 0FALSE *Tentei então*
fit.zeroinflPoisson<-zeroinfl(AVC~FE+Esc+Saude+NDC+Auto,dist="poisson",link="logit",data=dados) *Obtive a seguinte mensagem:* Warning messages: 1: glm.fit: fitted probabilities numerically 0 or 1 occurred 2: In value[[3L]](cond) : sistema é computacionalmente singular: condição recíproca número = 8.9423e-20FALSE
Não consigo encontrar uma saída. Alguém pode me dar uma dica? Agradeço imensamente. Atenciosamente,
*Emerson* _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Rodrigo Campos
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Prezado Igor, boa tarde. Desculpe não ter escrito, mas já havia tentado o modelo logístico e também houve mensagem de erro: fit.logistica<-glm(AVC~FE+Esc+Saude+NDC+Auto,data=dados,family=binomial(link='logit')) *Retornou* Warning message: glm.fit: probabilidades ajustadas numericamente 0 ou 1 ocorreu Att., *Emerson* Em qua., 22 de jul. de 2020 às 19:05, Igor Eloi <eloi.igor@yandex.com> escreveu:
Olá Emerson, tudo bom?
Como sua resposta é dicotomica (sim e não), você deve empregar uma regressão logistica.
Com isso, certamente as coisas fluirão melhor.
Abraços
22.07.2020, 17:03, "Emerson Cotta Bodevan por (R-br)" < r-br@listas.c3sl.ufpr.br>:
Prezados, boa tarde.
Estou com dificuldade para cálculo de Razão de Prevalência, com respectivos IC95% para meus dados.
Meus dados estão com a seguinte estrutura: Variável resposta: - ocorrência de AVC (0: Não, 1: Sim) Variáveis independentes: - Faixa Etária (18 a 28 - referência, 29 a 39, 40 a 59, 60 a 79 e 80 ou mais) - Escolaridade (Nunca estudou - referência, Ens Fun, Ens Med, Ens Sup) - Saúde (Excelente - referência, Muito Boa, Boa, Regular, Ruim) - Número Doenças Crônicas (Nenhuma - referência, Uma, Duas ou mais) - Automedicação (Não - referência, Sim)
Importante dizer que tenho alta proporção de zeros na variável resposta: 371 zeros e 11 uns.
*Tentei inicialmente a regressão de poisson da seguinte forma:* library(sandwich) library(lmtest) fit.poisson=glm(AVC~FE+Esc+Saude+NDC+Auto,data=dados,family=poisson) *Obtive a seguinte mensagem:* glm.fit: taxas ajustadas numericamente 0 ocorreu
*Vi que o problema pode ser o excesso de zeros. Então, lendo algumas postagens aqui da lista tentei o seguinte:* library(pscl)
fit.hurdle<-hurdle(AVC~FE+Esc+Saude+NDC+Auto,dist="poisson",zero.dist="poisson",data=dados) *Obtive a seguinte mensagem:* Warning messages: 1: glm.fit: fitted rates numerically 0 occurred 2: glm.fit: fitted rates numerically 0 occurred 3: In value[[3L]](cond) : Lapack routine dgesv: system is exactly singular: U[7,7] = 0FALSE *Tentei então*
fit.zeroinflPoisson<-zeroinfl(AVC~FE+Esc+Saude+NDC+Auto,dist="poisson",link="logit",data=dados) *Obtive a seguinte mensagem:* Warning messages: 1: glm.fit: fitted probabilities numerically 0 or 1 occurred 2: In value[[3L]](cond) : sistema é computacionalmente singular: condição recíproca número = 8.9423e-20FALSE
Não consigo encontrar uma saída. Alguém pode me dar uma dica? Agradeço imensamente. Atenciosamente,
*Emerson* ,
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Emerson: Algum dos pares de VIs do seu problema apresenta correlação muito alta (pelos nomes vejo dois pares altamente candidatos)? Qtos casos você para cada desfecho para calcular a RP? -- Cesar Rabak On Wed, Jul 22, 2020 at 5:03 PM Emerson Cotta Bodevan por (R-br) < r-br@listas.c3sl.ufpr.br> wrote:
Prezados, boa tarde.
Estou com dificuldade para cálculo de Razão de Prevalência, com respectivos IC95% para meus dados.
Meus dados estão com a seguinte estrutura: Variável resposta: - ocorrência de AVC (0: Não, 1: Sim) Variáveis independentes: - Faixa Etária (18 a 28 - referência, 29 a 39, 40 a 59, 60 a 79 e 80 ou mais) - Escolaridade (Nunca estudou - referência, Ens Fun, Ens Med, Ens Sup) - Saúde (Excelente - referência, Muito Boa, Boa, Regular, Ruim) - Número Doenças Crônicas (Nenhuma - referência, Uma, Duas ou mais) - Automedicação (Não - referência, Sim)
Importante dizer que tenho alta proporção de zeros na variável resposta: 371 zeros e 11 uns.
*Tentei inicialmente a regressão de poisson da seguinte forma:* library(sandwich) library(lmtest) fit.poisson=glm(AVC~FE+Esc+Saude+NDC+Auto,data=dados,family=poisson) *Obtive a seguinte mensagem:* glm.fit: taxas ajustadas numericamente 0 ocorreu
*Vi que o problema pode ser o excesso de zeros. Então, lendo algumas postagens aqui da lista tentei o seguinte:* library(pscl)
fit.hurdle<-hurdle(AVC~FE+Esc+Saude+NDC+Auto,dist="poisson",zero.dist="poisson",data=dados) *Obtive a seguinte mensagem:* Warning messages: 1: glm.fit: fitted rates numerically 0 occurred 2: glm.fit: fitted rates numerically 0 occurred 3: In value[[3L]](cond) : Lapack routine dgesv: system is exactly singular: U[7,7] = 0FALSE *Tentei então*
fit.zeroinflPoisson<-zeroinfl(AVC~FE+Esc+Saude+NDC+Auto,dist="poisson",link="logit",data=dados) *Obtive a seguinte mensagem:* Warning messages: 1: glm.fit: fitted probabilities numerically 0 or 1 occurred 2: In value[[3L]](cond) : sistema é computacionalmente singular: condição recíproca número = 8.9423e-20FALSE
Não consigo encontrar uma saída. Alguém pode me dar uma dica? Agradeço imensamente. Atenciosamente,
*Emerson* _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Prezado Cezar, boa tarde. Gostaria de entender melhor seus comentários... 1º) as VIs que teriam alta correlação seriam Faixa Etária com Número de doenças crônicas e Escolaridade e Automedicação? Neste caso... eu deveria optar por uma das VIs de cada par? 2º) Na frase: "Qtos casos você para cada desfecho para calcular a RP?" Você pergunta "Quantos casos eu tenho para cada desfecho?" Se for, não compreendi como isso afeta o cálculo da RP. Desculpe minha falta de conhecimento. Agradeço a atenção. *Emerson* Em qui., 23 de jul. de 2020 às 10:53, Cesar Rabak por (R-br) < r-br@listas.c3sl.ufpr.br> escreveu:
Emerson:
Algum dos pares de VIs do seu problema apresenta correlação muito alta (pelos nomes vejo dois pares altamente candidatos)?
Qtos casos você para cada desfecho para calcular a RP?
-- Cesar Rabak
On Wed, Jul 22, 2020 at 5:03 PM Emerson Cotta Bodevan por (R-br) < r-br@listas.c3sl.ufpr.br> wrote:
Prezados, boa tarde.
Estou com dificuldade para cálculo de Razão de Prevalência, com respectivos IC95% para meus dados.
Meus dados estão com a seguinte estrutura: Variável resposta: - ocorrência de AVC (0: Não, 1: Sim) Variáveis independentes: - Faixa Etária (18 a 28 - referência, 29 a 39, 40 a 59, 60 a 79 e 80 ou mais) - Escolaridade (Nunca estudou - referência, Ens Fun, Ens Med, Ens Sup) - Saúde (Excelente - referência, Muito Boa, Boa, Regular, Ruim) - Número Doenças Crônicas (Nenhuma - referência, Uma, Duas ou mais) - Automedicação (Não - referência, Sim)
Importante dizer que tenho alta proporção de zeros na variável resposta: 371 zeros e 11 uns.
*Tentei inicialmente a regressão de poisson da seguinte forma:* library(sandwich) library(lmtest) fit.poisson=glm(AVC~FE+Esc+Saude+NDC+Auto,data=dados,family=poisson) *Obtive a seguinte mensagem:* glm.fit: taxas ajustadas numericamente 0 ocorreu
*Vi que o problema pode ser o excesso de zeros. Então, lendo algumas postagens aqui da lista tentei o seguinte:* library(pscl)
fit.hurdle<-hurdle(AVC~FE+Esc+Saude+NDC+Auto,dist="poisson",zero.dist="poisson",data=dados) *Obtive a seguinte mensagem:* Warning messages: 1: glm.fit: fitted rates numerically 0 occurred 2: glm.fit: fitted rates numerically 0 occurred 3: In value[[3L]](cond) : Lapack routine dgesv: system is exactly singular: U[7,7] = 0FALSE *Tentei então*
fit.zeroinflPoisson<-zeroinfl(AVC~FE+Esc+Saude+NDC+Auto,dist="poisson",link="logit",data=dados) *Obtive a seguinte mensagem:* Warning messages: 1: glm.fit: fitted probabilities numerically 0 or 1 occurred 2: In value[[3L]](cond) : sistema é computacionalmente singular: condição recíproca número = 8.9423e-20FALSE
Não consigo encontrar uma saída. Alguém pode me dar uma dica? Agradeço imensamente. Atenciosamente,
*Emerson* _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
participantes (4)
-
Cesar Rabak
-
Emerson Cotta Bodevan
-
Igor Eloi
-
Rodrigo Campos