[R-br] GLM com alta proporção de zeros

Emerson Cotta Bodevan bodevan.ec em gmail.com
Qui Jul 23 15:27:37 -03 2020


Prezado Cezar, boa tarde.

Gostaria de entender melhor seus comentários...

1º) as VIs que teriam alta correlação seriam Faixa Etária com Número de
doenças crônicas e Escolaridade e Automedicação?
Neste caso... eu deveria optar por uma das VIs de cada par?
2º) Na frase: "Qtos casos você para cada desfecho para calcular a RP?" Você
pergunta "Quantos casos eu tenho para cada desfecho?" Se for, não
compreendi como isso afeta o cálculo da RP. Desculpe minha falta de
conhecimento.

Agradeço a atenção.

*Emerson*


Em qui., 23 de jul. de 2020 às 10:53, Cesar Rabak por (R-br) <
r-br em listas.c3sl.ufpr.br> escreveu:

> Emerson:
>
> Algum dos pares de VIs do seu problema apresenta correlação muito alta
> (pelos nomes vejo dois pares altamente candidatos)?
>
> Qtos casos você para cada desfecho para calcular a RP?
>
> --
> Cesar Rabak
>
> On Wed, Jul 22, 2020 at 5:03 PM Emerson Cotta Bodevan por (R-br) <
> r-br em listas.c3sl.ufpr.br> wrote:
>
>> Prezados, boa tarde.
>>
>> Estou com dificuldade para cálculo de Razão de Prevalência, com
>> respectivos IC95% para meus dados.
>>
>> Meus dados estão com a seguinte estrutura:
>> Variável resposta:
>> - ocorrência de AVC (0: Não, 1: Sim)
>> Variáveis independentes:
>> - Faixa Etária (18 a 28 - referência, 29 a 39, 40 a 59, 60 a 79 e 80 ou
>> mais)
>> - Escolaridade (Nunca estudou - referência, Ens Fun, Ens Med,  Ens Sup)
>> - Saúde (Excelente - referência, Muito Boa, Boa, Regular, Ruim)
>> - Número Doenças Crônicas (Nenhuma - referência, Uma, Duas ou mais)
>> - Automedicação (Não - referência, Sim)
>>
>> Importante dizer que tenho alta proporção de zeros na variável resposta:
>> 371 zeros e 11 uns.
>>
>> *Tentei inicialmente a regressão de poisson da seguinte forma:*
>> library(sandwich)
>> library(lmtest)
>> fit.poisson=glm(AVC~FE+Esc+Saude+NDC+Auto,data=dados,family=poisson)
>> *Obtive a seguinte mensagem:*
>> glm.fit: taxas ajustadas numericamente 0 ocorreu
>>
>>
>> *Vi que o problema pode ser o excesso de zeros. Então, lendo algumas
>> postagens aqui da lista tentei o seguinte:*
>> library(pscl)
>>
>> fit.hurdle<-hurdle(AVC~FE+Esc+Saude+NDC+Auto,dist="poisson",zero.dist="poisson",data=dados)
>> *Obtive a seguinte mensagem:*
>> Warning messages:
>> 1: glm.fit: fitted rates numerically 0 occurred
>> 2: glm.fit: fitted rates numerically 0 occurred
>> 3: In value[[3L]](cond) :
>>   Lapack routine dgesv: system is exactly singular: U[7,7] = 0FALSE
>> *Tentei então*
>>
>> fit.zeroinflPoisson<-zeroinfl(AVC~FE+Esc+Saude+NDC+Auto,dist="poisson",link="logit",data=dados)
>> *Obtive a seguinte mensagem:*
>> Warning messages:
>> 1: glm.fit: fitted probabilities numerically 0 or 1 occurred
>> 2: In value[[3L]](cond) :
>>   sistema é computacionalmente singular: condição recíproca número =
>> 8.9423e-20FALSE
>>
>> Não consigo encontrar uma saída. Alguém pode me dar uma dica?
>> Agradeço imensamente.
>> Atenciosamente,
>>
>> *Emerson*
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20200723/f0d133c2/attachment.html>


Mais detalhes sobre a lista de discussão R-br