[R-br] Problema para plotar intervalo de confiança no ggplot2 para modelo GLM de Poisson com junção de níveis

Cesar Rabak cesar.rabak em gmail.com
Qua Jun 19 16:14:11 -03 2019


Já houve boas interações, mas seu exemplo me faz questionar: você escreveu
". . .  uma variável resposta (Consumption) e duas
explicativas, *sendo uma categórica e outra quali* . . .  " se a variável
Income é qualitativa, porque você deixa o programa tratá-la como numérica?

HTH
--
Cesar Rabak


On Wed, Jun 19, 2019 at 11:45 AM ASANTOS por (R-br) <
r-br em listas.c3sl.ufpr.br> wrote:

> Prezados Membros,
>
> Estou tentando plotar sem sucesso o intervalo em um modelo GLM de
> Poisson onde fiz a junção de níveis para a variável categórica Gender.
> Alguém baseado no CRM abaixo poderia dar uma luz?
>
> #Pacotes
> library(ggplot2)
> library(dplyr)
> library(tidyverse)
>
> #Dados inventados com uma variável resposta (Consumption) e duas
> explicativas, sendo uma categórica e outra quali
> Consumption <- c(501, 502, 503, 504, 26, 27, 50, 56, 63, 60, 72, 93, 78,
> 43, 59, 70, 53, 80)
> Gender <- gl(n = 3, k = 6, length = 3*6, labels = c("Male",
> "Female","hermaphrodite"), ordered = FALSE)
> Income <- c(5010, 5020, 5030, 5040, 260, 270, 550, 560, 680, 690, 720,
> 550, 560, 680, 690, 720,500,512)
> df3 <- data.frame(Consumption, Gender, Income)
> df3
>
> # GLM de Poisson
> fm1 <- glm(Consumption~Gender+Income, data=df3, family=poisson)
> summary(fm1)
>
> # ANOVA do modelo ajustado
> anova(fm1,test="Chi")
>
> #Comparo a variável Gender
> sort(tapply(df3$Consumption,df3$Gender,mean))
> Gender2<-df3$Gender
> levels(Gender2)
> levels(Gender2)[2]<-"Fem_Her"
> levels(Gender2)[3]<-"Fem_Her"
> levels(Gender2)
> fm2<-glm(Consumption~Gender2+Income, data=df3, family=poisson)
> anova(fm1,fm2,test="Chi")
> # 0.7824 Female/Hermaphrodite são iguais então eu junto
>
> #Faço a predição sobre o modelo final e dos intervalos de confiança
>
> pred <- predict(fm2, type="response", se.fit = TRUE)
> df3 = cbind(df3, pred = pred$fit)
> df3 = cbind(df3, se = pred$se.fit)
> df3 = cbind(df3, ucl=df3$pred + 1.96*df3$se)
> df3 = cbind(df3, lcl=df3$pred - 1.96*df3$se)
> df3 = cbind(df3, Gender2)
>
> df<-df3 %>%
>    dplyr::group_by(Income, Gender2) %>%
>    dplyr::summarize(Consumption = mean(Consumption, na.rm = TRUE))
> df<-as.data.frame(df)
>
> #Faço o plot usando o ggplot2
> df3  %>%
>    tidyr::gather(type, value, Consumption) %>%
>    ggplot(mapping=aes(x=type, y=value, color = Gender2)) +
>        geom_smooth(mapping=aes(ymin = lcl, ymax = ucl), stat =
> "identity") +
>    geom_point(df,mapping=aes(x=Income, y=Consumption, color = Gender2)) +
>    geom_line(mapping=aes(x=Income, y=pred))
>
> #
>
> Obrigado,
>
> Alexandre
>
> --
> ======================================================================
> Alexandre dos Santos
> Proteção Florestal
> IFMT - Instituto Federal de Educação, Ciência e Tecnologia de Mato Grosso
> Campus Cáceres
> Caixa Postal 244
> Avenida dos Ramires, s/n
> Bairro: Distrito Industrial
> Cáceres - MT                      CEP: 78.200-000
> Fone: (+55) 65 99686-6970 (VIVO) (+55) 65 3221-2674 (FIXO)
> e-mails:alexandresantosbr em yahoo.com.br
>          alexandre.santos em cas.ifmt.edu.br
> Lattes: http://lattes.cnpq.br/1360403201088680
> OrcID: orcid.org/0000-0001-8232-6722   -   ResearcherID: A-5790-2016
> Researchgate: www.researchgate.net/profile/Alexandre_Santos10
> LinkedIn: br.linkedin.com/in/alexandre-dos-santos-87961635
> Mendeley:www.mendeley.com/profiles/alexandre-dos-santos6/
> ======================================================================
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e fornea cdigo
> mnimo reproduzvel.
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20190619/8e8ddbe1/attachment.html>


Mais detalhes sobre a lista de discussão R-br