
Olá Estou trabalhando com a taxa de uma doença e gostaria de rodar um modelo de regressão. Meus dados não apresentaram distribuição normal e por teste de aderência deu uma distribuição lognomal -> fitdistr(tx_esqui, "lognormal") meanlog sdlog 6.25725753 1.90754231 (0.11630491) (0.08223999) ->ks.test(tx_esqui, "plnorm", sdlog=1.90754231, meanlog=6.25725753,alternative=c("two.sided")) One-sample Kolmogorov-Smirnov test data: tx_esqui D = 0.0701, p-value = 0.1419 alternative hypothesis: two-sided Tem como eu rodar um modelo de regressão com essa variável? Como fazê-lo? Qual a melhor forma de trabalhar com essa variável? Abraços Segue a minha variável dependente: structure(list(tx_esqui = c(3L, 3L, 4L, 4L, 4L, 4L, 8L, 8L, 8L, 9L, 10L, 10L, 19L, 22L, 22L, 23L, 23L, 25L, 25L, 26L, 27L, 28L, 29L, 30L, 31L, 32L, 34L, 36L, 39L, 41L, 42L, 45L, 46L, 49L, 49L, 56L, 57L, 58L, 58L, 59L, 61L, 62L, 62L, 68L, 70L, 74L, 76L, 80L, 82L, 82L, 83L, 83L, 86L, 101L, 102L, 107L, 107L, 112L, 113L, 118L, 120L, 121L, 123L, 126L, 135L, 138L, 140L, 153L, 156L, 158L, 179L, 191L, 200L, 201L, 204L, 207L, 209L, 212L, 215L, 223L, 227L, 228L, 233L, 247L, 248L, 249L, 255L, 257L, 258L, 258L, 259L, 264L, 274L, 277L, 279L, 287L, 297L, 309L, 310L, 313L, 314L, 326L, 328L, 329L, 331L, 332L, 332L, 340L, 354L, 358L, 365L, 372L, 379L, 383L, 395L, 396L, 418L, 423L, 447L, 449L, 451L, 453L, 493L, 532L, 535L, 553L, 554L, 565L, 573L, 581L, 584L, 599L, 603L, 604L, 611L, 672L, 703L, 708L, 727L, 756L, 799L, 809L, 812L, 815L, 816L, 862L, 864L, 866L, 932L, 946L, 951L, 964L, 969L, 983L, 985L, 989L, 1032L, 1102L, 1102L, 1112L, 1112L, 1199L, 1218L, 1245L, 1252L, 1283L, 1302L, 1327L, 1327L, 1328L, 1340L, 1367L, 1382L, 1413L, 1441L, 1468L, 1487L, 1493L, 1512L, 1523L, 1567L, 1576L, 1585L, 1598L, 1620L, 1623L, 1634L, 1664L, 1704L, 1813L, 1816L, 1824L, 1842L, 1892L, 1939L, 1977L, 2010L, 2035L, 2060L, 2100L, 2152L, 2184L, 2210L, 2248L, 2282L, 2288L, 2358L, 2462L, 2473L, 2527L, 2541L, 2555L, 2576L, 2603L, 2705L, 2711L, 2895L, 2916L, 2958L, 2963L, 3088L, 3110L, 3304L, 3427L, 3489L, 3535L, 3629L, 3638L, 3682L, 3704L, 3796L, 3932L, 4160L, 4293L, 4294L, 4366L, 4516L, 4715L, 4746L, 5152L, 5263L, 5307L, 5823L, 6025L, 6306L, 6313L, 6330L, 6649L, 7114L, 7158L, 7340L, 7488L, 7665L, 8055L, 8394L, 8773L, 8850L, 8918L, 9273L, 9356L, 10110L, 10281L, 10310L, 10519L, 11111L, 13525L, 14465L, 14955L, 16629L)), .Names = "tx_esqui", class = "data.frame", row.names = c(NA, -269L)) -- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383 Tel: (21) 94429486/78101651 id: 123*20942

Você tá aplicando testes de aderência na variável resposta marginal às covariáveis o que é bem diferente de aplicar testes os resíduos da regressão. Ajuste o modelo de regressão e verifique se os resíduos têm distribuição normal. De qualquer forma é possível ajustar um modelo de regressão lognormal sim, porém, a tua distribuição marginal pode ser lognormal, mas a dos resíduos do modelo de regressão podem ser qualquer outra coisa. Consulte um estatístico local. À disposição. Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================

Se vc pretende modelar a taxa como variável resposta uma sugestão seria usar Poisson ou binomial negativa. Mas isto obviamente não tira a necessidade de rever os resíduos e checar se o ajuste foi apropriado como colocado pelo Walmes. Abs, Daniel 2012/4/29 Walmes Zeviani <walmeszeviani@gmail.com>
Você tá aplicando testes de aderência na variável resposta marginal às covariáveis o que é bem diferente de aplicar testes os resíduos da regressão. Ajuste o modelo de regressão e verifique se os resíduos têm distribuição normal. De qualquer forma é possível ajustar um modelo de regressão lognormal sim, porém, a tua distribuição marginal pode ser lognormal, mas a dos resíduos do modelo de regressão podem ser qualquer outra coisa. Consulte um estatístico local.
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Oi Mesmo minha taxa não seguindo uma distribuição de Poisson ou Binomial negativa? Abraços Enviado via iPad Em Apr 29, 2012, às 1:19 PM, Daniel C Bezerra <danielcbezerra@gmail.com> escreveu: Se vc pretende modelar a taxa como variável resposta uma sugestão seria usar Poisson ou binomial negativa. Mas isto obviamente não tira a necessidade de rever os resíduos e checar se o ajuste foi apropriado como colocado pelo Walmes. Abs, Daniel 2012/4/29 Walmes Zeviani <walmeszeviani@gmail.com>
Você tá aplicando testes de aderência na variável resposta marginal às covariáveis o que é bem diferente de aplicar testes os resíduos da regressão. Ajuste o modelo de regressão e verifique se os resíduos têm distribuição normal. De qualquer forma é possível ajustar um modelo de regressão lognormal sim, porém, a tua distribuição marginal pode ser lognormal, mas a dos resíduos do modelo de regressão podem ser qualquer outra coisa. Consulte um estatístico local.
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Sim. Dê uma olhada no comentário do Walmes. Vamos imaginar que vc quer ajustar um modelo de regressão linear múltipla, já que este exemplo usualmente é mais simples de entender. O mais importante a ser verificado é se após o ajuste das co-variáveis os resíduos seguem distribuição normal. Embora isto seja mais provável se a variável resposta tem distribuição normal, isto não necessariamente é verdade. Portanto, examinar apenas a distribuição da variável resposta não é suficiente. Esta se ideia se aplica de maneira análoga a outros modelos assumindo outras distribuições. O que eu comentei é que uma maneira frequente de modelar uma taxa é usar a contagem de eventos na variável resposta, usando a população como offset junto as variáveis independentes. Mas depois vc tem que examinar o ajuste do modelo como já comentado. Grande abraço, Daniel 2012/4/29 Sérgio Henrique <sergio.edfisica@gmail.com>
Oi
Mesmo minha taxa não seguindo uma distribuição de Poisson ou Binomial negativa?
Abraços
Enviado via iPad
Em Apr 29, 2012, às 1:19 PM, Daniel C Bezerra <danielcbezerra@gmail.com> escreveu:
Se vc pretende modelar a taxa como variável resposta uma sugestão seria usar Poisson ou binomial negativa.
Mas isto obviamente não tira a necessidade de rever os resíduos e checar se o ajuste foi apropriado como colocado pelo Walmes.
Abs,
Daniel
2012/4/29 Walmes Zeviani <walmeszeviani@gmail.com>
Você tá aplicando testes de aderência na variável resposta marginal às covariáveis o que é bem diferente de aplicar testes os resíduos da regressão. Ajuste o modelo de regressão e verifique se os resíduos têm distribuição normal. De qualquer forma é possível ajustar um modelo de regressão lognormal sim, porém, a tua distribuição marginal pode ser lognormal, mas a dos resíduos do modelo de regressão podem ser qualquer outra coisa. Consulte um estatístico local.
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Oi Ok Daniel! Obrigado mais uma vez... Enviado via iPad Em Apr 29, 2012, às 5:07 PM, Daniel C Bezerra <danielcbezerra@gmail.com> escreveu: Sim. Dê uma olhada no comentário do Walmes. Vamos imaginar que vc quer ajustar um modelo de regressão linear múltipla, já que este exemplo usualmente é mais simples de entender. O mais importante a ser verificado é se após o ajuste das co-variáveis os resíduos seguem distribuição normal. Embora isto seja mais provável se a variável resposta tem distribuição normal, isto não necessariamente é verdade. Portanto, examinar apenas a distribuição da variável resposta não é suficiente. Esta se ideia se aplica de maneira análoga a outros modelos assumindo outras distribuições. O que eu comentei é que uma maneira frequente de modelar uma taxa é usar a contagem de eventos na variável resposta, usando a população como offset junto as variáveis independentes. Mas depois vc tem que examinar o ajuste do modelo como já comentado. Grande abraço, Daniel 2012/4/29 Sérgio Henrique <sergio.edfisica@gmail.com>
Oi
Mesmo minha taxa não seguindo uma distribuição de Poisson ou Binomial negativa?
Abraços
Enviado via iPad
Em Apr 29, 2012, às 1:19 PM, Daniel C Bezerra <danielcbezerra@gmail.com> escreveu:
Se vc pretende modelar a taxa como variável resposta uma sugestão seria usar Poisson ou binomial negativa.
Mas isto obviamente não tira a necessidade de rever os resíduos e checar se o ajuste foi apropriado como colocado pelo Walmes.
Abs,
Daniel
2012/4/29 Walmes Zeviani <walmeszeviani@gmail.com>
Você tá aplicando testes de aderência na variável resposta marginal às covariáveis o que é bem diferente de aplicar testes os resíduos da regressão. Ajuste o modelo de regressão e verifique se os resíduos têm distribuição normal. De qualquer forma é possível ajustar um modelo de regressão lognormal sim, porém, a tua distribuição marginal pode ser lognormal, mas a dos resíduos do modelo de regressão podem ser qualquer outra coisa. Consulte um estatístico local.
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Como vc sabe q nao segue Poisson/Binomial Negativa? Imagino que vc saiba que os "testes de adequacidade/aderencia" te dao resultados que podem nao ser os corretos... Assumindo que o sono nao esteja me atrapalhando muito, veja o q vc obtem no caso abaixo... set.seed(1) x = rbeta(100, 10, 10) ks.test(x, 'dbeta', shape1=10, shape2=10) b 2012/4/29 Sérgio Henrique <sergio.edfisica@gmail.com>:
Oi
Mesmo minha taxa não seguindo uma distribuição de Poisson ou Binomial negativa?
Abraços
Enviado via iPad
Em Apr 29, 2012, às 1:19 PM, Daniel C Bezerra <danielcbezerra@gmail.com> escreveu:
Se vc pretende modelar a taxa como variável resposta uma sugestão seria usar Poisson ou binomial negativa.
Mas isto obviamente não tira a necessidade de rever os resíduos e checar se o ajuste foi apropriado como colocado pelo Walmes.
Abs,
Daniel
2012/4/29 Walmes Zeviani <walmeszeviani@gmail.com>
Você tá aplicando testes de aderência na variável resposta marginal às covariáveis o que é bem diferente de aplicar testes os resíduos da regressão. Ajuste o modelo de regressão e verifique se os resíduos têm distribuição normal. De qualquer forma é possível ajustar um modelo de regressão lognormal sim, porém, a tua distribuição marginal pode ser lognormal, mas a dos resíduos do modelo de regressão podem ser qualquer outra coisa. Consulte um estatístico local.
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Benilton O resultado é: D = 3.1696 p-value < 2.2e-16 Abraços Em Apr 29, 2012, às 5:10 PM, Benilton Carvalho <beniltoncarvalho@gmail.com> escreveu:
Como vc sabe q nao segue Poisson/Binomial Negativa?
Imagino que vc saiba que os "testes de adequacidade/aderencia" te dao resultados que podem nao ser os corretos...
Assumindo que o sono nao esteja me atrapalhando muito, veja o q vc obtem no caso abaixo...
set.seed(1) x = rbeta(100, 10, 10) ks.test(x, 'dbeta', shape1=10, shape2=10)
b
2012/4/29 Sérgio Henrique <sergio.edfisica@gmail.com>:
Oi
Mesmo minha taxa não seguindo uma distribuição de Poisson ou Binomial negativa?
Abraços
Enviado via iPad
Em Apr 29, 2012, às 1:19 PM, Daniel C Bezerra <danielcbezerra@gmail.com> escreveu:
Se vc pretende modelar a taxa como variável resposta uma sugestão seria usar Poisson ou binomial negativa.
Mas isto obviamente não tira a necessidade de rever os resíduos e checar se o ajuste foi apropriado como colocado pelo Walmes.
Abs,
Daniel
2012/4/29 Walmes Zeviani <walmeszeviani@gmail.com>
Você tá aplicando testes de aderência na variável resposta marginal às covariáveis o que é bem diferente de aplicar testes os resíduos da regressão. Ajuste o modelo de regressão e verifique se os resíduos têm distribuição normal. De qualquer forma é possível ajustar um modelo de regressão lognormal sim, porém, a tua distribuição marginal pode ser lognormal, mas a dos resíduos do modelo de regressão podem ser qualquer outra coisa. Consulte um estatístico local.
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Eu sei qual eh o resultado. :) A msg implicita eh q vc gerou dados de uma beta e testou se eles vem de uma beta com os parametros corretos... e a resposta do teste foi q nao.... Ou seja, o teste de hipotese nem sempre diz a verdade... e dizer q os dados seguem uma log-normal ou q nao seguem poisson ou binpmial negativa eh algo q deve ser baseado no conhecimento do processo gerador dos dados e nao nos resultados de algum teste de adequacidade de ajuste. b On Apr 29, 2012 10:27 PM, "Sérgio Henrique" <sergio.edfisica@gmail.com> wrote:
Benilton
O resultado é:
D = 3.1696 p-value < 2.2e-16
Abraços
Em Apr 29, 2012, às 5:10 PM, Benilton Carvalho <beniltoncarvalho@gmail.com> escreveu:
Como vc sabe q nao segue Poisson/Binomial Negativa?
Imagino que vc saiba que os "testes de adequacidade/aderencia" te dao resultados que podem nao ser os corretos...
Assumindo que o sono nao esteja me atrapalhando muito, veja o q vc obtem no caso abaixo...
set.seed(1) x = rbeta(100, 10, 10) ks.test(x, 'dbeta', shape1=10, shape2=10)
b
2012/4/29 Sérgio Henrique <sergio.edfisica@gmail.com>:
Oi
Mesmo minha taxa não seguindo uma distribuição de Poisson ou Binomial negativa?
Abraços
Enviado via iPad
Em Apr 29, 2012, às 1:19 PM, Daniel C Bezerra <danielcbezerra@gmail.com
escreveu:
Se vc pretende modelar a taxa como variável resposta uma sugestão seria usar Poisson ou binomial negativa.
Mas isto obviamente não tira a necessidade de rever os resíduos e checar se o ajuste foi apropriado como colocado pelo Walmes.
Abs,
Daniel
2012/4/29 Walmes Zeviani <walmeszeviani@gmail.com>
Você tá aplicando testes de aderência na variável resposta marginal às covariáveis o que é bem diferente de aplicar testes os resíduos da regressão. Ajuste o modelo de regressão e verifique se os resíduos têm distribuição normal. De qualquer forma é possível ajustar um modelo de regressão lognormal sim, porém, a tua distribuição marginal pode ser lognormal, mas a dos resíduos do modelo de regressão podem ser qualquer outra coisa. Consulte um estatístico local.
À disposição. Walmes.
==========================================================================
Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218
==========================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Se a sua resposta é continua, ao inves de cair neste buuaco negro de testes de aderencia sugoiri que voce examene alguma tranformacaod e variavel como 0or exmeplo MASS:boxcox() a funcao vai achar o valor do parametro (verossmihanca) que faz com que os dados mais se aproximem da normal. A ventagf34m é que voce pode declarar o modelo sem necessidadse de fazer em 2 passos (estimar residuos depois testar nomalidade) algo como boxcox(Y ~bloco + tratamento, ... de acordo com seu modelo. Melhor que isto ainda ;e encotnrar um modelo adequado para sua variavel (Gamma, beta, etc) e usar a analise com esta distribuicao On Sun, 29 Apr 2012, Sérgio Henrique almeida da silva ju wrote:
Olá Estou trabalhando com a taxa de uma doença e gostaria de rodar um modelo de regressão. Meus dados não apresentaram distribuição normal e por teste de aderência deu uma distribuição lognomal -> fitdistr(tx_esqui, "lognormal") meanlog sdlog 6.25725753 1.90754231 (0.11630491) (0.08223999) ->ks.test(tx_esqui, "plnorm", sdlog=1.90754231, meanlog=6.25725753,alternative=c("two.sided")) One-sample Kolmogorov-Smirnov test data: tx_esqui D = 0.0701, p-value = 0.1419 alternative hypothesis: two-sided Tem como eu rodar um modelo de regressão com essa variável? Como fazê-lo? Qual a melhor forma de trabalhar com essa variável? Abraços Segue a minha variável dependente: structure(list(tx_esqui = c(3L, 3L, 4L, 4L, 4L, 4L, 8L, 8L, 8L, 9L, 10L, 10L, 19L, 22L, 22L, 23L, 23L, 25L, 25L, 26L, 27L, 28L, 29L, 30L, 31L, 32L, 34L, 36L, 39L, 41L, 42L, 45L, 46L, 49L, 49L, 56L, 57L, 58L, 58L, 59L, 61L, 62L, 62L, 68L, 70L, 74L, 76L, 80L, 82L, 82L, 83L, 83L, 86L, 101L, 102L, 107L, 107L, 112L, 113L, 118L, 120L, 121L, 123L, 126L, 135L, 138L, 140L, 153L, 156L, 158L, 179L, 191L, 200L, 201L, 204L, 207L, 209L, 212L, 215L, 223L, 227L, 228L, 233L, 247L, 248L, 249L, 255L, 257L, 258L, 258L, 259L, 264L, 274L, 277L, 279L, 287L, 297L, 309L, 310L, 313L, 314L, 326L, 328L, 329L, 331L, 332L, 332L, 340L, 354L, 358L, 365L, 372L, 379L, 383L, 395L, 396L, 418L, 423L, 447L, 449L, 451L, 453L, 493L, 532L, 535L, 553L, 554L, 565L, 573L, 581L, 584L, 599L, 603L, 604L, 611L, 672L, 703L, 708L, 727L, 756L, 799L, 809L, 812L, 815L, 816L, 862L, 864L, 866L, 932L, 946L, 951L, 964L, 969L, 983L, 985L, 989L, 1032L, 1102L, 1102L, 1112L, 1112L, 1199L, 1218L, 1245L, 1252L, 1283L, 1302L, 1327L, 1327L, 1328L, 1340L, 1367L, 1382L, 1413L, 1441L, 1468L, 1487L, 1493L, 1512L, 1523L, 1567L, 1576L, 1585L, 1598L, 1620L, 1623L, 1634L, 1664L, 1704L, 1813L, 1816L, 1824L, 1842L, 1892L, 1939L, 1977L, 2010L, 2035L, 2060L, 2100L, 2152L, 2184L, 2210L, 2248L, 2282L, 2288L, 2358L, 2462L, 2473L, 2527L, 2541L, 2555L, 2576L, 2603L, 2705L, 2711L, 2895L, 2916L, 2958L, 2963L, 3088L, 3110L, 3304L, 3427L, 3489L, 3535L, 3629L, 3638L, 3682L, 3704L, 3796L, 3932L, 4160L, 4293L, 4294L, 4366L, 4516L, 4715L, 4746L, 5152L, 5263L, 5307L, 5823L, 6025L, 6306L, 6313L, 6330L, 6649L, 7114L, 7158L, 7340L, 7488L, 7665L, 8055L, 8394L, 8773L, 8850L, 8918L, 9273L, 9356L, 10110L, 10281L, 10310L, 10519L, 11111L, 13525L, 14465L, 14955L, 16629L)), .Names = "tx_esqui", class = "data.frame", row.names = c(NA, -269L))
-- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383 Tel: (21) 94429486/78101651 id: 123*20942

Oi Obrigado Prof Paulo, sua sugestão foi bastante útil. Rodei meu modelo usando a transformação da variável dependente, segundo a sugestão do prof Paulo, porém meu R2 está baixo (Adjusted R-squared: 0.1386), ainda não fiz a análise dos resíduos, mas fiquei curioso de como utilizar a Poisson ou Binomial Negativa para modelar minha taxa (Estou modelando a taxa de incidência de esquistossomose como variável dependente juntamente com um conjunto de variáveis sociodemográficas como variáveis independentes), uma vez que nunca trabalhei com essas distribuições. Abraços -- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383

Sergio o R2 baixo pode ser por diversas razoes inclusive o talvez baixo valor explicativo das covariáveis. Outro fato é sempre olhar o R2 com reservas. É ainda possível que a relacao nao esteja linear com as covariaveis e talvez voce precise transformar estas tambem Em verificaria graficos da resposta (transformada) contra as covariáveis para examinar a existencia e forma das relacoes de forma descritiva antes de tentar ajustar um modelo. Um expediente util é usar gam() para deixar os dados indicarem a relacao quanto a outras distribuicoes a funcal glm() generaliza a lm(). O argumento family permite escolhar distribuicoes. A gam() tb tem o mesmo argumento Neste ponto sugiro consultar exemplos de glm's em algum texto como Introductory statistica with R (Daalgard), MASS (Venable & Ripley), dentre tantos outros On Mon, 30 Apr 2012, Sérgio Henrique almeida da silva ju wrote:
Oi Obrigado Prof Paulo, sua sugestão foi bastante útil. Rodei meu modelo usando a transformação da variável dependente, segundo a sugestão do prof Paulo, porém meu R2 está baixo (Adjusted R-squared: 0.1386), ainda não fiz a análise dos resíduos, mas fiquei curioso de como utilizar a Poisson ou Binomial Negativa para modelar minha taxa (Estou modelando a taxa de incidência de esquistossomose como variável dependente juntamente com um conjunto de variáveis sociodemográficas como variáveis independentes), uma vez que nunca trabalhei com essas distribuições. Abraços
-- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383

Prof. Paulo, Pegando o gancho da sua resposta no tópico, algumas vezes me deparei com o mesmo problema que o Sergio em caso de R2 baixo, porém para verificar o valor explicativo das covariáveis costumo transformar a resposta, geralmente com Box-Cox e as vezes encontro novos modelos com altos valores de R2 e com uma boa distribuição no gráfico de resíduos. Porém, costumo parar por aqui, porque quando ploto os modelos com os valores transformados, encontro curvas que não tem nenhuma relação com a variável resposta original. Então pergunto, qual seria a abordagem correta para eu realizar a representação gráfica do meu modelo. Obrigado, Alexandre Em 30/04/2012 09:23, Paulo Justiniano escreveu:
Sergio
o R2 baixo pode ser por diversas razoes inclusive o talvez baixo valor explicativo das covariáveis. Outro fato é sempre olhar o R2 com reservas. É ainda possível que a relacao nao esteja linear com as covariaveis e talvez voce precise transformar estas tambem Em verificaria graficos da resposta (transformada) contra as covariáveis para examinar a existencia e forma das relacoes de forma descritiva antes de tentar ajustar um modelo.
Um expediente util é usar gam() para deixar os dados indicarem a relacao
quanto a outras distribuicoes a funcal glm() generaliza a lm(). O argumento family permite escolhar distribuicoes. A gam() tb tem o mesmo argumento
Neste ponto sugiro consultar exemplos de glm's em algum texto como Introductory statistica with R (Daalgard), MASS (Venable & Ripley), dentre tantos outros
On Mon, 30 Apr 2012, Sérgio Henrique almeida da silva ju wrote:
Oi
Obrigado Prof Paulo, sua sugestão foi bastante útil.
Rodei meu modelo usando a transformação da variável dependente, segundo a sugestão do prof Paulo, porém meu R2 está baixo (Adjusted R-squared: 0.1386), ainda não fiz a análise dos resíduos, mas fiquei curioso de como utilizar a Poisson ou Binomial Negativa para modelar minha taxa (Estou modelando a taxa de incidência de esquistossomose como variável dependente juntamente com um conjunto de variáveis sociodemográficas como variáveis independentes), uma vez que nunca trabalhei com essas distribuições.
Abraços
-- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Alexandre dos Santos Engenheiro Florestal, Dr. Universidade Federal de Lavras Departamento de Entomologia Laboratório de Entomologia Florestal Caixa Postal 3037 37200-000 - Lavras/MG Fone: +55 (35) 9223-0304

Olá Seguindo a opinião do Daniel rodei um modelo usando Poisson, porém o mesmo não foi adequado (Resíduos e Deviance), não sei se os número elevado de 0 em algumas co-variável possam influenciar nos resultados. Então rodei um modelo Binomial Negativo que teve melhores resultados, como nunca trabalhei com esses modelos estou com algumas dúvidas Como escrever colocar os resultados do modelo Binomial Negativo em uma função matemática? Qual o comando que posso usar para predição? Abraços Call: glm.nb(formula = esqui ~ alfabetizado + Fossa.rudimentar...não.discriminada + Coletado.por.caçamba.de.serviço.de.limpeza + Poço.ou.nascente...canaliz.em.pelo.menos.um.cômodo + Poço.ou.nascente...canaliz.só.na.propried.terreno + Outra.forma...não.canalizada + offset(log(pop)), data = dados, init.theta = 0.5883720786, link = log) Deviance Residuals: Min 1Q Median 3Q Max -2.3668 -1.2647 -0.4984 0.1509 2.2684 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -0.9340 0.7251 -1.288 0.197687 alfabetizado -6.2288 0.9966 -6.250 4.11e-10 *** Fossa.rudimentar...não.discriminada 0.6584 0.3802 1.732 0.083276 . Coletado.por.caçamba.de.serviço.de.limpeza 1.5681 0.7560 2.074 0.038062 * Poço.ou.nascente...canaliz.em.pelo.menos.um.cômodo 2.2748 0.6546 3.475 0.000511 *** Poço.ou.nascente...canaliz.só.na.propried.terreno 4.8851 1.7172 2.845 0.004445 ** Outra.forma...não.canalizada -1.8832 0.7683 -2.451 0.014239 * --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 (Dispersion parameter for Negative Binomial(0.5884) family taken to be 1) Null deviance: 396.86 on 268 degrees of freedom Residual deviance: 329.11 on 262 degrees of freedom AIC: 3379.9 Number of Fisher Scoring iterations: 1 Theta: 0.5884 Std. Err.: 0.0432 2 x log-likelihood: -3363.9160 -- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383

Sérgio, se você está com dúvida com relação à estatística é mais recomendado que procure um estatístico local pois a troca de e-mails dentro da lista pode se tornar extensa. Procure artigos que usem a binomial negativa para saber quais os aspectos relevantes na apresentação dos resultados. No google tem milhares de tutoriais, para começar recomendo este http://www.ats.ucla.edu/stat/R/dae/nbreg.htm Eu sei que as vezes é desestimulante não ter as respostas no tamanho certo das nossas perguntas mas algumas coisas é preciso correr atrás para aprender pois nem sempre existe uma pessoa que conhece as respostas. Para fazer a predição é só usar a predict(). ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================

Olá Obrigado pela dica! Em 30 de abril de 2012 21:34, Walmes Zeviani <walmeszeviani@gmail.com>escreveu:
Sérgio, se você está com dúvida com relação à estatística é mais recomendado que procure um estatístico local pois a troca de e-mails dentro da lista pode se tornar extensa. Procure artigos que usem a binomial negativa para saber quais os aspectos relevantes na apresentação dos resultados. No google tem milhares de tutoriais, para começar recomendo este
http://www.ats.ucla.edu/stat/R/dae/nbreg.htm
Eu sei que as vezes é desestimulante não ter as respostas no tamanho certo das nossas perguntas mas algumas coisas é preciso correr atrás para aprender pois nem sempre existe uma pessoa que conhece as respostas. Para fazer a predição é só usar a predict().
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383 Tel: (21) 94429486/78101651 id: 123*20942

Oi Sérgio, O livro do pacote epicalc tem um capitulo sobre Poisson e Binomial negativa que pode te ajudar. O livro é gratuito e pode ser baixado do CRAN: http://cran.r-project.org/doc/contrib/Epicalc_Book.pdf Abs, Daniel estimativa da2012/4/29 Sérgio Henrique almeida da silva ju < sergio.edfisica@gmail.com>
Oi
Obrigado Prof Paulo, sua sugestão foi bastante útil.
Rodei meu modelo usando a transformação da variável dependente, segundo a sugestão do prof Paulo, porém meu R2 está baixo (Adjusted R-squared: 0.1386), ainda não fiz a análise dos resíduos, mas fiquei curioso de como utilizar a Poisson ou Binomial Negativa para modelar minha taxa (Estou modelando a taxa de incidência de esquistossomose como variável dependente juntamente com um conjunto de variáveis sociodemográficas como variáveis independentes), uma vez que nunca trabalhei com essas distribuições.
Abraços
-- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
participantes (7)
-
ASANTOS
-
Benilton Carvalho
-
Daniel C Bezerra
-
Paulo Justiniano
-
Sérgio Henrique
-
Sérgio Henrique almeida da silva ju
-
Walmes Zeviani