Distribuição de probabilidade

olá, gostaria de saber se existe alguma forma para rodar todas as possíveis distribuições sobre um determinado conjunto de dados com variáveis continuas!? pois estou procurando e não achei nada pela internet falando dessa possibilidade. meu objetivo é verificar qual melhor a distribuição para os meus dados e, a partir dessa "melhor", estabelecer um modelo geral com todos os dados e comparar com modelos individuais de áreas isoladas. HELP Att., -- *Felipe Felix Costa* Tel. 96-98122-3077

Olá Felipe No r me deparei com este problema uma vez e também não encontrei nenhum pacote específico. O que fiz foi ajustar algumas distribuições e testar dentre elas qual foi a melhor. Usei o pacote fitdistrplus. Existe um programa chamado easyfit, nele vc consegue fazer isso que quer. O ajuste dos parâmetros é pelo método dos momentos-L e você pode verificar a aderência pelo teste de Anderson darling. Ab On Jan 8, 2018 10:21 AM, "Felipe Felix Costa via R-br" < r-br@listas.c3sl.ufpr.br> wrote:
olá,
gostaria de saber se existe alguma forma para rodar todas as possíveis distribuições sobre um determinado conjunto de dados com variáveis continuas!?
pois estou procurando e não achei nada pela internet falando dessa possibilidade.
meu objetivo é verificar qual melhor a distribuição para os meus dados e, a partir dessa "melhor", estabelecer um modelo geral com todos os dados e comparar com modelos individuais de áreas isoladas.
HELP
Att., -- *Felipe Felix Costa* Tel. 96-98122-3077
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Bom dia Felipe, Talvez o pacote "fitdistrplus" possa te ajudar! Att. 2018-01-08 10:21 GMT-02:00 Felipe Felix Costa via R-br < r-br@listas.c3sl.ufpr.br>:
olá,
gostaria de saber se existe alguma forma para rodar todas as possíveis distribuições sobre um determinado conjunto de dados com variáveis continuas!?
pois estou procurando e não achei nada pela internet falando dessa possibilidade.
meu objetivo é verificar qual melhor a distribuição para os meus dados e, a partir dessa "melhor", estabelecer um modelo geral com todos os dados e comparar com modelos individuais de áreas isoladas.
HELP
Att., -- *Felipe Felix Costa* Tel. 96-98122-3077
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Rodrigo Campos

Quais distribuições vc tem interesse? A distribuição Tweedie tem como casos particulares algumas das mais populares distribuições como a normal, gamma e inversa normal. Assim, ao invés de ajustar um monte de distribuições basta ajustar uma que tem as outras como casos particulares. Att Wagner Em 8 de janeiro de 2018 10:38, Rodrigo Campos via R-br < r-br@listas.c3sl.ufpr.br> escreveu:
Bom dia Felipe, Talvez o pacote "fitdistrplus" possa te ajudar! Att.
2018-01-08 10:21 GMT-02:00 Felipe Felix Costa via R-br < r-br@listas.c3sl.ufpr.br>:
olá,
gostaria de saber se existe alguma forma para rodar todas as possíveis distribuições sobre um determinado conjunto de dados com variáveis continuas!?
pois estou procurando e não achei nada pela internet falando dessa possibilidade.
meu objetivo é verificar qual melhor a distribuição para os meus dados e, a partir dessa "melhor", estabelecer um modelo geral com todos os dados e comparar com modelos individuais de áreas isoladas.
HELP
Att., -- *Felipe Felix Costa* Tel. 96-98122-3077
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Rodrigo Campos
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Wagner Hugo Bonat ---------------------------------------------------------------------------------------------- Department of Mathematics and Computer Science (IMADA) University of Southern Denmark (SDU) and Laboratório de Estatística e Geoinformação (LEG) Universidade Federal do Paraná (UFPR)

Olá Wagner Gostei da sua ideia sobre a familia de destribuição Tweedie. Além dessa família você poderia indicar outras que englobem distribuições como por exemplo, Weibull, Gumbel, Burr ... Ab 2018-01-08 18:18 GMT-02:00 Wagner Bonat via R-br <r-br@listas.c3sl.ufpr.br>:
Quais distribuições vc tem interesse? A distribuição Tweedie tem como casos particulares algumas das mais populares distribuições como a normal, gamma e inversa normal. Assim, ao invés de ajustar um monte de distribuições basta ajustar uma que tem as outras como casos particulares.
Att Wagner
Em 8 de janeiro de 2018 10:38, Rodrigo Campos via R-br < r-br@listas.c3sl.ufpr.br> escreveu:
Bom dia Felipe, Talvez o pacote "fitdistrplus" possa te ajudar! Att.
2018-01-08 10:21 GMT-02:00 Felipe Felix Costa via R-br < r-br@listas.c3sl.ufpr.br>:
olá,
gostaria de saber se existe alguma forma para rodar todas as possíveis distribuições sobre um determinado conjunto de dados com variáveis continuas!?
pois estou procurando e não achei nada pela internet falando dessa possibilidade.
meu objetivo é verificar qual melhor a distribuição para os meus dados e, a partir dessa "melhor", estabelecer um modelo geral com todos os dados e comparar com modelos individuais de áreas isoladas.
HELP
Att., -- *Felipe Felix Costa* Tel. 96-98122-3077
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Rodrigo Campos
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Wagner Hugo Bonat ------------------------------------------------------------ ---------------------------------- Department of Mathematics and Computer Science (IMADA) University of Southern Denmark (SDU) and Laboratório de Estatística e Geoinformação (LEG) Universidade Federal do Paraná (UFPR)
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- *Wagner Wolff, **PhD* "*Luiz de Queiroz**" College of Agriculture,* University of São Paulo Pádua Dias avenue11 | 13418-900| Piracicaba-SP| Brazil Phone: +55 19 982385582 <+55%2019%2098238-5582> http://orcid.org/0000-0003-3426-308X https://github.com/wwolff7 http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4463141A1

Olá Essas distribuições como a Weibul, Gumbel e similares são interessantes. Porém, nem sempre elas tem a tradicional parametrização de esperança e dispersão como a Tweedie e as distribuições mais clássicas (normal, gamma, normal inversa) tem. Muitas vezes a esperança ou é desconhecida ou uma função complicada de mais de um parâmetro. Eu penso que ao invés de tentar ajustar várias distribuições é mais interessante você procurar aspectos relevantes sobre o seu conjunto de dados, como por exemplo, excesso de zeros, forte assimetria, caudas pesadas, etc e verificar se a distribuição que você ajustando é capaz de descrever estes aspectos. No caso a Tweedie pode lidar com todos estes aspectos, o que significa que ela deve ajustar bem para uma grande quantidade de dados reais. O que eu quero dizer é que essa idéia de ficar comparando várias distribuições pode não ser realmente necessário. Eu exploro um pouco destas idéias em dois artigos. Eu mostro que a Tweedie ajusta muito bem, mesmo para distribuições que não fazem parte da familia, como a t e a slash. Talvez vc possa explorar idéias similares para a weibul, gumbel e similares. http://www.tandfonline.com/doi/abs/10.1080/00949655.2017.1318876?journalCode... http://journals.sagepub.com/doi/abs/10.1177/1471082X17715718 Att Wagner Em 9 de janeiro de 2018 01:11, Wagner Wolff <wwolff@usp.br> escreveu:
Olá Wagner
Gostei da sua ideia sobre a familia de destribuição Tweedie. Além dessa família você poderia indicar outras que englobem distribuições como por exemplo, Weibull, Gumbel, Burr ...
Ab
2018-01-08 18:18 GMT-02:00 Wagner Bonat via R-br <r-br@listas.c3sl.ufpr.br
:
Quais distribuições vc tem interesse? A distribuição Tweedie tem como casos particulares algumas das mais populares distribuições como a normal, gamma e inversa normal. Assim, ao invés de ajustar um monte de distribuições basta ajustar uma que tem as outras como casos particulares.
Att Wagner
Em 8 de janeiro de 2018 10:38, Rodrigo Campos via R-br < r-br@listas.c3sl.ufpr.br> escreveu:
Bom dia Felipe, Talvez o pacote "fitdistrplus" possa te ajudar! Att.
2018-01-08 10:21 GMT-02:00 Felipe Felix Costa via R-br < r-br@listas.c3sl.ufpr.br>:
olá,
gostaria de saber se existe alguma forma para rodar todas as possíveis distribuições sobre um determinado conjunto de dados com variáveis continuas!?
pois estou procurando e não achei nada pela internet falando dessa possibilidade.
meu objetivo é verificar qual melhor a distribuição para os meus dados e, a partir dessa "melhor", estabelecer um modelo geral com todos os dados e comparar com modelos individuais de áreas isoladas.
HELP
Att., -- *Felipe Felix Costa* Tel. 96-98122-3077
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Rodrigo Campos
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Wagner Hugo Bonat ------------------------------------------------------------ ---------------------------------- Department of Mathematics and Computer Science (IMADA) University of Southern Denmark (SDU) and Laboratório de Estatística e Geoinformação (LEG) Universidade Federal do Paraná (UFPR)
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- *Wagner Wolff, **PhD* "*Luiz de Queiroz**" College of Agriculture,* University of São Paulo Pádua Dias avenue11 | 13418-900| Piracicaba-SP| Brazil Phone: +55 19 982385582 <+55%2019%2098238-5582> http://orcid.org/0000-0003-3426-308X https://github.com/wwolff7 http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4463141A1
-- Wagner Hugo Bonat ---------------------------------------------------------------------------------------------- Department of Mathematics and Computer Science (IMADA) University of Southern Denmark (SDU) and Laboratório de Estatística e Geoinformação (LEG) Universidade Federal do Paraná (UFPR)

Olá Essas distribuições como a Weibul, Gumbel e similares são interessantes. Porém, nem sempre elas tem a tradicional parametrização de esperança e dispersão como a Tweedie e as distribuições mais clássicas (normal, gamma, normal inversa) tem. Muitas vezes a esperança ou é desconhecida ou uma função complicada de mais de um parâmetro. Eu penso que ao invés de tentar ajustar várias distribuições é mais interessante você procurar aspectos relevantes sobre o seu conjunto de dados, como por exemplo, excesso de zeros, forte assimetria, caudas pesadas, etc e verificar se a distribuição que você ajustando é capaz de descrever estes aspectos. No caso a Tweedie pode lidar com todos estes aspectos, o que significa que ela deve ajustar bem para uma grande quantidade de dados reais. O que eu quero dizer é que essa idéia de ficar comparando várias distribuições pode não ser realmente necessário. Eu exploro um pouco destas idéias em dois artigos. Eu mostro que a Tweedie ajusta muito bem, mesmo para distribuições que não fazem parte da familia, como a t e a slash. Talvez vc possa explorar idéias similares para a weibul, gumbel e similares. http://www.tandfonline.com/doi/abs/10.1080/00949655.2017. 1318876?journalCode=gscs20 http://journals.sagepub.com/doi/abs/10.1177/1471082X17715718 Att Wagner Em 9 de janeiro de 2018 01:11, Wagner Wolff <wwolff@usp.br> escreveu:
Olá Wagner
Gostei da sua ideia sobre a familia de destribuição Tweedie. Além dessa família você poderia indicar outras que englobem distribuições como por exemplo, Weibull, Gumbel, Burr ...
Ab
2018-01-08 18:18 GMT-02:00 Wagner Bonat via R-br <r-br@listas.c3sl.ufpr.br
:
Quais distribuições vc tem interesse? A distribuição Tweedie tem como casos particulares algumas das mais populares distribuições como a normal, gamma e inversa normal. Assim, ao invés de ajustar um monte de distribuições basta ajustar uma que tem as outras como casos particulares.
Att Wagner
Em 8 de janeiro de 2018 10:38, Rodrigo Campos via R-br < r-br@listas.c3sl.ufpr.br> escreveu:
Bom dia Felipe, Talvez o pacote "fitdistrplus" possa te ajudar! Att.
2018-01-08 10:21 GMT-02:00 Felipe Felix Costa via R-br < r-br@listas.c3sl.ufpr.br>:
olá,
gostaria de saber se existe alguma forma para rodar todas as possíveis distribuições sobre um determinado conjunto de dados com variáveis continuas!?
pois estou procurando e não achei nada pela internet falando dessa possibilidade.
meu objetivo é verificar qual melhor a distribuição para os meus dados e, a partir dessa "melhor", estabelecer um modelo geral com todos os dados e comparar com modelos individuais de áreas isoladas.
HELP
Att., -- *Felipe Felix Costa* Tel. 96-98122-3077
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Rodrigo Campos
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Wagner Hugo Bonat ------------------------------------------------------------ ---------------------------------- Department of Mathematics and Computer Science (IMADA) University of Southern Denmark (SDU) and Laboratório de Estatística e Geoinformação (LEG) Universidade Federal do Paraná (UFPR)
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- *Wagner Wolff, **PhD* "*Luiz de Queiroz**" College of Agriculture,* University of São Paulo Pádua Dias avenue11 | 13418-900| Piracicaba-SP| Brazil Phone: +55 19 982385582 <+55%2019%2098238-5582> http://orcid.org/0000-0003-3426-308X https://github.com/wwolff7 http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4463141A1
-- Wagner Hugo Bonat ---------------------------------------------------------------------------------------------- Department of Mathematics and Computer Science (IMADA) University of Southern Denmark (SDU) and Laboratório de Estatística e Geoinformação (LEG) Universidade Federal do Paraná (UFPR)

Obrigado pessoal, vou ver se desenrolo aqui com as dicas. Valeu mesmo, essa comunidade tá de parabéns por sempre ter alguém pra ajudar. Abç Em 9 de jan de 2018 22:28, "Wagner Bonat via R-br" <r-br@listas.c3sl.ufpr.br> escreveu:
Olá
Essas distribuições como a Weibul, Gumbel e similares são interessantes. Porém, nem sempre elas tem a tradicional parametrização de esperança e dispersão como a Tweedie e as distribuições mais clássicas (normal, gamma, normal inversa) tem. Muitas vezes a esperança ou é desconhecida ou uma função complicada de mais de um parâmetro.
Eu penso que ao invés de tentar ajustar várias distribuições é mais interessante você procurar aspectos relevantes sobre o seu conjunto de dados, como por exemplo, excesso de zeros, forte assimetria, caudas pesadas, etc e verificar se a distribuição que você ajustando é capaz de descrever estes aspectos. No caso a Tweedie pode lidar com todos estes aspectos, o que significa que ela deve ajustar bem para uma grande quantidade de dados reais.
O que eu quero dizer é que essa idéia de ficar comparando várias distribuições pode não ser realmente necessário. Eu exploro um pouco destas idéias em dois artigos. Eu mostro que a Tweedie ajusta muito bem, mesmo para distribuições que não fazem parte da familia, como a t e a slash. Talvez vc possa explorar idéias similares para a weibul, gumbel e similares.
http://www.tandfonline.com/doi/abs/10.1080/00949655.2017.131 8876?journalCode=gscs20
http://journals.sagepub.com/doi/abs/10.1177/1471082X17715718
Att Wagner
Em 9 de janeiro de 2018 01:11, Wagner Wolff <wwolff@usp.br> escreveu:
Olá Wagner
Gostei da sua ideia sobre a familia de destribuição Tweedie. Além dessa família você poderia indicar outras que englobem distribuições como por exemplo, Weibull, Gumbel, Burr ...
Ab
2018-01-08 18:18 GMT-02:00 Wagner Bonat via R-br < r-br@listas.c3sl.ufpr.br>:
Quais distribuições vc tem interesse? A distribuição Tweedie tem como casos particulares algumas das mais populares distribuições como a normal, gamma e inversa normal. Assim, ao invés de ajustar um monte de distribuições basta ajustar uma que tem as outras como casos particulares.
Att Wagner
Em 8 de janeiro de 2018 10:38, Rodrigo Campos via R-br < r-br@listas.c3sl.ufpr.br> escreveu:
Bom dia Felipe, Talvez o pacote "fitdistrplus" possa te ajudar! Att.
2018-01-08 10:21 GMT-02:00 Felipe Felix Costa via R-br < r-br@listas.c3sl.ufpr.br>:
olá,
gostaria de saber se existe alguma forma para rodar todas as possíveis distribuições sobre um determinado conjunto de dados com variáveis continuas!?
pois estou procurando e não achei nada pela internet falando dessa possibilidade.
meu objetivo é verificar qual melhor a distribuição para os meus dados e, a partir dessa "melhor", estabelecer um modelo geral com todos os dados e comparar com modelos individuais de áreas isoladas.
HELP
Att., -- *Felipe Felix Costa* Tel. 96-98122-3077
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Rodrigo Campos
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Wagner Hugo Bonat ------------------------------------------------------------ ---------------------------------- Department of Mathematics and Computer Science (IMADA) University of Southern Denmark (SDU) and Laboratório de Estatística e Geoinformação (LEG) Universidade Federal do Paraná (UFPR)
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- *Wagner Wolff, **PhD* "*Luiz de Queiroz**" College of Agriculture,* University of São Paulo Pádua Dias avenue11 | 13418-900| Piracicaba-SP| Brazil Phone: +55 19 982385582 <+55%2019%2098238-5582> http://orcid.org/0000-0003-3426-308X https://github.com/wwolff7 http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4463141A1
-- Wagner Hugo Bonat ------------------------------------------------------------ ---------------------------------- Department of Mathematics and Computer Science (IMADA) University of Southern Denmark (SDU) and Laboratório de Estatística e Geoinformação (LEG) Universidade Federal do Paraná (UFPR)
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Caro Felipe, Algumas sugestões no âmbito da possível mecânica de como fazer isso já foram passadas por outros aqui na lista, por isso vou fazer um comentário sobre outra parte da sua questão: "meu objetivo é verificar qual melhor a distribuição para os meus dados e, a partir dessa "melhor", estabelecer um modelo geral com todos os dados e comparar com modelos individuais de áreas isoladas." Essa maneira não é recomendada para descobrir a distribuição dos seus dados, até porque o ajuste estará afetado de erros Tipo I (os testes consideram seus dados como amostras) e à medida que você repetir testes *nos mesmos* dados você inflaciona o risco desse erro (*False Discovery Rate*). Por outro lado se você usasse "testes" para ver se "seus dados se ajustam" e os testes não rejeitarem a hipótese nula (que se ajustam, por construção deles), você teria uma infinidade... HTH -- Cesar Rabak 2018-01-08 10:21 GMT-02:00 Felipe Felix Costa via R-br < r-br@listas.c3sl.ufpr.br>:
olá,
gostaria de saber se existe alguma forma para rodar todas as possíveis distribuições sobre um determinado conjunto de dados com variáveis continuas!?
pois estou procurando e não achei nada pela internet falando dessa possibilidade.
meu objetivo é verificar qual melhor a distribuição para os meus dados e, a partir dessa "melhor", estabelecer um modelo geral com todos os dados e comparar com modelos individuais de áreas isoladas.
HELP
Att., -- *Felipe Felix Costa* Tel. 96-98122-3077
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
participantes (5)
-
Cesar Rabak
-
Felipe Felix Costa
-
Rodrigo Campos
-
Wagner Bonat
-
Wagner Wolff