Teste de Aderência

É o seguinte: tenho em um arquivo txt um vetor que representa tempos até a falha de equipamentos. Gostaria de fazer alguns teste de aderência para verificar se estes dados se aproximam de algumas distribuições de probabilidade. Usei o lillie.test(dados) para verificar se dos dados aderem a uma distribuição nomal. No entanto, gostaria de verificar se estes mesmos dados (e algumas variações) se aderem a uma exponencial, gamma e weibull. Sei que a função é a ks.test(x, y,..., alternative=c("two.sided" "less" or "greater")) para o teste de Kolmogorov-Smirnov. Para testar normalidade com a função ks, fiz o seguinte: ks.test(vetor, "pnorm", sd=sd(vetor), mean=mean(vetor),alternative=c("two.sided")). Curioso que o resultado foi bem diferente da lillie.test, a seguinte mensagem foi apresentada: Warning message: In ks.test(vetor, "pnorm", sd=sd(vetor), mean=mean(vetor),alternative=c("two.sided")), : não é possível calcular os níveis descritivos corretos com empates. O que isso quer dizer??????? Quando tentei usar outra distribuição, pweibull por exemplo, o p-value foi menor que 2.2e-16, ou seja, nada a ver, e repetindo a mesma frase anterior. O mesmo resultado foi com as outras. Como não sei a sintaxe para weibull fiz o seguinte: ks.test(vetor, "pweibull", 1.129, 2,alternative=c("two.sided")) Onde estou errando? Vi que para montar uma pweibull são necessários o vetor de quantis e os parâmetros shape e scale. É necessário fazer separado e quardar em uma variável e depois jogar na ks? Como consigo esse vetor de quantis? Achei que seria automático. Estou correto se fizer assim: ks.test(vetor, "pweibull",10,2) E tem alguma forma de estimar os parâmetros shape e scale desta função?

Cristiano, A mensagem sobre os empates vem do fato da sua amostra possuir valores repetidos. Às vezes, a precisão dessa medidas (casas decimais) é pequeno, imagine medir altura de 100 pessoas, é bem provável ter duas com 1,78 m, ou outro valor. Na ks.test(vetor_observado, distribuição, parametro1, parametro2, demais_opções), você precisa passar o valor dos parâmetros sob hipótese. Normalmente os valores usando são as estimativas obtidas com os dados. Então você precisa estimar. Para o caso da normal, mean(x) e sd(x) são os estimadores. Para outras distribuições você pode usar a função MASS::fitdistr(). Consulte a documentação para instruções de uso. À disposição. Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ========================================================================== 2011/4/25 Cristiano Melo <cristianogmelo@gmail.com>
É o seguinte: tenho em um arquivo txt um vetor que representa tempos até a falha de equipamentos. Gostaria de fazer alguns teste de aderência para verificar se estes dados se aproximam de algumas distribuições de probabilidade. Usei o lillie.test(dados) para verificar se dos dados aderem a uma distribuição nomal. No entanto, gostaria de verificar se estes mesmos dados (e algumas variações) se aderem a uma exponencial, gamma e weibull.
Sei que a função é a ks.test(x, y,..., alternative=c("two.sided" "less" or "greater")) para o teste de Kolmogorov-Smirnov. Para testar normalidade com a função ks, fiz o seguinte: ks.test(vetor, "pnorm", sd=sd(vetor), mean=mean(vetor),alternative=c("two.sided")). Curioso que o resultado foi bem diferente da lillie.test, a seguinte mensagem foi apresentada: Warning message: In ks.test(vetor, "pnorm", sd=sd(vetor), mean=mean(vetor),alternative=c("two.sided")), : não é possível calcular os níveis descritivos corretos com empates. O que isso quer dizer???????
Quando tentei usar outra distribuição, pweibull por exemplo, o p-value foi menor que 2.2e-16, ou seja, nada a ver, e repetindo a mesma frase anterior. O mesmo resultado foi com as outras. Como não sei a sintaxe para weibull fiz o seguinte: ks.test(vetor, "pweibull", 1.129, 2,alternative=c("two.sided"))
Onde estou errando? Vi que para montar uma pweibull são necessários o vetor de quantis e os parâmetros shape e scale. É necessário fazer separado e quardar em uma variável e depois jogar na ks? Como consigo esse vetor de quantis? Achei que seria automático. Estou correto se fizer assim:
ks.test(vetor, "pweibull",10,2)
E tem alguma forma de estimar os parâmetros shape e scale desta função?
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br

Walmes, ele pode também, ao invés de usar KS, usar qui-quadrado (Este é o menos preciso deles), mas é o mais fácil de explicar. Se a quantidade de dados for grande, a precisão é boa, pois vc pode dividir em mais intervalos. On 26/04/2011, at 09:21, Walmes Zeviani wrote:
Cristiano,
A mensagem sobre os empates vem do fato da sua amostra possuir valores repetidos. Às vezes, a precisão dessa medidas (casas decimais) é pequeno, imagine medir altura de 100 pessoas, é bem provável ter duas com 1,78 m, ou outro valor.
Na ks.test(vetor_observado, distribuição, parametro1, parametro2, demais_opções), você precisa passar o valor dos parâmetros sob hipótese. Normalmente os valores usando são as estimativas obtidas com os dados. Então você precisa estimar. Para o caso da normal, mean(x) e sd(x) são os estimadores. Para outras distribuições você pode usar a função MASS::fitdistr(). Consulte a documentação para instruções de uso.
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
2011/4/25 Cristiano Melo <cristianogmelo@gmail.com> É o seguinte: tenho em um arquivo txt um vetor que representa tempos até a falha de equipamentos. Gostaria de fazer alguns teste de aderência para verificar se estes dados se aproximam de algumas distribuições de probabilidade. Usei o lillie.test(dados) para verificar se dos dados aderem a uma distribuição nomal. No entanto, gostaria de verificar se estes mesmos dados (e algumas variações) se aderem a uma exponencial, gamma e weibull.
Sei que a função é a ks.test(x, y,..., alternative=c("two.sided" "less" or "greater")) para o teste de Kolmogorov-Smirnov. Para testar normalidade com a função ks, fiz o seguinte: ks.test(vetor, "pnorm", sd=sd(vetor), mean=mean(vetor),alternative=c("two.sided")). Curioso que o resultado foi bem diferente da lillie.test, a seguinte mensagem foi apresentada: Warning message: In ks.test(vetor, "pnorm", sd=sd(vetor), mean=mean(vetor),alternative=c("two.sided")), : não é possível calcular os níveis descritivos corretos com empates. O que isso quer dizer???????
Quando tentei usar outra distribuição, pweibull por exemplo, o p-value foi menor que 2.2e-16, ou seja, nada a ver, e repetindo a mesma frase anterior. O mesmo resultado foi com as outras. Como não sei a sintaxe para weibull fiz o seguinte: ks.test(vetor, "pweibull", 1.129, 2,alternative=c("two.sided"))
Onde estou errando? Vi que para montar uma pweibull são necessários o vetor de quantis e os parâmetros shape e scale. É necessário fazer separado e quardar em uma variável e depois jogar na ks? Como consigo esse vetor de quantis? Achei que seria automático. Estou correto se fizer assim:
ks.test(vetor, "pweibull",10,2)
E tem alguma forma de estimar os parâmetros shape e scale desta função?
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br

Leonard, Acredito que não tenho muitos dados, são 125 ao todo, mas vou fazer algumas subdivisões, o que tornará menor ainda. No meu caso eu trato tempos até a falha. Eu tinha entendido que o qui-quadrado era para dados discretos (corrijam-se se estiver errado). Em 26 de abril de 2011 09:36, Leonard Assis <assis.leonard@gmail.com>escreveu:
Walmes,
ele pode também, ao invés de usar KS, usar qui-quadrado (Este é o menos preciso deles), mas é o mais fácil de explicar. Se a quantidade de dados for grande, a precisão é boa, pois vc pode dividir em mais intervalos. On 26/04/2011, at 09:21, Walmes Zeviani wrote:
Cristiano,
A mensagem sobre os empates vem do fato da sua amostra possuir valores repetidos. Às vezes, a precisão dessa medidas (casas decimais) é pequeno, imagine medir altura de 100 pessoas, é bem provável ter duas com 1,78 m, ou outro valor.
Na ks.test(vetor_observado, distribuição, parametro1, parametro2, demais_opções), você precisa passar o valor dos parâmetros sob hipótese. Normalmente os valores usando são as estimativas obtidas com os dados. Então você precisa estimar. Para o caso da normal, mean(x) e sd(x) são os estimadores. Para outras distribuições você pode usar a função MASS::fitdistr(). Consulte a documentação para instruções de uso.
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
2011/4/25 Cristiano Melo <cristianogmelo@gmail.com>
É o seguinte: tenho em um arquivo txt um vetor que representa tempos até a falha de equipamentos. Gostaria de fazer alguns teste de aderência para verificar se estes dados se aproximam de algumas distribuições de probabilidade. Usei o lillie.test(dados) para verificar se dos dados aderem a uma distribuição nomal. No entanto, gostaria de verificar se estes mesmos dados (e algumas variações) se aderem a uma exponencial, gamma e weibull.
Sei que a função é a ks.test(x, y,..., alternative=c("two.sided" "less" or "greater")) para o teste de Kolmogorov-Smirnov. Para testar normalidade com a função ks, fiz o seguinte: ks.test(vetor, "pnorm", sd=sd(vetor), mean=mean(vetor),alternative=c("two.sided")). Curioso que o resultado foi bem diferente da lillie.test, a seguinte mensagem foi apresentada: Warning message: In ks.test(vetor, "pnorm", sd=sd(vetor), mean=mean(vetor),alternative=c("two.sided")), : não é possível calcular os níveis descritivos corretos com empates. O que isso quer dizer???????
Quando tentei usar outra distribuição, pweibull por exemplo, o p-value foi menor que 2.2e-16, ou seja, nada a ver, e repetindo a mesma frase anterior. O mesmo resultado foi com as outras. Como não sei a sintaxe para weibull fiz o seguinte: ks.test(vetor, "pweibull", 1.129, 2,alternative=c("two.sided"))
Onde estou errando? Vi que para montar uma pweibull são necessários o vetor de quantis e os parâmetros shape e scale. É necessário fazer separado e quardar em uma variável e depois jogar na ks? Como consigo esse vetor de quantis? Achei que seria automático. Estou correto se fizer assim:
ks.test(vetor, "pweibull",10,2)
E tem alguma forma de estimar os parâmetros shape e scale desta função?
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br

em teoria, serão dados discretos. você basicamente vai ter a frequência esperada e a observada nos intervalos. à medida que vc aumenta o número de divisões, o teste fica melhor (Mesma analogia da integral). por isso eu citei que precisa de uma quantidade boa de dados para ser mais preciso. Acredito que em 125 observações, a precisão não fique legal, o K-S dá algo melhor On 26/04/2011, at 12:45, Cristiano Melo wrote:
Leonard, Acredito que não tenho muitos dados, são 125 ao todo, mas vou fazer algumas subdivisões, o que tornará menor ainda. No meu caso eu trato tempos até a falha. Eu tinha entendido que o qui-quadrado era para dados discretos (corrijam-se se estiver errado).
Em 26 de abril de 2011 09:36, Leonard Assis <assis.leonard@gmail.com>escreveu:
Walmes,
ele pode também, ao invés de usar KS, usar qui-quadrado (Este é o menos preciso deles), mas é o mais fácil de explicar. Se a quantidade de dados for grande, a precisão é boa, pois vc pode dividir em mais intervalos. On 26/04/2011, at 09:21, Walmes Zeviani wrote:
Cristiano,
A mensagem sobre os empates vem do fato da sua amostra possuir valores repetidos. Às vezes, a precisão dessa medidas (casas decimais) é pequeno, imagine medir altura de 100 pessoas, é bem provável ter duas com 1,78 m, ou outro valor.
Na ks.test(vetor_observado, distribuição, parametro1, parametro2, demais_opções), você precisa passar o valor dos parâmetros sob hipótese. Normalmente os valores usando são as estimativas obtidas com os dados. Então você precisa estimar. Para o caso da normal, mean(x) e sd(x) são os estimadores. Para outras distribuições você pode usar a função MASS::fitdistr(). Consulte a documentação para instruções de uso.
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
2011/4/25 Cristiano Melo <cristianogmelo@gmail.com>
É o seguinte: tenho em um arquivo txt um vetor que representa tempos até a falha de equipamentos. Gostaria de fazer alguns teste de aderência para verificar se estes dados se aproximam de algumas distribuições de probabilidade. Usei o lillie.test(dados) para verificar se dos dados aderem a uma distribuição nomal. No entanto, gostaria de verificar se estes mesmos dados (e algumas variações) se aderem a uma exponencial, gamma e weibull.
Sei que a função é a ks.test(x, y,..., alternative=c("two.sided" "less" or "greater")) para o teste de Kolmogorov-Smirnov. Para testar normalidade com a função ks, fiz o seguinte: ks.test(vetor, "pnorm", sd=sd(vetor), mean=mean(vetor),alternative=c("two.sided")). Curioso que o resultado foi bem diferente da lillie.test, a seguinte mensagem foi apresentada: Warning message: In ks.test(vetor, "pnorm", sd=sd(vetor), mean=mean(vetor),alternative=c("two.sided")), : não é possível calcular os níveis descritivos corretos com empates. O que isso quer dizer???????
Quando tentei usar outra distribuição, pweibull por exemplo, o p-value foi menor que 2.2e-16, ou seja, nada a ver, e repetindo a mesma frase anterior. O mesmo resultado foi com as outras. Como não sei a sintaxe para weibull fiz o seguinte: ks.test(vetor, "pweibull", 1.129, 2,alternative=c("two.sided"))
Onde estou errando? Vi que para montar uma pweibull são necessários o vetor de quantis e os parâmetros shape e scale. É necessário fazer separado e quardar em uma variável e depois jogar na ks? Como consigo esse vetor de quantis? Achei que seria automático. Estou correto se fizer assim:
ks.test(vetor, "pweibull",10,2)
E tem alguma forma de estimar os parâmetros shape e scale desta função?
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br

Valeu Walmes, Vou verificar a função que você indicou, se tiver alguma dúvida no uso eu posto aqui. Postarei também meu sucesso. Em 26 de abril de 2011 09:21, Walmes Zeviani <walmeszeviani@gmail.com>escreveu:
Cristiano,
A mensagem sobre os empates vem do fato da sua amostra possuir valores repetidos. Às vezes, a precisão dessa medidas (casas decimais) é pequeno, imagine medir altura de 100 pessoas, é bem provável ter duas com 1,78 m, ou outro valor.
Na ks.test(vetor_observado, distribuição, parametro1, parametro2, demais_opções), você precisa passar o valor dos parâmetros sob hipótese. Normalmente os valores usando são as estimativas obtidas com os dados. Então você precisa estimar. Para o caso da normal, mean(x) e sd(x) são os estimadores. Para outras distribuições você pode usar a função MASS::fitdistr(). Consulte a documentação para instruções de uso.
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
2011/4/25 Cristiano Melo <cristianogmelo@gmail.com>
É o seguinte: tenho em um arquivo txt um vetor que representa tempos até a falha de equipamentos. Gostaria de fazer alguns teste de aderência para verificar se estes dados se aproximam de algumas distribuições de probabilidade. Usei o lillie.test(dados) para verificar se dos dados aderem a uma distribuição nomal. No entanto, gostaria de verificar se estes mesmos dados (e algumas variações) se aderem a uma exponencial, gamma e weibull.
Sei que a função é a ks.test(x, y,..., alternative=c("two.sided" "less" or "greater")) para o teste de Kolmogorov-Smirnov. Para testar normalidade com a função ks, fiz o seguinte: ks.test(vetor, "pnorm", sd=sd(vetor), mean=mean(vetor),alternative=c("two.sided")). Curioso que o resultado foi bem diferente da lillie.test, a seguinte mensagem foi apresentada: Warning message: In ks.test(vetor, "pnorm", sd=sd(vetor), mean=mean(vetor),alternative=c("two.sided")), : não é possível calcular os níveis descritivos corretos com empates. O que isso quer dizer???????
Quando tentei usar outra distribuição, pweibull por exemplo, o p-value foi menor que 2.2e-16, ou seja, nada a ver, e repetindo a mesma frase anterior. O mesmo resultado foi com as outras. Como não sei a sintaxe para weibull fiz o seguinte: ks.test(vetor, "pweibull", 1.129, 2,alternative=c("two.sided"))
Onde estou errando? Vi que para montar uma pweibull são necessários o vetor de quantis e os parâmetros shape e scale. É necessário fazer separado e quardar em uma variável e depois jogar na ks? Como consigo esse vetor de quantis? Achei que seria automático. Estou correto se fizer assim:
ks.test(vetor, "pweibull",10,2)
E tem alguma forma de estimar os parâmetros shape e scale desta função?
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br

Walmes, Fiz o seguinte: library(MASS) fitdistr(vetor_observado,"weibull") - que acredito ser suficiente. O resultado foi: shape scale 1.377413 210.784742 (0.167581) (23.479204) Que novamente acredito ser o que quero. Só não entendi esta informação entre parênteses. Em 26 de abril de 2011 09:21, Walmes Zeviani <walmeszeviani@gmail.com>escreveu:
Cristiano,
A mensagem sobre os empates vem do fato da sua amostra possuir valores repetidos. Às vezes, a precisão dessa medidas (casas decimais) é pequeno, imagine medir altura de 100 pessoas, é bem provável ter duas com 1,78 m, ou outro valor.
Na ks.test(vetor_observado, distribuição, parametro1, parametro2, demais_opções), você precisa passar o valor dos parâmetros sob hipótese. Normalmente os valores usando são as estimativas obtidas com os dados. Então você precisa estimar. Para o caso da normal, mean(x) e sd(x) são os estimadores. Para outras distribuições você pode usar a função MASS::fitdistr(). Consulte a documentação para instruções de uso.
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
2011/4/25 Cristiano Melo <cristianogmelo@gmail.com>
É o seguinte: tenho em um arquivo txt um vetor que representa tempos até a falha de equipamentos. Gostaria de fazer alguns teste de aderência para verificar se estes dados se aproximam de algumas distribuições de probabilidade. Usei o lillie.test(dados) para verificar se dos dados aderem a uma distribuição nomal. No entanto, gostaria de verificar se estes mesmos dados (e algumas variações) se aderem a uma exponencial, gamma e weibull.
Sei que a função é a ks.test(x, y,..., alternative=c("two.sided" "less" or "greater")) para o teste de Kolmogorov-Smirnov. Para testar normalidade com a função ks, fiz o seguinte: ks.test(vetor, "pnorm", sd=sd(vetor), mean=mean(vetor),alternative=c("two.sided")). Curioso que o resultado foi bem diferente da lillie.test, a seguinte mensagem foi apresentada: Warning message: In ks.test(vetor, "pnorm", sd=sd(vetor), mean=mean(vetor),alternative=c("two.sided")), : não é possível calcular os níveis descritivos corretos com empates. O que isso quer dizer???????
Quando tentei usar outra distribuição, pweibull por exemplo, o p-value foi menor que 2.2e-16, ou seja, nada a ver, e repetindo a mesma frase anterior. O mesmo resultado foi com as outras. Como não sei a sintaxe para weibull fiz o seguinte: ks.test(vetor, "pweibull", 1.129, 2,alternative=c("two.sided"))
Onde estou errando? Vi que para montar uma pweibull são necessários o vetor de quantis e os parâmetros shape e scale. É necessário fazer separado e quardar em uma variável e depois jogar na ks? Como consigo esse vetor de quantis? Achei que seria automático. Estou correto se fizer assim:
ks.test(vetor, "pweibull",10,2)
E tem alguma forma de estimar os parâmetros shape e scale desta função?
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br

Acredito q seja o erro padrão, repare este exemplo, direto do help da função fitdistr set.seed(123) x <- rgamma(100, shape = 5, rate = 0.1) fitdistr(x, "gamma") ## now do this directly with more control. fitdistr(x, dgamma, list(shape = 1, rate = 0.1), lower = 0.001) ainda no help, observe o que diz: " An object of class "fitdistr", a list with four components, estimate the parameter estimates, sd the estimated standard errors, vcov the estimated variance-covariance matrix, and loglik the log-likelihood. " executando zzz <-fitdistr(x, dgamma, list(shape = 1, rate = 0.1), lower = 0.001) zzz$sd repare que retorna os valores que estão entre parêntesis Leonard On 26/04/2011, at 14:01, Cristiano Melo wrote:
Walmes,
Fiz o seguinte: library(MASS) fitdistr(vetor_observado,"weibull") - que acredito ser suficiente.
O resultado foi: shape scale 1.377413 210.784742 (0.167581) (23.479204)
Que novamente acredito ser o que quero. Só não entendi esta informação entre parênteses.
Em 26 de abril de 2011 09:21, Walmes Zeviani <walmeszeviani@gmail.com>escreveu:
Cristiano,
A mensagem sobre os empates vem do fato da sua amostra possuir valores repetidos. Às vezes, a precisão dessa medidas (casas decimais) é pequeno, imagine medir altura de 100 pessoas, é bem provável ter duas com 1,78 m, ou outro valor.
Na ks.test(vetor_observado, distribuição, parametro1, parametro2, demais_opções), você precisa passar o valor dos parâmetros sob hipótese. Normalmente os valores usando são as estimativas obtidas com os dados. Então você precisa estimar. Para o caso da normal, mean(x) e sd(x) são os estimadores. Para outras distribuições você pode usar a função MASS::fitdistr(). Consulte a documentação para instruções de uso.
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
2011/4/25 Cristiano Melo <cristianogmelo@gmail.com>
É o seguinte: tenho em um arquivo txt um vetor que representa tempos até a falha de equipamentos. Gostaria de fazer alguns teste de aderência para verificar se estes dados se aproximam de algumas distribuições de probabilidade. Usei o lillie.test(dados) para verificar se dos dados aderem a uma distribuição nomal. No entanto, gostaria de verificar se estes mesmos dados (e algumas variações) se aderem a uma exponencial, gamma e weibull.
Sei que a função é a ks.test(x, y,..., alternative=c("two.sided" "less" or "greater")) para o teste de Kolmogorov-Smirnov. Para testar normalidade com a função ks, fiz o seguinte: ks.test(vetor, "pnorm", sd=sd(vetor), mean=mean(vetor),alternative=c("two.sided")). Curioso que o resultado foi bem diferente da lillie.test, a seguinte mensagem foi apresentada: Warning message: In ks.test(vetor, "pnorm", sd=sd(vetor), mean=mean(vetor),alternative=c("two.sided")), : não é possível calcular os níveis descritivos corretos com empates. O que isso quer dizer???????
Quando tentei usar outra distribuição, pweibull por exemplo, o p-value foi menor que 2.2e-16, ou seja, nada a ver, e repetindo a mesma frase anterior. O mesmo resultado foi com as outras. Como não sei a sintaxe para weibull fiz o seguinte: ks.test(vetor, "pweibull", 1.129, 2,alternative=c("two.sided"))
Onde estou errando? Vi que para montar uma pweibull são necessários o vetor de quantis e os parâmetros shape e scale. É necessário fazer separado e quardar em uma variável e depois jogar na ks? Como consigo esse vetor de quantis? Achei que seria automático. Estou correto se fizer assim:
ks.test(vetor, "pweibull",10,2)
E tem alguma forma de estimar os parâmetros shape e scale desta função?
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br

Cristiano, Adquira o saudável hábito de ler a documentação das funções. Habitue-se com a função help(), às vezes você evita passar vergonha. Falo isso para o seu crescimento. Obrigado. Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================

Caro Walmes, Não classifico minha pergunta como uma vergonha. Se não tivesse consultado a ajuda não teria chegado aos resultados. Muito pelo contrário, esta é a primeira coisa que faço. Todavia, não tenho a fluência em inglês que provavelmente vossa senhoria o tem. Apesar de existirem ferramentas tradutoras, a tradução dificilmente será igual a correta. Favor, economize seu tempo evitando enviar este tipo de mensagem, acho que você deve ter coisas mais importantes para fazer. Sem mais. Em 26 de abril de 2011 19:00, Walmes Zeviani <walmeszeviani@gmail.com>escreveu:
Cristiano,
Adquira o saudável hábito de ler a documentação das funções. Habitue-se com a função help(), às vezes você evita passar vergonha. Falo isso para o seu crescimento.
Obrigado. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br

Muito obrigado Leonard pelo esclarecimento. Em 26 de abril de 2011 18:16, Leonard Assis <assis.leonard@gmail.com>escreveu:
Acredito q seja o erro padrão, repare este exemplo, direto do help da função fitdistr
set.seed(123) x <- rgamma(100, shape = 5, rate = 0.1) fitdistr(x, "gamma") ## now do this directly with more control. fitdistr(x, dgamma, list(shape = 1, rate = 0.1), lower = 0.001)
ainda no help, observe o que diz:
" An object of class "fitdistr", a list with four components,
estimate the parameter estimates, sd the estimated standard errors, vcov the estimated variance-covariance matrix, and loglik the log-likelihood.
" executando zzz <-fitdistr(x, dgamma, list(shape = 1, rate = 0.1), lower = 0.001) zzz$sd
repare que retorna os valores que estão entre parêntesis
Leonard
On 26/04/2011, at 14:01, Cristiano Melo wrote:
Walmes,
Fiz o seguinte: library(MASS) fitdistr(vetor_observado,"weibull") - que acredito ser suficiente.
O resultado foi: shape scale 1.377413 210.784742 (0.167581) (23.479204)
Que novamente acredito ser o que quero. Só não entendi esta informação entre parênteses.
Em 26 de abril de 2011 09:21, Walmes Zeviani <walmeszeviani@gmail.com escreveu:
Cristiano,
A mensagem sobre os empates vem do fato da sua amostra possuir valores repetidos. Às vezes, a precisão dessa medidas (casas decimais) é pequeno, imagine medir altura de 100 pessoas, é bem provável ter duas com 1,78 m, ou outro valor.
Na ks.test(vetor_observado, distribuição, parametro1, parametro2, demais_opções), você precisa passar o valor dos parâmetros sob hipótese. Normalmente os valores usando são as estimativas obtidas com os dados. Então você precisa estimar. Para o caso da normal, mean(x) e sd(x) são os estimadores. Para outras distribuições você pode usar a função MASS::fitdistr(). Consulte a documentação para instruções de uso.
À disposição. Walmes.
==========================================================================
Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218
==========================================================================
2011/4/25 Cristiano Melo <cristianogmelo@gmail.com>
É o seguinte: tenho em um arquivo txt um vetor que representa tempos
até a
falha de equipamentos. Gostaria de fazer alguns teste de aderência para verificar se estes dados se aproximam de algumas distribuições de probabilidade. Usei o lillie.test(dados) para verificar se dos dados aderem a uma distribuição nomal. No entanto, gostaria de verificar se estes mesmos dados (e algumas variações) se aderem a uma exponencial, gamma e weibull.
Sei que a função é a ks.test(x, y,..., alternative=c("two.sided" "less" or "greater")) para o teste de Kolmogorov-Smirnov. Para testar normalidade com a função ks, fiz o seguinte: ks.test(vetor, "pnorm", sd=sd(vetor), mean=mean(vetor),alternative=c("two.sided")). Curioso que o resultado foi bem diferente da lillie.test, a seguinte mensagem foi apresentada: Warning message: In ks.test(vetor, "pnorm", sd=sd(vetor), mean=mean(vetor),alternative=c("two.sided")), : não é possível calcular os níveis descritivos corretos com empates. O que isso quer dizer???????
Quando tentei usar outra distribuição, pweibull por exemplo, o p-value foi menor que 2.2e-16, ou seja, nada a ver, e repetindo a mesma frase anterior. O mesmo resultado foi com as outras. Como não sei a sintaxe para weibull fiz o seguinte: ks.test(vetor, "pweibull", 1.129, 2,alternative=c("two.sided"))
Onde estou errando? Vi que para montar uma pweibull são necessários o vetor de quantis e os parâmetros shape e scale. É necessário fazer separado e quardar em uma variável e depois jogar na ks? Como consigo esse vetor de quantis? Achei que seria automático. Estou correto se fizer assim:
ks.test(vetor, "pweibull",10,2)
E tem alguma forma de estimar os parâmetros shape e scale desta função?
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br

Estava tentando rodar vosso exemplo e não consegui, não reconhece a função fitdistr. Existe alguma bibliotéca para ela, que não foi eventualmente mencionada? Muito obrigado Leonard pelo esclarecimento. Em 26 de abril de 2011 18:16, Leonard Assis <assis.leonard@gmail.com> escreveu: Acredito q seja o erro padrão, repare este exemplo, direto do help da função fitdistr set.seed(123) x <- rgamma(100, shape = 5, rate = 0.1) fitdistr(x, "gamma") ## now do this directly with more control. fitdistr(x, dgamma, list(shape = 1, rate = 0.1), lower = 0.001) ainda no help, observe o que diz: " An object of class "fitdistr", a list with four components, estimate the parameter estimates, sd the estimated standard errors, vcov the estimated variance-covariance matrix, and loglik the log-likelihood. " executando zzz <-fitdistr(x, dgamma, list(shape = 1, rate = 0.1), lower = 0.001) zzz$sd repare que retorna os valores que estão entre parêntesis Leonard

Sim, sim library(MASS). Em 26 de abril de 2011 22:22, Mauro Sznelwar <sznelwar@uol.com.br> escreveu:
Estava tentando rodar vosso exemplo e não consegui, não reconhece a função fitdistr. Existe alguma bibliotéca para ela, que não foi eventualmente mencionada?
Muito obrigado Leonard pelo esclarecimento.
Em 26 de abril de 2011 18:16, Leonard Assis <assis.leonard@gmail.com>escreveu:
Acredito q seja o erro padrão, repare este exemplo, direto do help da função fitdistr
set.seed(123) x <- rgamma(100, shape = 5, rate = 0.1) fitdistr(x, "gamma") ## now do this directly with more control. fitdistr(x, dgamma, list(shape = 1, rate = 0.1), lower = 0.001)
ainda no help, observe o que diz:
" An object of class "fitdistr", a list with four components,
estimate the parameter estimates, sd the estimated standard errors, vcov the estimated variance-covariance matrix, and loglik the log-likelihood.
" executando zzz <-fitdistr(x, dgamma, list(shape = 1, rate = 0.1), lower = 0.001) zzz$sd
repare que retorna os valores que estão entre parêntesis
Leonard
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br

tá no pacote MASS On 26/04/2011, at 22:22, Mauro Sznelwar wrote:
Estava tentando rodar vosso exemplo e não consegui, não reconhece a função fitdistr. Existe alguma bibliotéca para ela, que não foi eventualmente mencionada?
Muito obrigado Leonard pelo esclarecimento.
Em 26 de abril de 2011 18:16, Leonard Assis <assis.leonard@gmail.com> escreveu:
Acredito q seja o erro padrão, repare este exemplo, direto do help da função fitdistr
set.seed(123) x <- rgamma(100, shape = 5, rate = 0.1) fitdistr(x, "gamma") ## now do this directly with more control. fitdistr(x, dgamma, list(shape = 1, rate = 0.1), lower = 0.001)
ainda no help, observe o que diz:
" An object of class "fitdistr", a list with four components,
estimate the parameter estimates, sd the estimated standard errors, vcov the estimated variance-covariance matrix, and loglik the log-likelihood.
" executando zzz <-fitdistr(x, dgamma, list(shape = 1, rate = 0.1), lower = 0.001) zzz$sd
repare que retorna os valores que estão entre parêntesis
Leonard
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br

Entre parentesis está o erro padrao da estimativa, tipicamente obtido pelo hessiano numérico (exceto pelos casos em que o estimador tem forma fechada) On Tue, 26 Apr 2011, Cristiano Melo wrote:
Walmes,
Fiz o seguinte: library(MASS) fitdistr(vetor_observado,"weibull") - que acredito ser suficiente.
O resultado foi: shape scale 1.377413 210.784742 (0.167581) (23.479204)
Que novamente acredito ser o que quero. Só não entendi esta informação entre parênteses.
Em 26 de abril de 2011 09:21, Walmes Zeviani <walmeszeviani@gmail.com> escreveu: Cristiano,
A mensagem sobre os empates vem do fato da sua amostra possuir valores repetidos. Às vezes, a precisão dessa medidas (casas decimais) é pequeno, imagine medir altura de 100 pessoas, é bem provável ter duas com 1,78 m, ou outro valor.
Na ks.test(vetor_observado, distribuição, parametro1, parametro2, demais_opções), você precisa passar o valor dos parâmetros sob hipótese. Normalmente os valores usando são as estimativas obtidas com os dados. Então você precisa estimar. Para o caso da normal, mean(x) e sd(x) são os estimadores. Para outras distribuições você pode usar a função MASS::fitdistr(). Consulte a documentação para instruções de uso.
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
2011/4/25 Cristiano Melo <cristianogmelo@gmail.com> É o seguinte: tenho em um arquivo txt um vetor que representa tempos até a falha de equipamentos. Gostaria de fazer alguns teste de aderência para verificar se estes dados se aproximam de algumas distribuições de probabilidade. Usei o lillie.test(dados) para verificar se dos dados aderem a uma distribuição nomal. No entanto, gostaria de verificar se estes mesmos dados (e algumas variações) se aderem a uma exponencial, gamma e weibull.
Sei que a função é a ks.test(x, y,..., alternative=c("two.sided" "less" or "greater")) para o teste de Kolmogorov-Smirnov. Para testar normalidade com a função ks, fiz o seguinte: ks.test(vetor, "pnorm", sd=sd(vetor), mean=mean(vetor),alternative=c("two.sided")). Curioso que o resultado foi bem diferente da lillie.test, a seguinte mensagem foi apresentada: Warning message: In ks.test(vetor, "pnorm", sd=sd(vetor), mean=mean(vetor),alternative=c("two.sided")), : não é possível calcular os níveis descritivos corretos com empates. O que isso quer dizer???????
Quando tentei usar outra distribuição, pweibull por exemplo, o p-value foi menor que 2.2e-16, ou seja, nada a ver, e repetindo a mesma frase anterior. O mesmo resultado foi com as outras. Como não sei a sintaxe para weibull fiz o seguinte: ks.test(vetor, "pweibull", 1.129, 2,alternative=c("two.sided"))
Onde estou errando? Vi que para montar uma pweibull são necessários o vetor de quantis e os parâmetros shape e scale. É necessário fazer separado e quardar em uma variável e depois jogar na ks? Como consigo esse vetor de quantis? Achei que seria automático. Estou correto se fizer assim:
ks.test(vetor, "pweibull",10,2)
E tem alguma forma de estimar os parâmetros shape e scale desta função?
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br

Valeu Paulo. Em 27 de abril de 2011 00:42, Paulo Justiniano <paulojus@leg.ufpr.br>escreveu:
Entre parentesis está o erro padrao da estimativa, tipicamente obtido pelo hessiano numérico (exceto pelos casos em que o estimador tem forma fechada)
On Tue, 26 Apr 2011, Cristiano Melo wrote:
Walmes,
Fiz o seguinte: library(MASS) fitdistr(vetor_observado,"weibull") - que acredito ser suficiente.
O resultado foi: shape scale 1.377413 210.784742 (0.167581) (23.479204)
Que novamente acredito ser o que quero. Só não entendi esta informação entre parênteses.
Em 26 de abril de 2011 09:21, Walmes Zeviani <walmeszeviani@gmail.com> escreveu: Cristiano,
A mensagem sobre os empates vem do fato da sua amostra possuir valores repetidos. Às vezes, a precisão dessa medidas (casas decimais) é pequeno, imagine medir altura de 100 pessoas, é bem provável ter duas com 1,78 m, ou outro valor.
Na ks.test(vetor_observado, distribuição, parametro1, parametro2, demais_opções), você precisa passar o valor dos parâmetros sob hipótese. Normalmente os valores usando são as estimativas obtidas com os dados. Então você precisa estimar. Para o caso da normal, mean(x) e sd(x) são os estimadores. Para outras distribuições você pode usar a função MASS::fitdistr(). Consulte a documentação para instruções de uso.
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218
==========================================================================
2011/4/25 Cristiano Melo <cristianogmelo@gmail.com> É o seguinte: tenho em um arquivo txt um vetor que representa tempos até a falha de equipamentos. Gostaria de fazer alguns teste de aderência para verificar se estes dados se aproximam de algumas distribuições de probabilidade. Usei o lillie.test(dados) para verificar se dos dados aderem a uma distribuição nomal. No entanto, gostaria de verificar se estes mesmos dados (e algumas variações) se aderem a uma exponencial, gamma e weibull.
Sei que a função é a ks.test(x, y,..., alternative=c("two.sided" "less" or "greater")) para o teste de Kolmogorov-Smirnov. Para testar normalidade com a função ks, fiz o seguinte: ks.test(vetor, "pnorm", sd=sd(vetor), mean=mean(vetor),alternative=c("two.sided")). Curioso que o resultado foi bem diferente da lillie.test, a seguinte mensagem foi apresentada: Warning message: In ks.test(vetor, "pnorm", sd=sd(vetor), mean=mean(vetor),alternative=c("two.sided")), : não é possível calcular os níveis descritivos corretos com empates. O que isso quer dizer???????
Quando tentei usar outra distribuição, pweibull por exemplo, o p-value foi menor que 2.2e-16, ou seja, nada a ver, e repetindo a mesma frase anterior. O mesmo resultado foi com as outras. Como não sei a sintaxe para weibull fiz o seguinte: ks.test(vetor, "pweibull", 1.129, 2,alternative=c("two.sided"))
Onde estou errando? Vi que para montar uma pweibull são necessários o vetor de quantis e os parâmetros shape e scale. É necessário fazer separado e quardar em uma variável e depois jogar na ks? Como consigo esse vetor de quantis? Achei que seria automático. Estou correto se fizer assim:
ks.test(vetor, "pweibull",10,2)
E tem alguma forma de estimar os parâmetros shape e scale desta função?
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
participantes (5)
-
Cristiano Melo
-
Leonard Assis
-
Mauro Sznelwar
-
Paulo Justiniano
-
Walmes Zeviani