[R-br] Teste de Aderência

Terça Abril 26 13:47:57 BRT 2011

em teoria, serão dados discretos.

você basicamente vai ter a frequência esperada e a observada nos intervalos. à medida que vc aumenta o número de divisões, o teste fica melhor (Mesma analogia da integral). por isso eu citei que precisa de uma quantidade boa de dados para ser mais preciso.

Acredito que em 125 observações, a precisão não fique legal, o K-S dá algo melhor

On 26/04/2011, at 12:45, Cristiano Melo wrote:

> Leonard,
> Acredito que não tenho muitos dados, são 125 ao todo, mas vou fazer algumas
> subdivisões, o que tornará menor ainda. No meu caso eu trato tempos até a
> falha. Eu tinha entendido que o qui-quadrado era para dados discretos
> (corrijam-se se estiver errado).
> 
> Em 26 de abril de 2011 09:36, Leonard Assis <assis.leonard em gmail.com>escreveu:
> 
>> Walmes,
>> 
>> ele pode também, ao invés de usar KS, usar qui-quadrado (Este é o menos
>> preciso deles), mas é o mais fácil de explicar. Se a quantidade de dados for
>> grande, a precisão é boa, pois vc pode dividir em mais intervalos.
>> On 26/04/2011, at 09:21, Walmes Zeviani wrote:
>> 
>> Cristiano,
>> 
>> A mensagem sobre os empates vem do fato da sua amostra possuir valores
>> repetidos. Às vezes, a precisão dessa medidas (casas decimais) é pequeno,
>> imagine medir altura de 100 pessoas, é bem provável ter duas com 1,78 m, ou
>> outro valor.
>> 
>> Na ks.test(vetor_observado, distribuição, parametro1, parametro2,
>> demais_opções), você precisa passar o valor dos parâmetros sob hipótese.
>> Normalmente os valores usando são as estimativas obtidas com os dados. Então
>> você precisa estimar. Para o caso da normal, mean(x) e sd(x) são os
>> estimadores. Para outras distribuições você pode usar a função
>> MASS::fitdistr(). Consulte a documentação para instruções de uso.
>> 
>> À disposição.
>> Walmes.
>> 
>> ==========================================================================
>> Walmes Marques Zeviani
>> LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W)
>> Departamento de Estatística - Universidade Federal do Paraná
>> fone: (+55) 41 3361 3573
>> VoIP: (3361 3600) 1053 1173
>> e-mail: walmes em ufpr.br
>> twitter: @walmeszeviani
>> homepage: http://www.leg.ufpr.br/~walmes
>> linux user number: 531218
>> ==========================================================================
>> 
>> 
>> 2011/4/25 Cristiano Melo <cristianogmelo em gmail.com>
>> 
>>> É o seguinte: tenho em um arquivo txt um vetor que representa tempos até a
>>> falha de equipamentos. Gostaria de fazer alguns teste de aderência para
>>> verificar se estes dados se aproximam de algumas distribuições de
>>> probabilidade. Usei o lillie.test(dados) para verificar se dos dados aderem
>>> a uma distribuição nomal. No entanto, gostaria de verificar se estes mesmos
>>> dados (e algumas variações) se aderem a uma exponencial, gamma e weibull.
>>> 
>>> Sei que a função é a ks.test(x, y,..., alternative=c("two.sided" "less" or
>>> "greater")) para o teste de Kolmogorov-Smirnov.
>>> Para testar normalidade com a função ks, fiz o seguinte: ks.test(vetor,
>>> "pnorm", sd=sd(vetor), mean=mean(vetor),alternative=c("two.sided")). Curioso
>>> que o resultado foi bem diferente da lillie.test, a seguinte mensagem foi
>>> apresentada:
>>> Warning message:
>>> In ks.test(vetor, "pnorm", sd=sd(vetor),
>>> mean=mean(vetor),alternative=c("two.sided")), : não é possível calcular os
>>> níveis descritivos corretos com empates.
>>> O que isso quer dizer???????
>>> 
>>> Quando tentei usar outra distribuição, pweibull por exemplo, o p-value foi
>>> menor que 2.2e-16, ou seja, nada a ver, e repetindo a mesma frase anterior.
>>> O mesmo resultado foi com as outras. Como não sei a sintaxe para weibull fiz
>>> o seguinte:
>>> ks.test(vetor, "pweibull", 1.129, 2,alternative=c("two.sided"))
>>> 
>>> Onde estou errando? Vi que para montar uma pweibull são necessários o
>>> vetor de quantis e os parâmetros shape e scale. É necessário fazer separado
>>> e quardar em uma variável e depois jogar na ks? Como consigo esse vetor de
>>> quantis? Achei que seria automático.
>>> Estou correto se fizer assim:
>>> 
>>> ks.test(vetor, "pweibull",10,2)
>>> 
>>> E tem alguma forma de estimar os parâmetros shape e scale desta função?
>>> 
>>> 
>>> _______________________________________________
>>> R-br mailing list
>>> R-br em listas.c3sl.ufpr.br
>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>> 
>>> 
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> 
>> 
>> 
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> 
>> 
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br