Re: [R-br] lillie.test vs ks.test

Texto da ajuda do R The Lilliefors (Kolomorov-Smirnov) test is the most famous EDF omnibus test for normality. Compared to the Anderson-Darling test and the Cramer-von Mises test it is known to perform worse. Although the test statistic obtained from lillie.test(x) is the same as that obtained from ks.test(x, "pnorm", mean(x), sd(x)), it is not correct to use the p-value from the latter for the composite hypothesis of normality (mean and variance unknown), since the distribution of the test statistic is different when the parameters are estimated. Minha base de dados consiste de uma amostra de tempos de reparo de equipamentos e tempos de operação (um vetor para cada). Neste caso o mais adequado é o lillie.test?

Sugiro que se preocupe menos com a qualidade do teste que irá executar e verifique na literatura o que ela fala sobre tais variáveis. Falo isso porque Normal é uma das distribuições que seus dados podem assumir (a mais improvável, a meu ver). De uma olhada em fitdistr (Pacote MASS), este comando te ajudará a ter uma idéia dos parâmetros e seus respectivos desvios, permitindo inferir sobre os mesmos. Leonard On 06/06/2011, at 19:13, Cristiano Melo wrote:
Texto da ajuda do R
The Lilliefors (Kolomorov-Smirnov) test is the most famous EDF omnibus test for normality. Compared to the Anderson-Darling test and the Cramer-von Mises test it is known to perform worse. Although the test statistic obtained from lillie.test(x) is the same as that obtained from ks.test(x, "pnorm", mean(x), sd(x)), it is not correct to use the p-value from the latter for the composite hypothesis of normality (mean and variance unknown), since the distribution of the test statistic is different when the parameters are estimated.
Minha base de dados consiste de uma amostra de tempos de reparo de equipamentos e tempos de operação (um vetor para cada). Neste caso o mais adequado é o lillie.test? _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br

On Mon, 2011-06-06 at 19:13 -0300, Cristiano Melo wrote:
Texto da ajuda do R
The Lilliefors (Kolomorov-Smirnov) test is the most famous EDF omnibus test for normality. Compared to the Anderson-Darling test and the Cramer-von Mises test it is known to perform worse. Although the test statistic obtained from lillie.test(x) is the same as that obtained from ks.test(x, "pnorm", mean(x), sd(x)), it is not correct to use the p-value from the latter for the composite hypothesis of normality (mean and variance unknown), since the distribution of the test statistic is different when the parameters are estimated.
Minha base de dados consiste de uma amostra de tempos de reparo de equipamentos e tempos de operação (um vetor para cada). Neste caso o mais adequado é o lillie.test?
Cristiano, Sinceramente o teste de Lilliefors pode dizer que a sua variável é normal mas saiba que ele esta errado. De uma maneira mais formal: O valor de p é a probabilidade de seus conjunto de dados pertencerem a uma distribuição normal porém mesmo que ele seja altíssimo sua distribuição pode no máximo se aproximar de uma normal. A distribuição normal varia de menos infinito a mais infinito. A variável tempo de ... não pode ter valor <=0 certo ? Logo não é normal -- []s Tura

Valeu pela observação Bernardo, eu já havia atentado para esta observação. É como você disse: se aproximar de uma normal. Em 8 de junho de 2011 07:08, Bernardo Rangel Tura <tura@centroin.com.br>escreveu:
On Mon, 2011-06-06 at 19:13 -0300, Cristiano Melo wrote:
Texto da ajuda do R
The Lilliefors (Kolomorov-Smirnov) test is the most famous EDF omnibus test for normality. Compared to the Anderson-Darling test and the Cramer-von Mises test it is known to perform worse. Although the test statistic obtained from lillie.test(x) is the same as that obtained from ks.test(x, "pnorm", mean(x), sd(x)), it is not correct to use the p-value from the latter for the composite hypothesis of normality (mean and variance unknown), since the distribution of the test statistic is different when the parameters are estimated.
Minha base de dados consiste de uma amostra de tempos de reparo de equipamentos e tempos de operação (um vetor para cada). Neste caso o mais adequado é o lillie.test?
Cristiano,
Sinceramente o teste de Lilliefors pode dizer que a sua variável é normal mas saiba que ele esta errado. De uma maneira mais formal:
O valor de p é a probabilidade de seus conjunto de dados pertencerem a uma distribuição normal porém mesmo que ele seja altíssimo sua distribuição pode no máximo se aproximar de uma normal.
A distribuição normal varia de menos infinito a mais infinito. A variável tempo de ... não pode ter valor <=0 certo ? Logo não é normal
-- []s Tura
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
participantes (3)
-
Bernardo Rangel Tura
-
Cristiano Melo
-
Leonard Assis