<div dir="ltr">Thales,<div><br></div><div>Considerar a normalidade (ou seja se a distribuição é gaussiana ou não¹) apenas das diferenças seria estudar um processo diferente. Um processo onde apenas a distribuição das médias (então que passaríamos a tratar como uma amostra de uma população de resultados desse processo que gera essas diferenças).</div>

<div><br></div><div>O que pode ser ou não o caso do OP. </div><div><br></div><div>Contudo, em geral, o teste t é um teste para verificar se uma medida de posição (média) de uma distribuição (assumida ser gaussiana) difere de outra outra (idem) e como hipótese nula assume-se que as duas amostras viriam da mesma distribuição e portanto a expectativa (diferença entre as duas amostras seria zero).</div>

<div><br></div><div>A formulação do teste pareado é feito para aumentar o poder do teste frente ao conhecimento adicional que o mesmo conjunto de indivíduos está contido em ambas as amostras, note porém que ainda se usa um outro parâmetro (estimado da(s) amostra(s)) a variância (ou desvio padrão) nas fórmulas, mantendo a premissa que os dados viriam de uma distribuição gaussiana.</div>

<div><br></div><div>Nesse caso a hipótese de a distribuição ser gaussiana é mantida para que o resultado do teste sobre a média possa ser analisado.</div><div><br></div><div>HTH</div><div><br></div><div>--</div><div>Cesar Rabak</div>

<div><br></div><div>[1] Meu ouvido e olhos podem ser distraídos pela palavra "normalidade" que muitos sentidos diferentes. . .</div></div><div class="gmail_extra"><br><br><div class="gmail_quote">2014-04-25 13:23 GMT-03:00 Marcos Vital <span dir="ltr"><<a href="mailto:marcosvital@gmail.com" target="_blank">marcosvital@gmail.com</a>></span>:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">Olá, Thales<div><br></div><div>Bom, não estou respondendo a sua dúvida sobre Monte Carlo (não conheço bem o método), mas queria fazer uma observação sobre o pressuposto da normalidade.</div>

<div><br></div><div>

Como o seu teste é pareado, o cálculo do t é feito sobre as diferenças, e não sobre os valores brutos. Então acredito que você deva testar a normalidade das diferenças entre as variáveis x e y.</div><div><br></div><div>Fiz o teste rapidamente com os dados que você incluiu no email, e o shapiro agora não rejeita a normalidade. Veja:</div>


<div><br></div><div>dif<-x-y</div><div><br></div><div><div>shapiro.test(dif)</div><div><br></div><div>        Shapiro-Wilk normality test</div><div><br></div><div>data:  dif</div><div>W = 0.9716, p-value = 0.2683</div>


<div><br></div><div class="gmail_extra">Considere isso como possibilidade, então, pois é possível que você não precise sair do bom e velho teste t.</div><div class="gmail_extra"><br></div><div class="gmail_extra">Abraços</div>


<div class="gmail_extra"><br></div><div class="gmail_extra">Marcos<br><br><div class="gmail_quote">Em 25 de abril de 2014 12:00,  <span dir="ltr"><<a href="mailto:r-br-request@listas.c3sl.ufpr.br" target="_blank">r-br-request@listas.c3sl.ufpr.br</a>></span> escreveu:<br>


<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">Enviar submissões para a lista de discussão R-br para<br>


        <a href="mailto:r-br@listas.c3sl.ufpr.br" target="_blank">r-br@listas.c3sl.ufpr.br</a><br>

<br>

Para se cadastrar ou descadastrar via WWW, visite o endereço<br>

        <a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>

ou, via email, envie uma mensagem com a palavra 'help' no assunto ou<br>

corpo da mensagem para<br>

        <a href="mailto:r-br-request@listas.c3sl.ufpr.br" target="_blank">r-br-request@listas.c3sl.ufpr.br</a><br>

<br>

Você poderá entrar em contato com a pessoa que gerencia a lista pelo<br>

endereço<br>

        <a href="mailto:r-br-owner@listas.c3sl.ufpr.br" target="_blank">r-br-owner@listas.c3sl.ufpr.br</a><br>

<br>

Quando responder, por favor edite sua linha Assunto assim ela será<br>

mais específica que "Re: Contents of R-br digest..."<br>

<br>

<br>Message: 2<br>

Date: Fri, 25 Apr 2014 08:55:04 +0200<br>

From: Tropidurus Torquatus <<a href="mailto:t.torquatus@gmail.com" target="_blank">t.torquatus@gmail.com</a>><br>

To: <a href="mailto:r-br@listas.c3sl.ufpr.br" target="_blank">r-br@listas.c3sl.ufpr.br</a><br>

Subject: [R-br] [OFF-Topic] Distribuição Normal e teste de t<br>

Message-ID: <<a href="mailto:E44FD9CC-9263-4D76-91B5-C084EDFB64C7@gmail.com" target="_blank">E44FD9CC-9263-4D76-91B5-C084EDFB64C7@gmail.com</a>><br>

Content-Type: text/plain; charset=windows-1252<div><div class="h5"><br>

<br>

Caros R-users,<br>

<br>

Coloquei como off-topic pois acredito que esta seja mais uma dúvida conceitual do que de R ppd.<br>

<br>

Dado que tenho dois conjuntos de dados:<br>

<br>

x <- c ( 13.772 , 10.119 , 11.224 , 21.999 , 17.181 , 27.477 , 21.693 , 26.706 , 14.576 , 19.689 , 12.494 , 19.511 , 16.785 , 16.551 , 20.780 ,  0.000 , 25.867 , 28.223 , 26.059 , 21.668 , 18.209 , 20.186 , 28.320 , 26.946 , 16.218 , 16.814 , 16.859 ,  0.000 ,  0.000 ,  3.986 ,  1.625 , 17.286 , 28.149 , 19.404 , 21.669 , 22.058 , 14.947 , 14.512 , 21.177 , 29.997 , 20.958 , 15.123 , 28.932 , 23.807 , 30.589 , 10.208 , 20.076 , 18.897 , 14.666 , 13.955)<br>


<br>

y <-  c ( 13.902 , 10.102 , 11.301 , 22.081 , 17.234 , 27.540 , 21.741 , 26.677 , 14.621 , 19.766 , 12.547 , 19.622 , 16.857 , 16.628 , 20.787 ,  0.000 , 25.943 , 28.313 , 26.166 , 21.724 , 18.255 , 20.307 , 28.387 , 27.079 , 16.202 , 16.857 , 16.875 ,  0.000 ,  0.000 ,  3.951 ,  1.681 , 17.353 , 28.273 , 19.422 , 21.724 , 22.164 , 14.902 , 14.458 , 21.174 , 30.024 , 20.949 , 15.101 , 28.926 , 23.850 , 30.597 , 10.147 , 20.035 , 18.873 , 14.691 , 13.892)<br>


<br>

As duas amostras estão pareadas.<br>

As duas amostras falham para o teste de normalidade:<br>

<br>

> shapiro.test ( x )<br>

<br>

        Shapiro-Wilk normality test<br>

<br>

data:  testetcompounds$tR...tM.UV.ABC<br>

W = 0.9373, p-value = 0.01057<br>

<br>

> shapiro.test ( y )<br>

<br>

        Shapiro-Wilk normality test<br>

<br>

data:  testetcompounds$tR...tM.UV.ABC.Group10<br>

W = 0.9372, p-value = 0.01043<br>

<br>

No livro Bayesian Computation with R<br>

<br>

Sugere que para distribuições não normais é necessário fazer o teste de Monte Carlo<br>

<br>

Com a seguinte função<br>

=======================================================<br>

 tstatistic = function ( y , x )<br>

  {<br>

  m = length ( y )<br>

  n = length ( x )<br>

  sp = sqrt( ( ( m - 1 ) * sd ( y ) ^ 2 + ( n - 1 ) * sd ( x ) ^ 2 ) / ( m + n - 2 ) )<br>

  t = ( mean ( y ) - mean ( x ) ) / ( sp * sqrt ( 1 / m + 1 / n) )<br>

  return ( t )<br>

  }<br>

========================================================<br>

Retornando<br>

<br>

t = -0.02242564<br>

<br>

Em seguida o teste:<br>

========================================================<br>

alpha = 0.01 ; m = 50 ; n = 50  # sets alpha, m and n ( alpha is the stated significance level, m and n are the samples sizes )<br>

N = 10000                                       # sets the number of simulations<br>

n.reject = 0                                    # counter of num. of rejections<br>

for ( i in 1 : N )<br>

  {<br>

  x = rnorm ( m , mean = x , sd = x )                                                                                                                                                   # simulates xs from population 1<br>


  y = rnorm ( n , mean = y , sd = y )                                                                                                                                                   # simulates ys from population 2<br>


 t = tstatistic ( y , x )                       # computes the t statistic<br>

  if ( abs ( t ) > qt ( 1 - alpha / 2 , n + m - 2) )<br>

    n.reject = n.reject + 1                                                                                                                                                                     # reject if |t| exceeds critical pt<br>


  }<br>

true.sig.level = n.reject/N                                                                                                                                                                     # est. is proportions of rejections<br>


========================================================<br>

Retornando<br>

<br>

true.sig.level = 0.0049<br>

<br>

<br>

Problema Conceitual<br>

<br>

1) Como interpretar esse resultado?<br>

<br>

<br>

Porém ainda há uma diferença entre o t calculado por essa fórmula e o t calculado com o comando t.stat (padrão do R)<br>

<br>

================================================================<br>

t = t.test ( y , x , mu = 0 , paired = TRUE , var.equal = TRUE , conf.level = 0.9999 )<br>

t<br>

<br>

        Paired t-test<br>

<br>

data:  y and x<br>

t = 4.6437, df = 49, p-value = 2.594e-05<br>

alternative hypothesis: true difference in means is not equal to 0<br>

99.99 percent confidence interval:<br>

 0.003082235 0.067077765<br>

sample estimates:<br>

mean of the differences<br>

                0.03508<br>

<br>

================================================================<br>

<br></div></div>

E finalmente? minha média da diferencia é conhecida e não é zero, assim utilizei o seguinte comando:<br>

<br>

t = t.test ( y , x , mu = 0.87 , paired = TRUE , var.equal = TRUE , conf.level = 0.9999, alternative = "less? )<div class=""><br>

<br>

Paired t-test<br>

<br>

data:  y and x<br>

t = -110.5231, df = 49, p-value < 2.2e-16<br>

alternative hypothesis: true difference in means is less than 0.87<br>

99.99 percent confidence interval:<br>

       -Inf 0.06545182<br>

sample estimates:<br>

mean of the differences<br>

                0.03508<br>

<br></div>

2) Problema de Comando? como fazer a simulação de Monte Carlo na situação acima?<div class=""><br>

<br>

* Obs.: aceito sugestões de leitura sobre o assunto e comando alternativos para comparar a médias<br>

<br>

<br>

Muito obrigado e me desculpe pelo longo e-mail.<br>

<br>

<br>

Thales<br>

<br>

<br></div></blockquote></div><span class="HOEnZb"><font color="#888888"><br clear="all"><div><br></div>-- <br>Marcos Vinícius Carneiro Vital<br>Universidade Federal de Alagoas<br>Instituto de Ciências Biológicas e da Saúde<br>

Setor de Biodiversidade e Ecologia

</font></span></div></div></div>

<br>_______________________________________________<br>

R-br mailing list<br>

<a href="mailto:R-br@listas.c3sl.ufpr.br">R-br@listas.c3sl.ufpr.br</a><br>

<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>

Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br></div>