<HTML><HEAD></HEAD>
<BODY dir=ltr>
<DIV dir=ltr>
<DIV style="FONT-SIZE: 12pt; FONT-FAMILY: 'Calibri'; COLOR: #000000">
<DIV> </DIV>
<DIV 
style="FONT-SIZE: small; FONT-FAMILY: 'Calibri'; FONT-WEIGHT: normal; COLOR: #000000; FONT-STYLE: normal; TEXT-DECORATION: none; DISPLAY: inline">
<DIV style="FONT: 10pt tahoma">
<DIV><FONT color=#9b00d3 size=3 face=Arial>Poderia me mandar este arquivo 
anexado, o datafilehost sempre me dá problema.</FONT></DIV></DIV>
<DIV> </DIV></DIV>
<DIV 
style="FONT-SIZE: small; FONT-FAMILY: 'Calibri'; FONT-WEIGHT: normal; COLOR: #000000; FONT-STYLE: normal; TEXT-DECORATION: none; DISPLAY: inline">
<DIV dir=ltr>
<DIV>Caros amigos,</DIV>
<DIV> </DIV>
<DIV>Fiz uma pesquisa no Google, mas não consegui uma solução satisfatória. 
Então peço ajuda.</DIV>
<DIV> </DIV>
<DIV>Preciso de encontrar um teste que <B>quantifique</B> a semelhança entre 
dois vetores para checar se eles têm o mesmo tipo de distribuição, por meio de 
p.value.</DIV>
<DIV>O interesse principal é comparar os vetores x e ab.</DIV>
<DIV> </DIV>
<DIV>Data set:<BR></DIV>
<DIV><A 
href="http://www.datafilehost.com/d/f3757310">http://www.datafilehost.com/d/f3757310</A><BR></DIV>
<DIV> </DIV>
<DIV>library(Hmisc)</DIV>
<DIV>library(grDevices)</DIV>
<DIV>load('NNC D_d3kk2.RData')</DIV>
<DIV> </DIV>
<DIV># Avaliação qualitativa (gráfica):</DIV>
<DIV> </DIV>
<DIV>dev.set(which=1)          
</DIV>
<DIV>bpplot(d3)</DIV>
<DIV>boxplot(d3)</DIV>
<DIV> </DIV>
<DIV>
<DIV># Aparentemente os vetores x, abC e ab são muitos semelhantes</DIV>
<DIV># A minha expectativa é encontrar um teste que quantifique esta semelhança 
por meio de p.value</DIV>
<DIV># Então fiz os testes abaixo</DIV></DIV>
<DIV> </DIV>
<DIV># Avaliação quantitativa:</DIV>
<DIV> </DIV>
<DIV>v2=d3$ab</DIV>
<DIV> </DIV>
<DIV># Comparando o vetor x com o vetor ab:</DIV>
<DIV> </DIV>
<DIV>v1=d3$x</DIV>
<DIV>round(ks.test(v1, v2)$p.value,2)</DIV>
<DIV> </DIV>
<DIV># Out put: p.value=0. Então o vetor x é estatisticamente DIFERENTE do vetor 
ab.</DIV>
<DIV> </DIV>
<DIV># Comparando o vetor abC com o vetor ab:</DIV>
<DIV> </DIV>
<DIV>v1=d3$abC</DIV>
<DIV>round(ks.test(v1, v2)$p.value,2)<BR></DIV>
<DIV> </DIV>
<DIV># Out put: p.value=0.65. Então o vetor x é estatisticamente IGUAL do vetor 
abC.<BR></DIV>
<DIV> </DIV>
<DIV># Comparando o vetor abC com o vetor x:</DIV>
<DIV> </DIV>
<DIV>v2=d3$x<BR></DIV>
<DIV>round(ks.test(v1, v2)$p.value,2)<BR></DIV>
<DIV> </DIV>
<DIV># Out put: p.value=0. Então o vetor abC é estatisticamente DIFERENTE do 
vetor x.<BR></DIV>
<DIV> </DIV>
<DIV>### <B>Testes alternativos</B>, para comparar o vetor x com ab:</DIV>
<DIV> </DIV>
<DIV>
<DIV>v2=d3$ab</DIV>
<DIV>v1=d3$x</DIV>
<DIV> </DIV>
<DIV>t1=round(ks.test(v1, 
v2)$p.value,2);t1         # Out put: 
p.value=0</DIV>
<DIV>t2=round(ks.test(v1, v2, alternative = 
"l")$p.value,2);t2      # Out put: p.value=0<BR></DIV>
<DIV>t3=round(ks.test(v1, v2, alternative = 
"g")$p.value,2);t3     # Out put: p.value=0.85</DIV></DIV>
<DIV> </DIV>
<DIV># Então, para este Data set (NNC D_d3kk2.RData), e para o t3=0.85. Então, 
por meio deste teste, o vetor x é estatisticamente IGUAL do vetor ab.</DIV>
<DIV> </DIV>
<DIV># <B>No entanto</B>, fazendo os testes com conjuntos de dados diferentes 
(10000 Data set) (mas, sempre com mesmo tamanho de vetor), quando comparo o 
vetor x com o vetor ab:</DIV>
<DIV> </DIV>
<DIV>   ## em aproximadamente 60% das comparações (ou em 6000 Data 
set)   t1>0.05</DIV>
<DIV>   ## em aproximadamente 80% das comparações (ou em 8000 Data 
set)   t2>0.05</DIV>
<DIV>   ## em aproximadamente 80% das comparações (ou em 8000 Data 
set)   t3>0.05</DIV>
<DIV> </DIV>
<DIV>   ## em aproximadamente 85% das comparações (ou em 8500 Data 
set)   t1 <B style="BACKGROUND-COLOR: rgb(0,255,255)"><FONT 
color=#ff0000>OU</FONT></B> t2 >0.05  </DIV>
<DIV>   ## em aproximadamente 85% das comparações (ou em 8500 Data 
set)   t1 <B style="BACKGROUND-COLOR: rgb(0,255,255)"><FONT 
color=#ff0000>OU</FONT></B> t3 >0.05 </DIV>
<DIV>   </DIV>
<DIV>   ## em 0% das comparações (ou em 0 Data 
set)             
t2  <FONT style="BACKGROUND-COLOR: rgb(0,255,255)" 
color=#ff0000><B>E</B></FONT>   t3 >0.05 </DIV>
<DIV>   ## em 100% das comparações (ou em 10000 Data set)  t2 
<B><FONT color=#ff0000><SPAN 
style="BACKGROUND-COLOR: rgb(0,255,255)">OU</SPAN>  </FONT></B>t3 
>0.05  </DIV>
<DIV> </DIV>
<DIV> </DIV>
<DIV>
<DIV>Luiz Roberto Martins Pinto<BR>Prof. Pleno/DCET/UESC</DIV>
<DIV>Laboratório de Estatística Computacional</DIV>
<DIV>Universidade Estadual de Santa Cruz</DIV>
<DIV>Ilhéus-Bahia<BR><BR><A href="mailto:luizroberto.uesc@gmail.com" 
target=_blank>luizroberto.uesc@gmail.com</A><BR>skype: lrmpinto</DIV>
<DIV><A href="http://lattes.cnpq.br/2732314327604831" 
target=_blank>http://lattes.cnpq.br/2732314327604831</A> 
<BR><BR><BR></DIV></DIV></DIV>
<P>
<HR>
_______________________________________________<BR>R-br mailing 
list<BR>R-br@listas.c3sl.ufpr.br<BR>https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br<BR>Leia 
o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo 
reproduzível.</DIV></DIV></DIV></BODY></HTML>