<div dir="ltr"><div>Caros amigos,</div><div><br></div><div>Fiz uma pesquisa no Google, mas não consegui uma solução satisfatória. Então peço ajuda.</div><div><br></div><div>Preciso de encontrar um teste que <b>quantifique</b> a semelhança entre dois vetores para checar se eles têm o mesmo tipo de distribuição, por meio de p.value.</div>
<div>O interesse principal é comparar os vetores x e ab.</div><div><br></div><div>Data set:<br></div><div><a href="http://www.datafilehost.com/d/f3757310">http://www.datafilehost.com/d/f3757310</a><br></div><div><br></div>
<div>library(Hmisc)</div><div>library(grDevices)</div><div>load('NNC D_d3kk2.RData')</div><div><br></div><div># Avaliação qualitativa (gráfica):</div><div><br></div><div>dev.set(which=1)          </div><div>bpplot(d3)</div>
<div>boxplot(d3)</div><div><br></div><div><div># Aparentemente os vetores x, abC e ab são muitos semelhantes</div><div># A minha expectativa é encontrar um teste que quantifique esta semelhança por meio de p.value</div><div>
# Então fiz os testes abaixo</div></div><div><br></div><div># Avaliação quantitativa:</div><div><br></div><div>v2=d3$ab</div><div><br></div><div># Comparando o vetor x com o vetor ab:</div><div><br></div><div>v1=d3$x</div>
<div>round(ks.test(v1, v2)$p.value,2)</div><div><br></div><div># Out put: p.value=0. Então o vetor x é estatisticamente DIFERENTE do vetor ab.</div><div><br></div><div># Comparando o vetor abC com o vetor ab:</div><div><br>
</div><div>v1=d3$abC</div><div>round(ks.test(v1, v2)$p.value,2)<br></div><div><br></div><div># Out put: p.value=0.65. Então o vetor x é estatisticamente IGUAL do vetor abC.<br></div><div><br></div><div># Comparando o vetor abC com o vetor x:</div>
<div><br></div><div>v2=d3$x<br></div><div>round(ks.test(v1, v2)$p.value,2)<br></div><div><br></div><div># Out put: p.value=0. Então o vetor abC é estatisticamente DIFERENTE do vetor x.<br></div><div><br></div><div>### <b>Testes alternativos</b>, para comparar o vetor x com ab:</div>
<div><br></div><div><div>v2=d3$ab</div><div>v1=d3$x</div><div><br></div><div>t1=round(ks.test(v1, v2)$p.value,2);t1         # Out put: p.value=0</div><div>t2=round(ks.test(v1, v2, alternative = "l")$p.value,2);t2      # Out put: p.value=0<br>
</div><div>t3=round(ks.test(v1, v2, alternative = "g")$p.value,2);t3     # Out put: p.value=0.85</div></div><div><br></div><div># Então, para este Data set (NNC D_d3kk2.RData), e para o t3=0.85. Então, por meio deste teste, o vetor x é estatisticamente IGUAL do vetor ab.</div>
<div><br></div><div># <b>No entanto</b>, fazendo os testes com conjuntos de dados diferentes (10000 Data set) (mas, sempre com mesmo tamanho de vetor), quando comparo o vetor x com o vetor ab:</div><div><br></div><div>   ## em aproximadamente 60% das comparações (ou em 6000 Data set)   t1>0.05</div>
<div>   ## em aproximadamente 80% das comparações (ou em 8000 Data set)   t2>0.05</div><div>   ## em aproximadamente 80% das comparações (ou em 8000 Data set)   t3>0.05</div><div><br></div><div>   ## em aproximadamente 85% das comparações (ou em 8500 Data set)   t1 <b style="background-color:rgb(0,255,255)"><font color="#ff0000">OU</font></b> t2 >0.05  </div>
<div>   ## em aproximadamente 85% das comparações (ou em 8500 Data set)   t1 <b style="background-color:rgb(0,255,255)"><font color="#ff0000">OU</font></b> t3 >0.05 </div><div>   </div><div>   ## em 0% das comparações (ou em 0 Data set)             t2  <font color="#ff0000" style="background-color:rgb(0,255,255)"><b>E</b></font>   t3 >0.05 </div>
<div>   ## em 100% das comparações (ou em 10000 Data set)  t2 <b><font color="#ff0000"><span style="background-color:rgb(0,255,255)">OU</span>  </font></b>t3 >0.05  </div><div><br></div><div><br></div><div><div>Luiz Roberto Martins Pinto<br>
Prof. Pleno/DCET/UESC</div><div>Laboratório de Estatística Computacional</div><div>Universidade Estadual de Santa Cruz</div><div>Ilhéus-Bahia<br><br><a href="mailto:luizroberto.uesc@gmail.com" target="_blank">luizroberto.uesc@gmail.com</a><br>
skype: lrmpinto</div>
<div><a href="http://lattes.cnpq.br/2732314327604831" target="_blank">http://lattes.cnpq.br/2732314327604831</a> <br><br><br></div></div>
</div>