<html><head><style type='text/css'>p { margin: 0; }</style></head><body><div style='font-family: times new roman,new york,times,serif; font-size: 12pt; color: #000000'>O teste de Kolmogorov-Smirnov (K-S) não resolve?<br><br><br><div><span name="x"></span>Lucas F. de Souza<br>Eng. Agrícola - CONAB<br>M.Sc. Produção Vegetal - UENF<br>Doutor em Agrometeorologia - ESALQ/USP<br>tel: (19) 98160-7068<span name="x"></span><br></div><br><hr id="zwchr"><blockquote style="border-left:2px solid rgb(16, 16, 255);margin-left:5px;padding-left:5px;color:#000;font-weight:normal;font-style:normal;text-decoration:none;font-family:Helvetica,Arial,sans-serif;font-size:12pt;"><b>De: </b>"Luiz Roberto Martins Pinto" <luizroberto.uesc@gmail.com><br><b>Para: </b>r-br@listas.c3sl.ufpr.br<br><b>Enviadas: </b>Quarta-feira, 23 de Julho de 2014 10:40:53<br><b>Assunto: </b>[R-br] Teste para comparar distribuições<br><br><div dir="ltr"><div>Caros amigos,</div><div><br></div><div>Fiz uma pesquisa no Google, mas não consegui uma solução satisfatória. Então peço ajuda.</div><div><br></div><div>Preciso de encontrar um teste que <b>quantifique</b> a semelhança entre dois vetores para checar se eles têm o mesmo tipo de distribuição, por meio de p.value.</div>
<div>O interesse principal é comparar os vetores x e ab.</div><div><br></div><div>Data set:<br></div><div><a href="http://www.datafilehost.com/d/f3757310" target="_blank">http://www.datafilehost.com/d/f3757310</a><br></div><div><br></div>
<div>library(Hmisc)</div><div>library(grDevices)</div><div>load('NNC D_d3kk2.RData')</div><div><br></div><div># Avaliação qualitativa (gráfica):</div><div><br></div><div>dev.set(which=1)          </div><div>bpplot(d3)</div>
<div>boxplot(d3)</div><div><br></div><div><div># Aparentemente os vetores x, abC e ab são muitos semelhantes</div><div># A minha expectativa é encontrar um teste que quantifique esta semelhança por meio de p.value</div><div>
# Então fiz os testes abaixo</div></div><div><br></div><div># Avaliação quantitativa:</div><div><br></div><div>v2=d3$ab</div><div><br></div><div># Comparando o vetor x com o vetor ab:</div><div><br></div><div>v1=d3$x</div>
<div>round(ks.test(v1, v2)$p.value,2)</div><div><br></div><div># Out put: p.value=0. Então o vetor x é estatisticamente DIFERENTE do vetor ab.</div><div><br></div><div># Comparando o vetor abC com o vetor ab:</div><div><br>
</div><div>v1=d3$abC</div><div>round(ks.test(v1, v2)$p.value,2)<br></div><div><br></div><div># Out put: p.value=0.65. Então o vetor x é estatisticamente IGUAL do vetor abC.<br></div><div><br></div><div># Comparando o vetor abC com o vetor x:</div>
<div><br></div><div>v2=d3$x<br></div><div>round(ks.test(v1, v2)$p.value,2)<br></div><div><br></div><div># Out put: p.value=0. Então o vetor abC é estatisticamente DIFERENTE do vetor x.<br></div><div><br></div><div>### <b>Testes alternativos</b>, para comparar o vetor x com ab:</div>
<div><br></div><div><div>v2=d3$ab</div><div>v1=d3$x</div><div><br></div><div>t1=round(ks.test(v1, v2)$p.value,2);t1         # Out put: p.value=0</div><div>t2=round(ks.test(v1, v2, alternative = "l")$p.value,2);t2      # Out put: p.value=0<br>
</div><div>t3=round(ks.test(v1, v2, alternative = "g")$p.value,2);t3     # Out put: p.value=0.85</div></div><div><br></div><div># Então, para este Data set (NNC D_d3kk2.RData), e para o t3=0.85. Então, por meio deste teste, o vetor x é estatisticamente IGUAL do vetor ab.</div>
<div><br></div><div># <b>No entanto</b>, fazendo os testes com conjuntos de dados diferentes (10000 Data set) (mas, sempre com mesmo tamanho de vetor), quando comparo o vetor x com o vetor ab:</div><div><br></div><div>   ## em aproximadamente 60% das comparações (ou em 6000 Data set)   t1>0.05</div>
<div>   ## em aproximadamente 80% das comparações (ou em 8000 Data set)   t2>0.05</div><div>   ## em aproximadamente 80% das comparações (ou em 8000 Data set)   t3>0.05</div><div><br></div><div>   ## em aproximadamente 85% das comparações (ou em 8500 Data set)   t1 <b style="background-color:"><font color="#ff0000">OU</font></b> t2 >0.05  </div>
<div>   ## em aproximadamente 85% das comparações (ou em 8500 Data set)   t1 <b style="background-color:"><font color="#ff0000">OU</font></b> t3 >0.05 </div><div>   </div><div>   ## em 0% das comparações (ou em 0 Data set)             t2  <font style="background-color:" color="#ff0000"><b>E</b></font>   t3 >0.05 </div>
<div>   ## em 100% das comparações (ou em 10000 Data set)  t2 <b><font color="#ff0000"><span style="background-color:">OU</span>  </font></b>t3 >0.05  </div><div><br></div><div><br></div><div><div>Luiz Roberto Martins Pinto<br>
Prof. Pleno/DCET/UESC</div><div>Laboratório de Estatística Computacional</div><div>Universidade Estadual de Santa Cruz</div><div>Ilhéus-Bahia<br><br><a href="mailto:luizroberto.uesc@gmail.com" target="_blank">luizroberto.uesc@gmail.com</a><br>
skype: lrmpinto</div>
<div><a href="http://lattes.cnpq.br/2732314327604831" target="_blank">http://lattes.cnpq.br/2732314327604831</a> <br><br><br></div></div>
</div>
<br>_______________________________________________<br>R-br mailing list<br>R-br@listas.c3sl.ufpr.br<br>https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br<br>Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.</blockquote><br></div></body></html>