Pessoal,<div><br></div><div>preciso tirar uma dúvida a respeito de regressão logistica.</div><div><br></div><div>Tenho uma conjunto de dados, onde existe um grande desbalanceamento nas classes da variável resposta (meu evento Y=1 a ser modelado, possui poucas observações)</div>

<div><br></div><div>O que fiz foi:</div><div><br></div><div>separei 70% dos dados para amostra treino e 30% para teste.</div><div><br></div><div>na amostra treino (70%):</div><div><br></div><div><ul><li>utilizei uma re-amostragem, apenas na classe do evento (Y=1) e fiz com que as linhas desta  classe fossem re-amostradas até que a classe com resposta Y=1 possui-se a mesma quantidade de linhas da classe (Y=0)</li>

<li>Com minha base de amostra treino balanceada ajustei um modelo de regressão logistica</li></ul><div><br></div><div>na amostra teste(30%):</div><div><ul><li>calculei minhas probabilidades de respostas a partir das variáveis independentes da amostra teste.</li>

<li>arbitrei um ponto de classificação de P_CHAP>= 0,7 para classificar meu evento como classe (Y_CHAP=1) e  P_CHAP<0,7 classificar meu evento como Y_CHAP=0</li><li>Construi uma tabela de confusão comparando os resultados Y_CHAP e Y para comparar minha Sensitividade e 1-Especificidade.</li>

</ul><div>Dúvidas:</div><div><br></div><div>A questão é que meus resultados estão muito ruins. Acredito que é a estrutura de dados.</div><div><ul><li>Estou sendo questionado a respeito da técnica de re-amostragem na amostra treino para equilibrar as classes. Pois o demandante acredita que é necessário algum tipo de correção do modelo(feito a re-amostragem no ajuste da amostra treino) ao aplica-lo no  conjunto teste, que não sofreu nenhuma alteração.</li>

</ul><div><br></div></div></div><div>Alguém tem algum material que justifique o uso de re-amostragem nos dados da amostra treino?</div><div><br></div><div>Abs.</div>-- <br><i>Vinicius Brito Rocha.</i><br><i style="font-weight:bold">Estatístico e Atuário <font size="1">(IM / UFRJ)</font></i><i style="font-weight:bold"><br>

Mestre em Pesquisa Operacional <font size="1">(COPPE / UFRJ)</font></i><br><br><a href="http://www.aplicademic.blogspot.com" target="_blank">www.aplicademic.blogspot.com</a><br><a href="http://twitter.com/viniciusbritor" target="_blank">http://twitter.com/viniciusbritor</a><br>

<br>"Não se preocupe muito com as suas dificuldades em Matemática, posso assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.<br><br><br>
</div>