[R-br] Regressão logistica (conceito)

Vinicius Brito Rocha viniciusbritor em gmail.com
Terça Novembro 6 19:14:35 BRST 2012


Pessoal,

preciso tirar uma dúvida a respeito de regressão logistica.

Tenho uma conjunto de dados, onde existe um grande desbalanceamento nas
classes da variável resposta (meu evento Y=1 a ser modelado, possui poucas
observações)

O que fiz foi:

separei 70% dos dados para amostra treino e 30% para teste.

na amostra treino (70%):


   - utilizei uma re-amostragem, apenas na classe do evento (Y=1) e fiz com
   que as linhas desta  classe fossem re-amostradas até que a classe com
   resposta Y=1 possui-se a mesma quantidade de linhas da classe (Y=0)
   - Com minha base de amostra treino balanceada ajustei um modelo de
   regressão logistica


na amostra teste(30%):

   - calculei minhas probabilidades de respostas a partir das variáveis
   independentes da amostra teste.
   - arbitrei um ponto de classificação de P_CHAP>= 0,7 para classificar
   meu evento como classe (Y_CHAP=1) e  P_CHAP<0,7 classificar meu evento como
   Y_CHAP=0
   - Construi uma tabela de confusão comparando os resultados Y_CHAP e Y
   para comparar minha Sensitividade e 1-Especificidade.

Dúvidas:

A questão é que meus resultados estão muito ruins. Acredito que é a
estrutura de dados.

   - Estou sendo questionado a respeito da técnica de re-amostragem na
   amostra treino para equilibrar as classes. Pois o demandante acredita que é
   necessário algum tipo de correção do modelo(feito a re-amostragem no ajuste
   da amostra treino) ao aplica-lo no  conjunto teste, que não sofreu nenhuma
   alteração.


Alguém tem algum material que justifique o uso de re-amostragem nos dados
da amostra treino?

Abs.
-- 
*Vinicius Brito Rocha.*
*Estatístico e Atuário (IM / UFRJ)**
Mestre em Pesquisa Operacional (COPPE / UFRJ)*

www.aplicademic.blogspot.com
http://twitter.com/viniciusbritor

"Não se preocupe muito com as suas dificuldades em Matemática, posso
assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20121106/f5a222fa/attachment.html>


Mais detalhes sobre a lista de discussão R-br