[R-br] Regressão logistica (conceito)

Leonard Mendonça de Assis assis.leonard em gmail.com
Terça Novembro 6 20:19:53 BRST 2012


Vinícius

o que você está chamando de reamostragem?

[]s
Leonard de Assis
http://about.me/ldeassis

Em 06/11/2012 19:14, Vinicius Brito Rocha escreveu:
> Pessoal,
>
> preciso tirar uma dúvida a respeito de regressão logistica.
>
> Tenho uma conjunto de dados, onde existe um grande desbalanceamento 
> nas classes da variável resposta (meu evento Y=1 a ser modelado, 
> possui poucas observações)
>
> O que fiz foi:
>
> separei 70% dos dados para amostra treino e 30% para teste.
>
> na amostra treino (70%):
>
>   * utilizei uma re-amostragem, apenas na classe do evento (Y=1) e fiz
>     com que as linhas desta  classe fossem re-amostradas até que a
>     classe com resposta Y=1 possui-se a mesma quantidade de linhas da
>     classe (Y=0)
>   * Com minha base de amostra treino balanceada ajustei um modelo de
>     regressão logistica
>
>
> na amostra teste(30%):
>
>   * calculei minhas probabilidades de respostas a partir das variáveis
>     independentes da amostra teste.
>   * arbitrei um ponto de classificação de P_CHAP>= 0,7 para
>     classificar meu evento como classe (Y_CHAP=1) e  P_CHAP<0,7
>     classificar meu evento como Y_CHAP=0
>   * Construi uma tabela de confusão comparando os resultados Y_CHAP e
>     Y para comparar minha Sensitividade e 1-Especificidade.
>
> Dúvidas:
>
> A questão é que meus resultados estão muito ruins. Acredito que é a 
> estrutura de dados.
>
>   * Estou sendo questionado a respeito da técnica de re-amostragem na
>     amostra treino para equilibrar as classes. Pois o demandante
>     acredita que é necessário algum tipo de correção do modelo(feito a
>     re-amostragem no ajuste da amostra treino) ao aplica-lo no
>      conjunto teste, que não sofreu nenhuma alteração.
>
>
> Alguém tem algum material que justifique o uso de re-amostragem nos 
> dados da amostra treino?
>
> Abs.
> -- 
> /Vinicius Brito Rocha./
> /Estatístico e Atuário (IM / UFRJ)//
> Mestre em Pesquisa Operacional (COPPE / UFRJ)/
>
> www.aplicademic.blogspot.com <http://www.aplicademic.blogspot.com>
> http://twitter.com/viniciusbritor
>
> "Não se preocupe muito com as suas dificuldades em Matemática, posso 
> assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.
>
>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20121106/1bec8155/attachment.html>


Mais detalhes sobre a lista de discussão R-br