[R-br] Regressão logistica (conceito)

Fernando Colugnati fcolugnati em gmail.com
Quinta Novembro 8 17:15:44 BRST 2012


Na verdade eu não conheço muito sobre métodos de classificação, mas para
utilização dos modelos logísticos não há qualquer suposição deste tipo...
Abs


Em 7 de novembro de 2012 00:22, Vinicius Brito Rocha <
viniciusbritor em gmail.com> escreveu:

> Fernando,
>
> sim. o modelo é para classificação.
>
> O problema é que minhas classes são extremamente desbalanceadas.
>
> Até onde sei recomenda-se ter classes balanceadas. E esse é exatamente o
> que estou trazendo a discussão.
>
> Você discorda disso?
>
> Abs.
>
> Vinicius Brito Rocha
>
> Em 6 de novembro de 2012 22:58, Fernando Colugnati <fcolugnati em gmail.com>escreveu:
>
>> Desde quando vc precisa ter 50% de 1 e 50% de zeros para fazer uma
>> regressão logística? Não entendi bem seu problema! Vc fala em
>> treinamento...este modelo será para classificação?
>>
>>
>>
>> Em 6 de novembro de 2012 23:37, viniciusbritor <viniciusbritor em gmail.com>escreveu:
>>
>> amostrar com reposição toda a informação da classe alvo  , Y=1 para que
>>> tenha o mesmo tamanho da classe Y=0.
>>> apenas na amostra de treinamento
>>>
>>>
>>> Enviado por Samsung Mobile
>>>
>>> Leonard Mendonça de Assis <assis.leonard em gmail.com> escreveu:
>>>
>>> Vinícius
>>>
>>> o que você está chamando de reamostragem?
>>>
>>> []s
>>> Leonard de Assishttp://about.me/ldeassis
>>>
>>> Em 06/11/2012 19:14, Vinicius Brito Rocha escreveu:
>>>
>>> Pessoal,
>>>
>>>  preciso tirar uma dúvida a respeito de regressão logistica.
>>>
>>>  Tenho uma conjunto de dados, onde existe um grande desbalanceamento
>>> nas classes da variável resposta (meu evento Y=1 a ser modelado, possui
>>> poucas observações)
>>>
>>>  O que fiz foi:
>>>
>>>  separei 70% dos dados para amostra treino e 30% para teste.
>>>
>>>  na amostra treino (70%):
>>>
>>>
>>>    - utilizei uma re-amostragem, apenas na classe do evento (Y=1) e fiz
>>>    com que as linhas desta  classe fossem re-amostradas até que a classe com
>>>    resposta Y=1 possui-se a mesma quantidade de linhas da classe (Y=0)
>>>    - Com minha base de amostra treino balanceada ajustei um modelo de
>>>    regressão logistica
>>>
>>>
>>>  na amostra teste(30%):
>>>
>>>    - calculei minhas probabilidades de respostas a partir das variáveis
>>>    independentes da amostra teste.
>>>    - arbitrei um ponto de classificação de P_CHAP>= 0,7 para
>>>    classificar meu evento como classe (Y_CHAP=1) e  P_CHAP<0,7 classificar meu
>>>    evento como Y_CHAP=0
>>>    - Construi uma tabela de confusão comparando os resultados Y_CHAP e
>>>    Y para comparar minha Sensitividade e 1-Especificidade.
>>>
>>> Dúvidas:
>>>
>>>  A questão é que meus resultados estão muito ruins. Acredito que é a
>>> estrutura de dados.
>>>
>>>    - Estou sendo questionado a respeito da técnica de re-amostragem na
>>>    amostra treino para equilibrar as classes. Pois o demandante acredita que é
>>>    necessário algum tipo de correção do modelo(feito a re-amostragem no ajuste
>>>    da amostra treino) ao aplica-lo no  conjunto teste, que não sofreu nenhuma
>>>    alteração.
>>>
>>>
>>>   Alguém tem algum material que justifique o uso de re-amostragem nos
>>> dados da amostra treino?
>>>
>>>  Abs.
>>> --
>>> *Vinicius Brito Rocha.*
>>> *Estatístico e Atuário (IM / UFRJ)**
>>> Mestre em Pesquisa Operacional (COPPE / UFRJ)*
>>>
>>> www.aplicademic.blogspot.com
>>> http://twitter.com/viniciusbritor
>>>
>>> "Não se preocupe muito com as suas dificuldades em Matemática, posso
>>> assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.
>>>
>>>
>>>
>>>
>>> _______________________________________________
>>> R-br mailing listR-br em listas.c3sl.ufpr.brhttps://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
>>>
>>>
>>>
>>> _______________________________________________
>>> R-br mailing list
>>> R-br em listas.c3sl.ufpr.br
>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>> código mínimo reproduzível.
>>>
>>
>>
>>
>> --
>> Fernando A.B. Colugnati
>>
>>
>>
>
>
> --
> *Vinicius Brito Rocha.*
> *Estatístico e Atuário (IM / UFRJ)**
> Mestre em Pesquisa Operacional (COPPE / UFRJ)*
>
> www.aplicademic.blogspot.com
> http://twitter.com/viniciusbritor
>
> "Não se preocupe muito com as suas dificuldades em Matemática, posso
> assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.
>
>
>


-- 
Fernando A.B. Colugnati
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20121108/e45ffb7c/attachment.html>


Mais detalhes sobre a lista de discussão R-br