<html><head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8"></head><body><div>amostrar com reposição toda a informação da classe alvo  , Y=1 para que tenha o mesmo tamanho da classe Y=0. </div><div>apenas na amostra de treinamento</div><div><br></div><div><br></div><div><div style="font-size:75%;color:#575757">Enviado por Samsung Mobile</div></div> <br>Leonard Mendonça de Assis <assis.leonard@gmail.com> escreveu:<br>

    <div class="moz-cite-prefix">Vinícius<br>

      <br>

      o que você está chamando de reamostragem?<br>

      <pre class="moz-signature" cols="72">[]s

Leonard de Assis

<a class="moz-txt-link-freetext" href="http://about.me/ldeassis">http://about.me/ldeassis</a></pre>

      Em 06/11/2012 19:14, Vinicius Brito Rocha escreveu:<br>

    </div>

    <blockquote cite="mid:CAJSzTefJViwOw52j9yZn8b7ukGQkw8JUDKXySEyK2RurcRus6A@mail.gmail.com" type="cite">Pessoal,

      <div><br>

      </div>

      <div>preciso tirar uma dúvida a respeito de regressão logistica.</div>

      <div><br>

      </div>

      <div>Tenho uma conjunto de dados, onde existe um grande

        desbalanceamento nas classes da variável resposta (meu evento

        Y=1 a ser modelado, possui poucas observações)</div>

      <div><br>

      </div>

      <div>O que fiz foi:</div>

      <div><br>

      </div>

      <div>separei 70% dos dados para amostra treino e 30% para teste.</div>

      <div><br>

      </div>

      <div>na amostra treino (70%):</div>

      <div><br>

      </div>

      <div>

        <ul>

          <li>utilizei uma re-amostragem, apenas na classe do evento

            (Y=1) e fiz com que as linhas desta  classe fossem

            re-amostradas até que a classe com resposta Y=1 possui-se a

            mesma quantidade de linhas da classe (Y=0)</li>

          <li>Com minha base de amostra treino balanceada ajustei um

            modelo de regressão logistica</li>

        </ul>

        <div><br>

        </div>

        <div>na amostra teste(30%):</div>

        <div>

          <ul>

            <li>calculei minhas probabilidades de respostas a partir das

              variáveis independentes da amostra teste.</li>

            <li>arbitrei um ponto de classificação de P_CHAP>= 0,7

              para classificar meu evento como classe (Y_CHAP=1) e

               P_CHAP<0,7 classificar meu evento como Y_CHAP=0</li>

            <li>Construi uma tabela de confusão comparando os resultados

              Y_CHAP e Y para comparar minha Sensitividade e

              1-Especificidade.</li>

          </ul>

          <div>Dúvidas:</div>

          <div><br>

          </div>

          <div>A questão é que meus resultados estão muito ruins.

            Acredito que é a estrutura de dados.</div>

          <div>

            <ul>

              <li>Estou sendo questionado a respeito da técnica de

                re-amostragem na amostra treino para equilibrar as

                classes. Pois o demandante acredita que é necessário

                algum tipo de correção do modelo(feito a re-amostragem

                no ajuste da amostra treino) ao aplica-lo no  conjunto

                teste, que não sofreu nenhuma alteração.</li>

            </ul>

            <div><br>

            </div>

          </div>

        </div>

        <div>Alguém tem algum material que justifique o uso de

          re-amostragem nos dados da amostra treino?</div>

        <div><br>

        </div>

        <div>Abs.</div>

        -- <br>

        <i>Vinicius Brito Rocha.</i><br>

        <i style="font-weight:bold">Estatístico e Atuário <font size="1">(IM / UFRJ)</font></i><i style="font-weight:bold"><br>

          Mestre em Pesquisa Operacional <font size="1">(COPPE / UFRJ)</font></i><br>

        <br>

        <a moz-do-not-send="true" href="http://www.aplicademic.blogspot.com" target="_blank">www.aplicademic.blogspot.com</a><br>

        <a moz-do-not-send="true" href="http://twitter.com/viniciusbritor" target="_blank">http://twitter.com/viniciusbritor</a><br>

        <br>

        "Não se preocupe muito com as suas dificuldades em Matemática,

        posso assegurar-lhe que as minhas são ainda maiores." - Albert

        Einstein.<br>

        <br>

        <br>

      </div>

      <br>

      <fieldset class="mimeAttachmentHeader"></fieldset>

      <br>

      <pre wrap="">_______________________________________________

R-br mailing list

<a class="moz-txt-link-abbreviated" href="mailto:R-br@listas.c3sl.ufpr.br">R-br@listas.c3sl.ufpr.br</a>

<a class="moz-txt-link-freetext" href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a>

Leia o guia de postagem (<a class="moz-txt-link-freetext" href="http://www.leg.ufpr.br/r-br-guia">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.</pre>

    </blockquote>

    <br>

</body>