
Bom dia Estou analisando um banco de dados com variáveis dicotômicas apenas. Esse banco tem mais de 3.000 observações , a variável dependente tem como resposta 2.715 Não e 359 Sim, ou seja, 13% = Sim, porem entre as outras 42 variáveis independentes existem variãncias muito pequenas como por exemplo 3.069 Não e 5 Sim. Devo considerar uma variância mĩnima? Qual a melhor literatura para basear esssa decisão?

Elias, O "enunciado" da sua questão traz vários pontos que precisariam ser melhor elucidados: Com um desbalanço na resposta como o indicado 42 variáveis independentes pode levar a análise (que entimemicamente aponta para a Regressão Logística ou uma da família log-linear) ao que se denomina sobreajuste. A discussão sobre a quantidade de casos por variável é rebartiva, com autores propondo uma regra (*rule of thumb*) simplificada de dez a vinte casos por variável independente, enquanto outros buscam via arcanas apresentações, geralmente via simulações, que não apresentam prova matemática definitiva, que essa exigência seria exagerada. Outrossim, pensando no domínio do problema você pode considerar que no caso de VIs com variância muito pequena elas estão efetivamente entrando como "mudas" para a explicação do seu problema, pelo menos do ponto de vista matemático, e uma interpretação delas para o que está sendo modelado pode fechar a questão. HTH -- Cesar Rabak On Wed, Jun 3, 2020 at 9:10 AM Elias Carvalho por (R-br) < r-br@listas.c3sl.ufpr.br> wrote:
Bom dia
Estou analisando um banco de dados com variáveis dicotômicas apenas. Esse banco tem mais de 3.000 observações , a variável dependente tem como resposta 2.715 Não e 359 Sim, ou seja, 13% = Sim, porem entre as outras 42 variáveis independentes existem variãncias muito pequenas como por exemplo 3.069 Não e 5 Sim.
Devo considerar uma variância mĩnima? Qual a melhor literatura para basear esssa decisão?
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
participantes (3)
-
Cesar Rabak
-
Elias Carvalho
-
Jobenil - Gmail