<div dir="ltr">Elias,<div><br></div><div>O "enunciado" da sua questão traz vários pontos que precisariam ser melhor elucidados:</div><div><br></div><div>Com um desbalanço na resposta como o indicado 42 variáveis independentes pode levar a análise (que entimemicamente aponta para a Regressão Logística ou uma da família log-linear) ao que se denomina sobreajuste.</div><div><br></div><div>A discussão sobre a quantidade de casos por variável é rebartiva, com autores propondo uma regra (<i>rule of thumb</i>) simplificada de dez a vinte casos por variável independente, enquanto outros buscam via arcanas apresentações, geralmente via simulações, que não apresentam prova matemática definitiva, que essa exigência seria exagerada.</div><div><br></div><div>Outrossim, pensando no domínio do problema você pode considerar que no caso de VIs com variância muito pequena elas estão efetivamente entrando como "mudas" para a explicação do seu problema, pelo menos do ponto de vista matemático, e uma interpretação delas para o que está sendo modelado pode fechar a questão.</div><div><br></div><div>HTH</div><div>--</div><div>Cesar Rabak</div><div><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Wed, Jun 3, 2020 at 9:10 AM Elias Carvalho por (R-br) <<a href="mailto:r-br@listas.c3sl.ufpr.br">r-br@listas.c3sl.ufpr.br</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div dir="auto">Bom dia<div dir="auto"><br></div><div dir="auto">Estou analisando um banco de dados com variáveis dicotômicas apenas.</div><div dir="auto"><div style="font-family:"times new roman",serif;font-size:small" class="gmail_default">Esse banco tem mais de 3.000 observações , a variável dependente tem como resposta 2.715 Não e 359 Sim, ou seja, 13% = Sim, porem entre as outras 42 variáveis independentes existem variãncias muito pequenas como por exemplo 3.069 Não e 5 Sim. <br></div><div style="font-family:"times new roman",serif;font-size:small" class="gmail_default"><br></div><div style="font-family:"times new roman",serif;font-size:small" class="gmail_default">Devo considerar uma variância mĩnima? <br></div><div style="font-family:"times new roman",serif;font-size:small" class="gmail_default">Qual a melhor literatura para basear esssa decisão?<br></div><br></div><div dir="auto"><br></div></div>
</div>
_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" rel="noreferrer" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" rel="noreferrer" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br>
</blockquote></div>