[R-br] Variancia
Cesar Rabak
cesar.rabak em gmail.com
Qua Jun 3 13:49:03 -03 2020
Elias,
O "enunciado" da sua questão traz vários pontos que precisariam ser melhor
elucidados:
Com um desbalanço na resposta como o indicado 42 variáveis independentes
pode levar a análise (que entimemicamente aponta para a Regressão Logística
ou uma da família log-linear) ao que se denomina sobreajuste.
A discussão sobre a quantidade de casos por variável é rebartiva, com
autores propondo uma regra (*rule of thumb*) simplificada de dez a vinte
casos por variável independente, enquanto outros buscam via arcanas
apresentações, geralmente via simulações, que não apresentam prova
matemática definitiva, que essa exigência seria exagerada.
Outrossim, pensando no domínio do problema você pode considerar que no caso
de VIs com variância muito pequena elas estão efetivamente entrando como
"mudas" para a explicação do seu problema, pelo menos do ponto de vista
matemático, e uma interpretação delas para o que está sendo modelado pode
fechar a questão.
HTH
--
Cesar Rabak
On Wed, Jun 3, 2020 at 9:10 AM Elias Carvalho por (R-br) <
r-br em listas.c3sl.ufpr.br> wrote:
> Bom dia
>
> Estou analisando um banco de dados com variáveis dicotômicas apenas.
> Esse banco tem mais de 3.000 observações , a variável dependente tem como
> resposta 2.715 Não e 359 Sim, ou seja, 13% = Sim, porem entre as outras 42
> variáveis independentes existem variãncias muito pequenas como por exemplo
> 3.069 Não e 5 Sim.
>
> Devo considerar uma variância mĩnima?
> Qual a melhor literatura para basear esssa decisão?
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20200603/8f62a789/attachment.html>
Mais detalhes sobre a lista de discussão R-br