Elias,
O "enunciado" da sua questão traz vários pontos que precisariam ser melhor elucidados:
Com um desbalanço na resposta como o indicado 42 variáveis independentes pode levar a análise (que entimemicamente aponta para a Regressão Logística ou uma da família log-linear) ao que se denomina sobreajuste.
A discussão sobre a quantidade de casos por variável é rebartiva, com autores propondo uma regra (rule of thumb) simplificada de dez a vinte casos por variável independente, enquanto outros buscam via arcanas apresentações, geralmente via simulações, que não apresentam prova matemática definitiva, que essa exigência seria exagerada.
Outrossim, pensando no domínio do problema você pode considerar que no caso de VIs com variância muito pequena elas estão efetivamente entrando como "mudas" para a explicação do seu problema, pelo menos do ponto de vista matemático, e uma interpretação delas para o que está sendo modelado pode fechar a questão.
HTH
--
Cesar Rabak