Tenho um banco de dados com 3074 linhas sem missing.
Uma variável dependente binária e mais 42 variáveis independentes também binárias (todas como fator).
Minha pergunta é quals VIs contribuem para a doença que está em VD.
Meu summary da VD apresenta o seguinte resultado:
summary(data.to.work.train$NMM)
Sem doença Com doença
2715 359
removi as variáveis com alta correlação (multicolinearidade) e fiz uma RL com todas as variáveis e nada deu signficativo.
Fiz tambem com variáveis individuais e nada de significativo.
A maioria das variáveis apresenta uma prevalência pequena da doença:
Não Sim
Não 2683 32
Sim 353 6
Alguém poderia opinar sobre uma possível solução? Ou outros passos a seguir?
--
In Jesu et Maria
Obrigado
Prof. Elias Carvalho
"Felix, qui potuit rerum cognoscere causas" (Virgil 29 BC)
"Blessed is he who has been able to understand the cause of things"