[R-br] Regressão Logística pode ser influenciada pelo balanceamento de resultados de variável dependente
Elias Carvalho
ecacarva em gmail.com
Ter Abr 21 17:57:05 -03 2020
Tenho um banco de dados com 3074 linhas sem missing.
Uma variável dependente binária e mais 42 variáveis independentes também
binárias (todas como fator).
Minha pergunta é quals VIs contribuem para a doença que está em VD.
Meu summary da VD apresenta o seguinte resultado:
summary(data.to.work.train$NMM)
Sem doença Com doença
2715 359
removi as variáveis com alta correlação (multicolinearidade) e fiz uma RL
com todas as variáveis e nada deu signficativo.
Fiz tambem com variáveis individuais e nada de significativo.
A maioria das variáveis apresenta uma prevalência pequena da doença:
Não Sim
Não 2683 32
Sim 353 6
Alguém poderia opinar sobre uma possível solução? Ou outros passos a seguir?
--
*In Jesu et Maria*
*Obrigado*
*Prof. Elias Carvalho*
*"Felix, qui potuit rerum cognoscere causas" (Virgil 29 BC)"Blessed is he
who has been able to understand the cause of things"*
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20200421/4cb19d02/attachment.html>
Mais detalhes sobre a lista de discussão R-br