[R-br] Regressão Logística pode ser influenciada pelo balanceamento de resultados de variável dependente

Elias Carvalho ecacarva em gmail.com
Ter Abr 21 17:57:05 -03 2020


Tenho um banco de dados com 3074 linhas sem missing.

Uma variável dependente binária e mais 42 variáveis independentes também
binárias (todas como fator).

Minha pergunta é quals VIs contribuem para a doença que está em VD.

Meu summary da VD apresenta o seguinte resultado:

summary(data.to.work.train$NMM)
Sem doença  Com doença
             2715               359

removi as variáveis com alta correlação (multicolinearidade) e fiz uma RL
com todas as variáveis e nada deu signficativo.

Fiz tambem com variáveis individuais e nada de significativo.

A maioria das variáveis apresenta uma prevalência pequena da doença:

          Não  Sim
  Não 2683   32
  Sim  353     6

Alguém poderia opinar sobre uma possível solução? Ou outros passos a seguir?
-- 


*In Jesu et Maria*
*Obrigado*
*Prof. Elias Carvalho*

*"Felix, qui potuit rerum cognoscere causas" (Virgil 29 BC)"Blessed is he
who has been able to understand the cause of things"*
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20200421/4cb19d02/attachment.html>


Mais detalhes sobre a lista de discussão R-br