Bom dia pessoal
Preciso de uma orientação.
Tenho uma base de dados com missing em uma quantidade razoável.
As variáveis com missing são: 4 dicotômicas (0 e 1) e 5 quantitativas contínuas.
Lendo sobre sobre os métodos para váriáveis quantitativas eu percebi que se usa muito o Predicitive Mean Matching (PMM) como um bom método de machine learning para IM, então pensei em usar este, mas tem outros.
Já para variáveis qualitativas dicotomicas vi na documentação: logreg, logreg.boot, porém vi em uma dissertação de mestrado que se utilizou o polyreg que é indicada para variáveis qualitativa nominal, assim como o método lda.
Portanto, minha dúvida é: como escolher/avaliar o melhor método de imputação?
--
In Jesu et Maria
Obrigado
Prof. Elias Carvalho
"Felix, qui potuit rerum cognoscere causas" (Virgil 29 BC)
"Blessed is he who has been able to understand the cause of things"