Bom dia pessoal

Preciso de uma orientação.

Tenho uma base de dados com missing em uma quantidade razoável.

As variáveis com missing são: 4 dicotômicas (0 e 1) e 5 quantitativas contínuas.

Lendo sobre sobre os métodos para váriáveis quantitativas eu percebi que se usa muito o Predicitive Mean Matching (PMM) como um bom método de machine learning para IM, então pensei em usar este, mas tem outros.

Já para variáveis qualitativas dicotomicas vi na documentação: logreg, logreg.boot, porém vi em uma dissertação de mestrado que se utilizou o polyreg que é indicada para variáveis qualitativa nominal, assim como o método lda.

Portanto, minha dúvida é: como escolher/avaliar o melhor método de imputação?
 

--
In Jesu et Maria

Obrigado
Prof. Elias Carvalho

"Felix, qui potuit rerum cognoscere causas" (Virgil 29 BC)
"Blessed is he who has been able to understand the cause of things"