[R-br] Imputação de dados com processamento paralelo

Pedro Emmanuel Alvarenga Americano do Brasil emmanuel.brasil em gmail.com
Sexta Outubro 9 09:32:38 BRT 2015


Amigos de R,

Eu estou trabalhando com um banco de dados que possui mais de 220000
linhas. Eu cheguei numa parte do plano de análise em que imputação multipla
será conduzida.

Eu já usei a função Hmisc::aregIMpute e mice::mice que considero muito
boas. O problema é que com essa quantidade de dados pra descobrir que deu
um erro eu levo de 2h a 8h esperando. Então eu fiz um estrategia de testar
em bancos  menores subsets do principal.

Eu procurei por ai e há outros pacotes que fazem imputação mas não consegui
encontrar qualquer um que possa fazer imputação com computação em paralelo.

Alguem saberia indicar uma função que faça imputação multipla com
computação em paralelo?

Alguem ja tentou criar um algoritmo de computação em paralelo para fazer
imputação multipla com Hmisc::aregImput?

Abraço a todos,

Pedro Brasil
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20151009/1afe4e6f/attachment.html>


Mais detalhes sobre a lista de discussão R-br