Pessoal,

Usei o algoritmo randomForest do pacote http://cran.r-project.org/web/packages/randomForest/randomForest.pdf para criar um classificador com 80% de acurácia. Quero utilizar este modelo (classificador) em ambiente de produção, integrado a uma aplicação escrita em Ruby. 

Para implementar a integração eu já fiz alguns testes com:

1) RApache: http://rapache.net/
2) Rserver: http://www.rforge.net/Rserve/doc.html
3) RinRuby: https://sites.google.com/a/ddahl.org/rinruby-users/
4) RScript: http://stat.ethz.ch/R-manual/R-patched/library/utils/html/Rscript.html
5) R com a opção "-e EXPR" via bash do unix.
6) Exportar o modelo usando PMML (http://journal.r-project.org/archive/2009-1/RJournal_2009-1_Guazzelli+et+al.pdf) e importá-lo no ruby.

No entanto, nenhuma das opções é rápida e robusta o sufiente para processar 4e+09 requisições em no máximo 4 horas. Aliás, se eu fosse fazer um ranking das opções, eu diria que em primeiro lugar está "R com a opção "-e EXPR" via bash do unix", seguido por RScript, depois RinRuby e depois todas as outras alternativas.

A parte em Ruby já foi desenvolvida para processar paralelamente em várias máquinas. No entanto, o gargalo da aplicação está sendo a execução do modelo em R. 

Alguém conhece alguma forma para converter um modelo preditivo em R (no caso, randomForest) para uma estrutura em C ou Ruby?

Valeu!
--
Fabrício J. Barth
http://fbarth.net.br
http://blog.fbarth.net.br
http://twitter.com/fbarth
http://www.flickr.com/fbarth