[R-br] Sobre o R Revolution - para esclarecimentos

Diogo Ferrari diogoferrari em gmail.com
Quarta Novembro 28 10:37:56 BRST 2012


Caros,

Eu tenho mencionado o Revolution, e vejo que algumas perguntas tem
pipocado. Deixe eu tentar esclarecer algumas coisas que talvez seja util
para as necessidades de alguns usuários.

O Revolution faz tudo que o R faz. Ele é uma espécie de IDE, e a única
diferença é que ele tem algumas funções a mais feitas em java pelos
desenvolvedores. Essas funções a mais são para uso de Big-data e HPC, só
isso. Tais funções fazem parte do pacote Revoscale (um ?Revoscale no R
Revolution informa bastante), que já vem com o R Revolution e carregam
automaticamente quando você abre o software.

O Revolution é gratuito para uso acadêmico, e tem quase todas as
funcionalidades da versão paga, exceto algumas coisas para HPC. Na prática,
não faz falta. Basta pedir para baixar essa versão no site, fazer o mini
cadastro que você recebe no e-mail o key para instalar e o link para baixar.

A grande vantagem na minha opinião é o uso do big-data. Para isso, o
Revolution tem um formato de arquivo que facilita o processamento. Assim
como o SPSS tem o .sav, o Stata o .dta, o Revolution le todos, mas tem um
arquivo próprio .xdf, que torna a análise mais eficiente (.xdf é um arquivo
indexado, etc., etc.).

Minha experiência: estou analisando 6 censos brazileiros (5x +/- 20.000.000
de casos em cada). Com um pouco de programação estatística + Revolution +
.xdf, faço uma logit, de uma vez, nesses 5 censos (e mais 1 com +/-200.000
casos) em 10 segundos usando um note care2duo, 3GB e 160GB. Não encontrei
desempenho assim em qualquer outro software. Para qualquer outra coisa que
não envolva trabalhar com dados na hd ao invés da memória, ou que trabalhe
com tamanho big-data, o R sem essas funcionalidades a mais funciona muito
bem.

Abs.


-- 
Diogo Ferrari
University of San Paulo (USP)
Faculty of Philosophy, Languages, Literature and Human Sciences (FFLCH)
Department of Political Science (DCP)
San Paulo/SP - Brazil
E-mail: diogo.ferrari em usp.br

Open Source! Use R! Use Linux!

"A vida é a arte de tirar conclusões suficientes de dados insuficientes"
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20121128/78679ab6/attachment.html>


Mais detalhes sobre a lista de discussão R-br