no 'R normal', vc deve usar HDF5 ou NetCDF combinado com Rmpi para trabalhar com volumes de dados maiores.<div class="gmail_extra"><br><br><div class="gmail_quote">2012/11/18 Diogo Ferrari <span dir="ltr"><<a href="mailto:diogoferrari@gmail.com" target="_blank">diogoferrari@gmail.com</a>></span><br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Oi Benilton<div><br></div><div>Valeu pela dica. Eu me referia ao proc paralelo com o R revolution mesmo, não com o pacote rmpi. Fiz isso por causa do tamanho do banco que precisava utilizar, que com o R normal (carregando na memoria) seria muito problematico e impossível em certas tarefas.</div>


<div><br></div><div>abs</div><div class="HOEnZb"><div class="h5"><div class="gmail_extra"><br><br><div class="gmail_quote">2012/11/18 Benilton Carvalho <span dir="ltr"><<a href="mailto:beniltoncarvalho@gmail.com" target="_blank">beniltoncarvalho@gmail.com</a>></span><br>


<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><p dir="ltr">Diogo, sua afirmação é incorreta. Eu uso o R diariamente em cluster MPI sem problemas. Divido as tarefas sem problemas entre os nós.... Veja o pacote Rmpi... Depois disso, vc pode começar a ver os outros pacotes associados. b</p>


<div><div>

<div class="gmail_quote">On 18 Nov 2012 14:07, "Diogo Ferrari" <<a href="mailto:diogoferrari@gmail.com" target="_blank">diogoferrari@gmail.com</a>> wrote:<br type="attribution"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">



Ola Regis,<div><br></div><div>Já trabalhei, ou melhor, tentei trabalhar, com R operando em servidor linux. O principal problema é a divisão do processamento. Não é possível dividir o processamento entre os nós. é possível apenas dividir dentro do próprio núcleo do processador. Eu trabalhei com bases na casa de 20x10^9. A melhor solução que encontrei foi o RevolutionR, fazer proc. paralelo local e converter os arquivos para .xdf (usado pelo revolution). Se o seu problema é computar sobre os dados, e não fazer simulações por exemplo, vc tem que encontrar uma solução que permita isso. É mais um problema de geranciamento e acesso aos dados do que capaciadade de processamento. O R tradicional carrega tudo na memória e, portanto, limita o uso de big data. O .xdf e o RevolutionR solucionam isso permitindo trabalhar com os dados sem carregá-los, além de dividir e indexar o banco, como se faz em SQL, por exemplo. Mas isso vai depender do que vc precisa fazer com os dados. As funções disponível para o RevolutionR são as mais simples.estão no pacote RevoscaleR.</div>




<div><br></div><div>abs</div><div class="gmail_extra"><br><br><div class="gmail_quote">2012/11/18 regis barros <span dir="ltr"><<a href="mailto:regisgbarros@yahoo.com.br" target="_blank">regisgbarros@yahoo.com.br</a>></span><br>




<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div><div style="font-size:12pt;font-family:times new roman,new york,times,serif"><div>Bom dia Pessoal</div><div>Gostaria de saber de pessoas que trabalham com cluster para linux e usam o r para executar os cálculos e modelos que venho trabalhando. Li nos e-mails anteriores que pessoas que estavam usando uma base de dados de 1*10^9, todavia gostaria de trabalhar com mais do que isto alguém trabalha?</div>




<div>Grato</div><div>Regis Godoy Barros</div><div style="font-family:'times new roman','new york',times,serif;font-size:12pt"><div style="font-family:'times new roman','new york',times,serif;font-size:12pt">




 </div> </div>  </div></div><br>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br><br clear="all"><div><br></div>-- <br>




Diogo Ferrari<div>University of San Paulo (USP)</div><div>Faculty of Philosophy, Languages, Literature and Human Sciences (FFLCH)</div><div>Department of Political Science (DCP)</div><div>San Paulo/SP - Brazil</div><div>



E-mail: <a href="mailto:diogo.ferrari@usp.br" target="_blank">diogo.ferrari@usp.br</a></div>
<div><br>Open Source! Use R! Use Linux!</div><div><br></div><div>"A vida é a arte de tirar conclusões suficientes de dados insuficientes"
</div><br>
</div>
<br>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div>
</div></div><br>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br><br clear="all"><div><br></div>-- <br>


Diogo Ferrari<div>University of San Paulo (USP)</div><div>Faculty of Philosophy, Languages, Literature and Human Sciences (FFLCH)</div><div>Department of Political Science (DCP)</div><div>San Paulo/SP - Brazil</div><div>

E-mail: <a href="mailto:diogo.ferrari@usp.br" target="_blank">diogo.ferrari@usp.br</a></div>
<div><br>Open Source! Use R! Use Linux!</div><div><br></div><div>"A vida é a arte de tirar conclusões suficientes de dados insuficientes"
</div><br>
</div>
</div></div><br>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br></div>