<html><head></head><body><div style="color:#000; background-color:#fff; font-family:HelveticaNeue, Helvetica Neue, Helvetica, Arial, Lucida Grande, sans-serif;font-size:13px"><div id="yui_3_16_0_1_1468344080247_11114"><span id="yui_3_16_0_1_1468344080247_11345">OI, obrigada pela resposta.</span></div><div id="yui_3_16_0_1_1468344080247_11114"><span><br></span></div><div id="yui_3_16_0_1_1468344080247_11114" dir="ltr"><span id="yui_3_16_0_1_1468344080247_11338">Mas acredite, tenho de usar fora da memória RAM. Para manipular os dados, consegui com o pacote ffbase e Biglm, no entanto, no caso de análise discriminante e fatorial, o R não roda, ele trava e acusam excesso de tempo gasto para computar o que eu quero.</span></div><div id="yui_3_16_0_1_1468344080247_11114" dir="ltr"><span><br></span></div><div id="yui_3_16_0_1_1468344080247_11114" dir="ltr"><span id="yui_3_16_0_1_1468344080247_11344">Alguém conhece algum pacote?</span></div> <div class="qtdSeparateBR"><br><br></div><div class="yahoo_quoted" style="display: block;"> <div style="font-family: HelveticaNeue, Helvetica Neue, Helvetica, Arial, Lucida Grande, sans-serif; font-size: 13px;"> <div style="font-family: HelveticaNeue, Helvetica Neue, Helvetica, Arial, Lucida Grande, sans-serif; font-size: 16px;"> <div dir="ltr"><font size="2" face="Arial"> Em Segunda-feira, 11 de Julho de 2016 18:07, Leonardo Fontenelle via R-br <r-br@listas.c3sl.ufpr.br> escreveu:<br></font></div>  <br><br> <div class="y_msg_container"><div id="yiv9271951718"><title></title><div><div>A <a rel="nofollow" shape="rect" target="_blank" href="https://cran.r-project.org/web/views/HighPerformanceComputing.html">CRAN Task View para High Performance Computing</a> pode lhe dar algumas opções. Este artigo sobre <a rel="nofollow" shape="rect" target="_blank" href="http://www.r-bloggers.com/five-ways-to-handle-big-data-in-r/">Big Data no R</a> também é muito citado.<br clear="none"></div>
<div> </div>
<div>Você precisa mesmo de manter seus dados fora da RAM? Não é fácil estourar a memória RAM com dados de PNAD, embora eu nunca tenha tentado usar todos dados do Censo de uma só vez. Além disso, você frequentemente pode restringir-se apenas a um subconjunto de variáveis, o que facilita em muito a leitura dos dados e sua alocação na RAM.<br clear="none"></div>
<div> </div>
<div>Se o motivo de você achar isso é o read.fwf travar, tente importar os dados com alguma alternativa antes de concluir isso. Uma opção é usar a função do pacote readr, e outra é converter para csv usando o fwf2csv do pacote descr e então importar com o fread do pacote data.table.<br clear="none"></div>
<div> </div>
<div>Talvez a dificuldade maior seja com funções pouco otimizadas. Quando alguém se dá ao trabalho de escrever algo em C ou C++, o resultado costuma ser mais escalável do que código escrito. Além disso, é necessário tomar cuidado com laços <i>for</i> ou <i>apply</i> (que é um <i>for</i> disfarçado). Também sugiro considerar com carinho o uso de <a rel="nofollow" shape="rect" target="_blank" href="https://cran.r-project.org/web/packages/data.table/index.html">data.table</a> em vez de data.frame (outra alternativa parece ser o <a rel="nofollow" shape="rect" target="_blank" href="https://cran.r-project.org/web/packages/tibble/index.html">tibble</a>, mas não testei).<br clear="none"></div>
<div> </div>
<div>Espero ter ajudado.<br clear="none"></div>
<div> </div>
<div id="yiv9271951718sig4487139"><div class="yiv9271951718signature" id="yiv9271951718signature"><a rel="nofollow" shape="rect" target="_blank" href="http://lattes.cnpq.br/9234772336296638" title="Currículo Lattes">Leonardo Ferreira Fontenelle</a><br clear="none"></div>
</div>
<div> </div>
<div> </div>
<div>Em Seg 11 jul. 2016, às 12:24, Edimeire Alexandra Pinto via R-br escreveu:<br clear="none"></div>
<blockquote type="cite"><div class="yiv9271951718yqt7743934526" id="yiv9271951718yqt78884"><div style="color:rgb(0, 0, 0);background-color:rgb(255, 255, 255);font-family:HelveticaNeue,;"><div>OI Gente.<br clear="none"></div>
<div> </div>
<div>Eu descobri que para grandes conjuntos de dados, tipo Censo, Pnad, etc, existe o pacote ffbase, dplyr, sendo que para usar modelos lineares generalizados, podemos usar o pacote. biglm.<br clear="none"></div>
<div> </div>
<div>No entanto, preciso usar técnicas multivariadas, tipo Análise Fatorial e Discriminante. Alguém sabe qual posso usar quando trabalhamos com dados que "explodem" a memória do R? <br clear="none"></div>
<div> </div>
<div>Agradeço a todos.<br clear="none"></div>
</div></div>
<div><u>_______________________________________________</u><br clear="none"></div>
<div>R-br mailing list<br clear="none"></div>
<div><a rel="nofollow" shape="rect" ymailto="mailto:R-br@listas.c3sl.ufpr.br" target="_blank" href="mailto:R-br@listas.c3sl.ufpr.br">R-br@listas.c3sl.ufpr.br</a><br clear="none"></div>
<div><a rel="nofollow" shape="rect" target="_blank" href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br clear="none"></div>
<div>Leia o guia de postagem (<a rel="nofollow" shape="rect" target="_blank" href="http://www.leg.ufpr.br/r-br-guia">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br clear="none"></div>
</blockquote><div> </div>
</div></div><br><div class="yqt7743934526" id="yqt45621">_______________________________________________<br clear="none">R-br mailing list<br clear="none"><a shape="rect" ymailto="mailto:R-br@listas.c3sl.ufpr.br" href="mailto:R-br@listas.c3sl.ufpr.br">R-br@listas.c3sl.ufpr.br</a><br clear="none"><a shape="rect" href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br clear="none">Leia o guia de postagem (<a shape="rect" href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forne� c�igo m�imo reproduz�el.</div><br><br></div>  </div> </div>  </div></div></body></html>