[R-br] Como trabalhar com uma base de dados muito grande

Benilton Carvalho beniltoncarvalho em gmail.com
Segunda Julho 4 13:55:33 BRT 2011


A intencao era q a funcao fosse 'quantileByCounts' :-)... mas se
funcionou, beleza.

Apos olhar a sua estrutura de dados, o 'ff' nao poderia ajudar
muito... Ele te permitiria representar sua tabela de dados de modo
mais eficiente, mas o uso de quantile(rep(x, counts)) eh o q mata seu
programa.

Se vc tivesse seus dados em um formato de texto (tab, csv, por
exemplo), vc poderia le-lo usando 'ff' diretamente e ter um objeto q
usa muito pouca RAM representando todo o seu conjunto de dados.
Entretanto, ao fazer quantile(rep(...)), vc perderia todo beneficio.

Usando queries apropriadas no seu banco de dados, vc poderia extrair
apenas um codigo por vez e pode ser que seu problema fosse resolvido
se vc usasse isso...

b

2011/7/4 Carlos Mendonça <csaeslpv em centroin.com.br>:
>        Benilton, funcionou perfeitamente. Consegui trabalhar com o arquivo
> completo, sem problema.
>
> Eu só precisei consertar a última linha do código, onde estava
> quantileByCounts(y$valor, y$ponderador
>
> corrigi para equantileByCounts(y$valor, y$ponderador. Muito obrigado.
>
> Se não for te tomar muito tempo, você poderia me dizer se nesse meu problema
> eu poderia utilizar o ff e como ficaria?
>
> Sò uma última coisa, quando eu preciso juntar dois arquivos isso só pode ser
> feito com o merge ou existe algum comando que seja
>
> semelhante ao comando set do SAS, que coloca um arquivo embaixo do outro?
>
> Agradeço e respondo também ao Bernardo, sim, eu preciso usar a base toda ao
> mesmo tempo.
>
>               Obrigado mais uma vez,
>
>               Carlos Mendonça.
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código
> mínimo reproduzível.
>



-- 
Successful people ask better questions, and as a result, they get
better answers. (Tony Robbins)


Mais detalhes sobre a lista de discussão R-br