Muito obrigado pessoal!



Mas agora tenho outra questão. Minha base inicial possui 476.430 observações de 20 variáveis.

Quando faço as dummies fico com (Além do inicial):

* Dois arquivos de dimensões: 476.430        161
*Dois arquivos de dimensões: 476.430         3.059


Portanto, não estou conseguindo criar a base final. Pois quando tento criar a quarta e última dummy dá a mensagem de que não é possível alocar o vetor de 10,9 GB.


Já li que posso resolver o problema de memória definindo que o R não irá carregar a base, mas sim, irá lê-la diretamente do HD. Mas realmente é possível?

Alguém saberia me dizer?


Configurações da minha máquina:

Core i7 com 8 núcleos

HD 1T

8 GB de RAM



Desde já muito obrigado!



On 02/04/2015 11:32, walmes . wrote:
Converta para fator que automaticamente a model.matrix() vai gerar as dummies para você.

x <- gl(5, 3, labels=LETTERS[1:5])
is.factor(x)
class(x)
levels(x)
nlevels(x)

model.matrix(~x)

y <- rnorm(length(x))
lm(y~x)

À disposição.
Walmes.


_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

--
Alexandre Rodrigues Loures
Doutorando em Economia Aplicada
Universidade Federal da Paraíba - UFPB
Centro de Ciências Sociais Aplicadas - CCSA
Programa de Pós-Graduação em Economia - PPGE
e-Mail: alexandre.loures@ymail.com
Site: www.ccsa.ufpb.br/ppge