Muito obrigado pessoal!
Mas agora tenho outra questão. Minha base inicial possui 476.430 observações de 20 variáveis.
Quando faço as dummies fico com (Além do inicial):
* Dois arquivos de dimensões: 476.430 161
*Dois arquivos de dimensões: 476.430 3.059
Portanto, não estou conseguindo criar a base final. Pois quando tento criar a quarta e última dummy dá a mensagem de que não é possível alocar o vetor de 10,9 GB.
Já li que posso resolver o problema de memória definindo que o R não irá carregar a base, mas sim, irá lê-la diretamente do HD. Mas realmente é possível?
Alguém saberia me dizer?
Configurações da minha máquina:
Core i7 com 8 núcleos
HD 1T
8 GB de RAM
Desde já muito obrigado!
On 02/04/2015 11:32, walmes . wrote:
Converta para fator que automaticamente a model.matrix() vai gerar as dummies para você.
x <- gl(5, 3, labels=LETTERS[1:5])
is.factor(x)
class(x)
levels(x)
nlevels(x)
model.matrix(~x)
y <- rnorm(length(x))
lm(y~x)
À disposição.
Walmes.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
--
Alexandre Rodrigues Loures
Doutorando em Economia Aplicada
Universidade Federal da Paraíba - UFPB
Centro de Ciências Sociais Aplicadas - CCSA
Programa de Pós-Graduação em Economia - PPGE
e-Mail: alexandre.loures@ymail.com
Site: www.ccsa.ufpb.br/ppge
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.