
Muito obrigado Walmes e Benilton! Walmes, infelizmente terei de criar essas dummies. E só mais uma coisa, você disse que no R o primeiro nível é a categoria de referência. Todavia, para origin (com 27 levels) estão sendo criadas 27 dummies e para destination (com 78 levels) estão sendo criadas 78 dummies. Não era para ser 26 e 77 dummies? Em 23-04-2014 16:45, walmes . escreveu:
Se você vai usar essas variáveis categóricas em um modelo de regressão, como por exemplo nas funções lm() e glm(), você não precisa passar por essa etapa (dolorosa) de criar as dummies. Essas funções já criam uma matriz de incidência (zeros e uns) correspondente à cada fator categórico declarado na fórmula do modelo. No R o primeiro nível de um fator é tomado como categoria de referência. Veja
str(ChickWeight) m0 <- lm(weight~Diet, data=subset(ChickWeight, Time==20)) summary(m0)
Caso você esteja usando outras funções e enfim, realmente precise dessa matriz de dummies, pode ser obtida com
X <- model.matrix(~0+Diet, data=subset(ChickWeight, Time==20)) head(X) unique(X) X
À disposição. Walmes.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- *Alexandre Rodrigues Loures* Doutorando em Economia Aplicada Universidade Federal da Paraíba - UFPB Centro de Ciências Sociais Aplicadas - CCSA Programa de Pós-Graduação em Economia - PPGE Tel.: +55 32 9102-0690 (MG) ou +55 83 9804-1000 (PB) e-Mail: alexandre.loures@ymail.com Site: www.ccsa.ufpb.br/ppge