
23 Abr
2014
23 Abr
'14
19:45
Se você vai usar essas variáveis categóricas em um modelo de regressão, como por exemplo nas funções lm() e glm(), você não precisa passar por essa etapa (dolorosa) de criar as dummies. Essas funções já criam uma matriz de incidência (zeros e uns) correspondente à cada fator categórico declarado na fórmula do modelo. No R o primeiro nível de um fator é tomado como categoria de referência. Veja str(ChickWeight) m0 <- lm(weight~Diet, data=subset(ChickWeight, Time==20)) summary(m0) Caso você esteja usando outras funções e enfim, realmente precise dessa matriz de dummies, pode ser obtida com X <- model.matrix(~0+Diet, data=subset(ChickWeight, Time==20)) head(X) unique(X) X À disposição. Walmes.