Walmes,

Do princípio:

Estou seguindo o livro MASS, segue o CMR (transcição do livro) * dados quine!

# aqui ajusta o modelo "saturado"
quine.hi <- aov(log(Days + 2.5) ~ . ^4, quine)
# update do modelo sem a interação quádrupla - não significativa
quine.nxt <- update(quine.hi, . ~ . - Eth:Sex:Age:Lrn)
dropterm(quine.nxt, test = 'F')

# funcao stepAIC -- o critério por default é o AIC!
quine.stp <- stepAIC(quine.nxt,
                     scope = list(upper = ~ Eth * Sex * Age * Lrn, lower = ~ 1),
                       trace = FALSE)
quine.stp$anova

# A partir daqui ele vai observando os efeitos e tirando conforme o 'F'!
dropterm(quine.stp, test = 'F')

quine.3 <- update(quine.stp, . ~ . - Eth:Age:Lrn)
dropterm(quine.3, test = 'F')

quine.4 <- update(quine.3, . ~ . - Eth:Age)
dropterm(quine.4, test = 'F')

quine.5 <- update(quine.4, . ~ . - Age:Lrn)
dropterm(quine.5, test = 'F')

No final o que me deixou confuso, vou transcrever em inglês mesmo: "...        This suggests, correctly, that selecting terms on the basis of AIC can be somewhat permissive in its choice of terms, being roughly equivalent to choosing an F -cutoff of 2. We can proceed manually   or by setting k = 4 in stepAIC. We obtain a model equivalent to Sex/(Age + Eth*Lrn) which is the same as that found by Aitkin (1978), apart from his choice of α = 1 for the displacement constant. ..."

Aí que veio meu questionamento: Ele usa a função stepAIC mas depois vai em busca do 'F' e faz essa argumentação da "escolha" de um k tal que iguale o modelo do Aitkin (1978)!

Vi seu chunk number 7, para mim, agora fica claro k = 2 o critério é AIC, k = log(nrow(dados) o critério é o BIC, o que me deixa confuso são esses update() e dropterm()!

abraço,
FH


2012/1/25 Walmes Zeviani <walmeszeviani@gmail.com>
Fernando,

Então existem duas funções para stepwise que funcionam de forma diferente, a step() e a stepAIC()? Não entendi. Pelo que sei no R não há stepwise pelo teste F, eles são baseados em critérios de informação. No passado fiz uma busca e parece-me que o step com F está implementado em outro pacote. Um ponto que existe é: tanto F quanto AIC/BIC são funções da soma de quadrados dos resíduos, então, os modelos alcançados não serão, partindo disso, drasticamente diferentes. Sobre essa de tirar variáveis "na mão", você poderia passar um CMR?

À disposição.
Walmes.

==========================================================================
Walmes Marques Zeviani
LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W)
Departamento de Estatística - Universidade Federal do Paraná
fone: (+55) 41 3361 3573
VoIP: (3361 3600) 1053 1173
e-mail: walmes@ufpr.br
twitter: @walmeszeviani
homepage: http://www.leg.ufpr.br/~walmes
linux user number: 531218
==========================================================================

_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.