[R-br] Regressão Stepwise

FHRB Toledo fernandohtoledo em gmail.com
Quarta Janeiro 25 17:30:26 BRST 2012


Walmes,

Do princípio:

Estou seguindo o livro MASS, segue o CMR (transcição do livro) * dados
quine!

# aqui ajusta o modelo "saturado"
quine.hi <- aov(log(Days + 2.5) ~ . ^4, quine)
# update do modelo sem a interação quádrupla - não significativa
quine.nxt <- update(quine.hi, . ~ . - Eth:Sex:Age:Lrn)
dropterm(quine.nxt, test = 'F')

# funcao stepAIC -- o critério por default é o AIC!
quine.stp <- stepAIC(quine.nxt,
                     scope = list(upper = ~ Eth * Sex * Age * Lrn, lower =
~ 1),
                       trace = FALSE)
quine.stp$anova

# A partir daqui ele vai observando os efeitos e tirando conforme o 'F'!
dropterm(quine.stp, test = 'F')

quine.3 <- update(quine.stp, . ~ . - Eth:Age:Lrn)
dropterm(quine.3, test = 'F')

quine.4 <- update(quine.3, . ~ . - Eth:Age)
dropterm(quine.4, test = 'F')

quine.5 <- update(quine.4, . ~ . - Age:Lrn)
dropterm(quine.5, test = 'F')

No final o que me deixou confuso, vou transcrever em inglês mesmo: "...
   This suggests, correctly, that selecting terms on the basis of AIC can
be somewhat permissive in its choice of terms, being roughly equivalent to
choosing an F -cutoff of 2. We can proceed manually   or by setting k = 4
in stepAIC. We obtain a model equivalent to Sex/(Age + Eth*Lrn) which is
the same as that found by Aitkin (1978), apart from his choice of α = 1 for
the displacement constant. ..."

Aí que veio meu questionamento: Ele usa a função stepAIC mas depois vai em
busca do 'F' e faz essa argumentação da "escolha" de um k tal que iguale o
modelo do Aitkin (1978)!

Vi seu chunk number 7, para mim, agora fica claro k = 2 o critério é AIC, k
= log(nrow(dados) o critério é o BIC, o que me deixa confuso são esses
update() e dropterm()!

abraço,
FH


2012/1/25 Walmes Zeviani <walmeszeviani em gmail.com>

> Fernando,
>
> Então existem duas funções para stepwise que funcionam de forma diferente,
> a step() e a stepAIC()? Não entendi. Pelo que sei no R não há stepwise pelo
> teste F, eles são baseados em critérios de informação. No passado fiz uma
> busca e parece-me que o step com F está implementado em outro pacote. Um
> ponto que existe é: tanto F quanto AIC/BIC são funções da soma de quadrados
> dos resíduos, então, os modelos alcançados não serão, partindo disso,
> drasticamente diferentes. Sobre essa de tirar variáveis "na mão", você
> poderia passar um CMR?
>
> À disposição.
> Walmes.
>
> ==========================================================================
> Walmes Marques Zeviani
> LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W)
> Departamento de Estatística - Universidade Federal do Paraná
> fone: (+55) 41 3361 3573
> VoIP: (3361 3600) 1053 1173
> e-mail: walmes em ufpr.br
> twitter: @walmeszeviani
> homepage: http://www.leg.ufpr.br/~walmes
> linux user number: 531218
> ==========================================================================
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20120125/63f4d6f2/attachment.html>


Mais detalhes sobre a lista de discussão R-br