
Colegas da lista, Seguindo o livro MASS Capítulo 6, página 175 na sessão sobre escolha "automática" de modelos e recorrendo ao help da função stepAIC() fiquei em dúvida quanto ao argumento "k". Alguém tem alguma experiência nesse ponto? Não entendi direito o emprego desse argumento, no help diz que se "k" é igual a 2 efetivamente temos como critério o AIC, percebi que aumentando o "k" a resposta é um modelo mais parcimonioso, mas qual o critério para a sua escolha? No livro MASS os autores (V & R) eles fazem qualquer referência a isso... Alguém tem alguma referencia para a escolha do "k" com qualquer relação com escolha de preditores com efeito significativo pelo "F", por exemplo? att, FH

Fernando, SE k=2 temos AIC e se k=log(nrow(dados)) temos o BIC. A expressão para isso tá no wikipedia http://en.wikipedia.org/wiki/Akaike_information_criterion Exemplos de uso em (code chunk number 7) http://www.leg.ufpr.br/~walmes/cursoR/cnpaf/cap05reglin-iso.R À disposição. Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================

Valeu Walmes... No MASS ele usa o default (k = 2), mas depois tira outras variáveis "na mão" e usa o critério da significância do teste F. Aí a dúvida! abraço, FH 2012/1/25 Walmes Zeviani <walmeszeviani@gmail.com>
Fernando,
SE k=2 temos AIC e se k=log(nrow(dados)) temos o BIC. A expressão para isso tá no wikipedia
http://en.wikipedia.org/wiki/Akaike_information_criterion
Exemplos de uso em (code chunk number 7)
http://www.leg.ufpr.br/~walmes/cursoR/cnpaf/cap05reglin-iso.R
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Fernando, Então existem duas funções para stepwise que funcionam de forma diferente, a step() e a stepAIC()? Não entendi. Pelo que sei no R não há stepwise pelo teste F, eles são baseados em critérios de informação. No passado fiz uma busca e parece-me que o step com F está implementado em outro pacote. Um ponto que existe é: tanto F quanto AIC/BIC são funções da soma de quadrados dos resíduos, então, os modelos alcançados não serão, partindo disso, drasticamente diferentes. Sobre essa de tirar variáveis "na mão", você poderia passar um CMR? À disposição. Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================

Walmes, Do princípio: Estou seguindo o livro MASS, segue o CMR (transcição do livro) * dados quine! # aqui ajusta o modelo "saturado" quine.hi <- aov(log(Days + 2.5) ~ . ^4, quine) # update do modelo sem a interação quádrupla - não significativa quine.nxt <- update(quine.hi, . ~ . - Eth:Sex:Age:Lrn) dropterm(quine.nxt, test = 'F') # funcao stepAIC -- o critério por default é o AIC! quine.stp <- stepAIC(quine.nxt, scope = list(upper = ~ Eth * Sex * Age * Lrn, lower = ~ 1), trace = FALSE) quine.stp$anova # A partir daqui ele vai observando os efeitos e tirando conforme o 'F'! dropterm(quine.stp, test = 'F') quine.3 <- update(quine.stp, . ~ . - Eth:Age:Lrn) dropterm(quine.3, test = 'F') quine.4 <- update(quine.3, . ~ . - Eth:Age) dropterm(quine.4, test = 'F') quine.5 <- update(quine.4, . ~ . - Age:Lrn) dropterm(quine.5, test = 'F') No final o que me deixou confuso, vou transcrever em inglês mesmo: "... This suggests, correctly, that selecting terms on the basis of AIC can be somewhat permissive in its choice of terms, being roughly equivalent to choosing an F -cutoff of 2. We can proceed manually or by setting k = 4 in stepAIC. We obtain a model equivalent to Sex/(Age + Eth*Lrn) which is the same as that found by Aitkin (1978), apart from his choice of α = 1 for the displacement constant. ..." Aí que veio meu questionamento: Ele usa a função stepAIC mas depois vai em busca do 'F' e faz essa argumentação da "escolha" de um k tal que iguale o modelo do Aitkin (1978)! Vi seu chunk number 7, para mim, agora fica claro k = 2 o critério é AIC, k = log(nrow(dados) o critério é o BIC, o que me deixa confuso são esses update() e dropterm()! abraço, FH 2012/1/25 Walmes Zeviani <walmeszeviani@gmail.com>
Fernando,
Então existem duas funções para stepwise que funcionam de forma diferente, a step() e a stepAIC()? Não entendi. Pelo que sei no R não há stepwise pelo teste F, eles são baseados em critérios de informação. No passado fiz uma busca e parece-me que o step com F está implementado em outro pacote. Um ponto que existe é: tanto F quanto AIC/BIC são funções da soma de quadrados dos resíduos, então, os modelos alcançados não serão, partindo disso, drasticamente diferentes. Sobre essa de tirar variáveis "na mão", você poderia passar um CMR?
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Fernando, No meu entender, os autores misturaram os critérios apenas por questão de exposição. Ou você usa AIC, ou BIC ou F. À disposição. Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================

Walmes, Não discordo de você! Valeu pela prestatividade... abraço, FH 2012/1/25 Walmes Zeviani <walmeszeviani@gmail.com>
Fernando,
No meu entender, os autores misturaram os critérios apenas por questão de exposição. Ou você usa AIC, ou BIC ou F.
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Walmes, Voltando a vaca fria... O que queria destacar é que no MASS e na função stepAIC o critério default é o AIC, correto? Você mostrou no CHUNK 7 que o log(nrow(dados)) é o critério BIC, pois bem, e no livro ele acaba por apresentar que usando k = 4 o critério de certo modo é igual ao teste "F". O motivo, repensado da mensagem original é melhor entender essa função de k que altera o critério, me fiz claro? abraço, FH 2012/1/25 FHRB Toledo <fernandohtoledo@gmail.com>
Walmes,
Não discordo de você! Valeu pela prestatividade...
abraço, FH
2012/1/25 Walmes Zeviani <walmeszeviani@gmail.com>
Fernando,
No meu entender, os autores misturaram os critérios apenas por questão de exposição. Ou você usa AIC, ou BIC ou F.
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
participantes (2)
-
FHRB Toledo
-
Walmes Zeviani