
Estou usando as rotinas abaixo, PARA LER OS DADOS h<-read.csv2("C:\\Consulta\\CIESA\\bd.csv") h[h==""]<-NA names(h) table(h$quem_elab) str(h) h$tempo<-2012-h$ano_ini h$melh_orig<-h$niv_melhora[drop=T] h$niv_melhora<-h$niv_melhora[drop=T] h$bsc<-h$bsc[drop=T] levels(h$niv_melhora) levels(h$niv_melhora)[levels(h$niv_melhora)%in% c("elevado","muito elevado")] <- "Melhora" levels(h$niv_melhora)[levels(h$niv_melhora)%in% c("nenhum","pouco", "intermediário")] <- "Sem melhora" #levels(h$niv_melhora)[levels(h$niv_melhora)%in% c("intermediário")] <-"" levels(h$quem_elab) h$part<-h$quem_elab levels(h$part)[levels(h$part)%in% c("alta direção")]<- "Direção" levels(h$part)[levels(h$part)%in% c("alta direção\ngerentes", "alta direção\ngerentes\nfuncionários","alta direção\ngerentes\noutros","gerentes", "funcionários")] <- "Gerentes" table(h$part) #PARA SELECIONAR SOMENTE AS VARIÁVEIS QUE PENSO USAR NO MODELO nb<-data.frame(melhora=h$melh_orig,bsc=h$bsc,champion=h$champion,ap_dir=h$apoio_bsc, niv_tre=h$niv_treina,cons_ext=h$cext_bsc,reu_f_est=h$reu_func_estr, com_est=h$comu_estr,ajuste=h$ajustes,ind_apr=h$ind_aprop,ind_desemp=h$ind_desd_dep, mapa_est=h$mapa_estr,tempo=h$tempo) levels(nb$melhora) levels(nb$melhora)[levels(nb$melhora)%in% c("elevado","muito elevado")] <- 1 levels(nb$melhora)[levels(nb$melhora)%in% c("nenhum","pouco", "intermediário")] <- 0 nb$desemp<-as.numeric(as.character(nb$melhora)) #PARA ELIMINAR OS NA'S cd <- subset(nb, subset=!is.na(desemp) & !is.na(bsc)& !is.na(champion)& !is.na(ap_dir)& !is.na(niv_tre)& !is.na(cons_ext) & !is.na(reu_f_est)& !is.na(com_est)& !is.na(ajuste)& !is.na(ind_apr)& !is.na(ind_desemp) & !is.na(mapa_est)& !is.na(tempo)& !is.na(desemp)) dim(cd) #MODELO DE REGRESSÃO glm3<-glm(desemp~bsc+champion+ap_dir+niv_tre+cons_ext+reu_f_est+com_est+ ajuste+ind_apr+ind_desemp+mapa_est+tempo+desemp,family=binomial,data=cd) modelstep <- step(glm3, direction = "both") logistic.display(modelstep) summary(modelstep) Estou tentando aplicar uma regressão logística, quero estimar um modelo aonde a variável resposta é o desempenho de determinada empresa, aonde tenho os níveis melhora=1, sem melhora=0 com outras variáveis. No link abaixo tem uma amostra do banco de dados. http://www.datafilehost.com/download-996309b6.html Alguém poderia dar uma avaliada no que estou fazendo? [ ]'s. Edson Lira Estatístico Manaus-Amazonas

Edson, A quantidade de dados não é pequena???? Abs. ________________________________ De: Edson Lira <edinhoestat@yahoo.com.br> Para: R-br Lista <r-br@listas.c3sl.ufpr.br> Enviadas: Terça-feira, 23 de Outubro de 2012 12:54 Assunto: [R-br] Regressão Logística Estou usando as rotinas abaixo, PARA LER OS DADOS h<-read.csv2("C:\\Consulta\\CIESA\\bd.csv") h[h==""]<-NA names(h) table(h$quem_elab) str(h) h$tempo<-2012-h$ano_ini h$melh_orig<-h$niv_melhora[drop=T] h$niv_melhora<-h$niv_melhora[drop=T] h$bsc<-h$bsc[drop=T] levels(h$niv_melhora) levels(h$niv_melhora)[levels(h$niv_melhora)%in% c("elevado","muito elevado")] <- "Melhora" levels(h$niv_melhora)[levels(h$niv_melhora)%in% c("nenhum","pouco", "intermediário")] <- "Sem melhora" #levels(h$niv_melhora)[levels(h$niv_melhora)%in% c("intermediário")] <-"" levels(h$quem_elab) h$part<-h$quem_elab levels(h$part)[levels(h$part)%in% c("alta direção")]<- "Direção" levels(h$part)[levels(h$part)%in% c("alta direção\ngerentes", "alta direção\ngerentes\nfuncionários","alta direção\ngerentes\noutros","gerentes", "funcionários")] <- "Gerentes" table(h$part) #PARA SELECIONAR SOMENTE AS VARIÁVEIS QUE PENSO USAR NO MODELO nb<-data.frame(melhora=h$melh_orig,bsc=h$bsc,champion=h$champion,ap_dir=h$apoio_bsc, niv_tre=h$niv_treina,cons_ext=h$cext_bsc,reu_f_est=h$reu_func_estr, com_est=h$comu_estr,ajuste=h$ajustes,ind_apr=h$ind_aprop,ind_desemp=h$ind_desd_dep, mapa_est=h$mapa_estr,tempo=h$tempo) levels(nb$melhora) levels(nb$melhora)[levels(nb$melhora)%in% c("elevado","muito elevado")] <- 1 levels(nb$melhora)[levels(nb$melhora)%in% c("nenhum","pouco", "intermediário")] <- 0 nb$desemp<-as.numeric(as.character(nb$melhora)) #PARA ELIMINAR OS NA'S cd <- subset(nb, subset=!is.na(desemp) & !is.na(bsc)& !is.na(champion)& !is.na(ap_dir)& !is.na(niv_tre)& !is.na(cons_ext) & !is.na(reu_f_est)& !is.na(com_est)& !is.na(ajuste)& !is.na(ind_apr)& !is.na(ind_desemp) & !is.na(mapa_est)& !is.na(tempo)& !is.na(desemp)) dim(cd) #MODELO DE REGRESSÃO glm3<-glm(desemp~bsc+champion+ap_dir+niv_tre+cons_ext+reu_f_est+com_est+ ajuste+ind_apr+ind_desemp+mapa_est+tempo+desemp,family=binomial,data=cd) modelstep <- step(glm3, direction = "both") logistic.display(modelstep) summary(modelstep) Estou tentando aplicar uma regressão logística, quero estimar um modelo aonde a variável resposta é o desempenho de determinada empresa, aonde tenho os níveis melhora=1, sem melhora=0 com outras variáveis. No link abaixo tem uma amostra do banco de dados. http://www.datafilehost.com/download-996309b6.html Alguém poderia dar uma avaliada no que estou fazendo? [ ]'s. Edson Lira Estatístico Manaus-Amazonas _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
participantes (2)
-
Edson Lira
-
Gilbert Queiroz