[R-br] Regressão Logística
Edson Lira
edinhoestat em yahoo.com.br
Terça Outubro 23 12:54:11 BRST 2012
Estou usando as rotinas abaixo,
PARA LER OS DADOS
h<-read.csv2("C:\\Consulta\\CIESA\\bd.csv")
h[h==""]<-NA
names(h)
table(h$quem_elab)
str(h)
h$tempo<-2012-h$ano_ini
h$melh_orig<-h$niv_melhora[drop=T]
h$niv_melhora<-h$niv_melhora[drop=T]
h$bsc<-h$bsc[drop=T]
levels(h$niv_melhora)
levels(h$niv_melhora)[levels(h$niv_melhora)%in% c("elevado","muito elevado")] <- "Melhora"
levels(h$niv_melhora)[levels(h$niv_melhora)%in% c("nenhum","pouco",
"intermediário")] <- "Sem melhora"
#levels(h$niv_melhora)[levels(h$niv_melhora)%in% c("intermediário")] <-""
levels(h$quem_elab)
h$part<-h$quem_elab
levels(h$part)[levels(h$part)%in% c("alta direção")]<- "Direção"
levels(h$part)[levels(h$part)%in% c("alta direção\ngerentes",
"alta direção\ngerentes\nfuncionários","alta direção\ngerentes\noutros","gerentes",
"funcionários")] <- "Gerentes"
table(h$part)
#PARA SELECIONAR SOMENTE AS VARIÁVEIS QUE PENSO USAR NO MODELO
nb<-data.frame(melhora=h$melh_orig,bsc=h$bsc,champion=h$champion,ap_dir=h$apoio_bsc,
niv_tre=h$niv_treina,cons_ext=h$cext_bsc,reu_f_est=h$reu_func_estr,
com_est=h$comu_estr,ajuste=h$ajustes,ind_apr=h$ind_aprop,ind_desemp=h$ind_desd_dep,
mapa_est=h$mapa_estr,tempo=h$tempo)
levels(nb$melhora)
levels(nb$melhora)[levels(nb$melhora)%in% c("elevado","muito elevado")] <- 1
levels(nb$melhora)[levels(nb$melhora)%in% c("nenhum","pouco",
"intermediário")] <- 0
nb$desemp<-as.numeric(as.character(nb$melhora))
#PARA ELIMINAR OS NA'S
cd <- subset(nb, subset=!is.na(desemp)
& !is.na(bsc)& !is.na(champion)& !is.na(ap_dir)& !is.na(niv_tre)& !is.na(cons_ext)
& !is.na(reu_f_est)& !is.na(com_est)& !is.na(ajuste)& !is.na(ind_apr)& !is.na(ind_desemp)
& !is.na(mapa_est)& !is.na(tempo)& !is.na(desemp))
dim(cd)
#MODELO DE REGRESSÃO
glm3<-glm(desemp~bsc+champion+ap_dir+niv_tre+cons_ext+reu_f_est+com_est+
ajuste+ind_apr+ind_desemp+mapa_est+tempo+desemp,family=binomial,data=cd)
modelstep <- step(glm3, direction = "both")
logistic.display(modelstep)
summary(modelstep)
Estou tentando aplicar uma regressão logística, quero estimar um modelo aonde a variável resposta é o desempenho de determinada empresa, aonde tenho os níveis melhora=1, sem melhora=0 com outras variáveis. No link abaixo tem uma amostra do banco de dados.
http://www.datafilehost.com/download-996309b6.html
Alguém poderia dar uma avaliada no que estou fazendo?
[ ]'s.
Edson Lira
Estatístico
Manaus-Amazonas
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20121023/9d35ae0c/attachment.html>
Mais detalhes sobre a lista de discussão R-br