[R-br] Regressão Logística

Gilbert Queiroz gilbert_queiroz em yahoo.com.br
Terça Outubro 23 13:14:48 BRST 2012


Edson,
A quantidade de dados não é pequena????
Abs.




________________________________
 De: Edson Lira <edinhoestat em yahoo.com.br>
Para: R-br Lista <r-br em listas.c3sl.ufpr.br> 
Enviadas: Terça-feira, 23 de Outubro de 2012 12:54
Assunto: [R-br] Regressão Logística
 

Estou usando as rotinas abaixo,

PARA LER OS DADOS

h<-read.csv2("C:\\Consulta\\CIESA\\bd.csv")
h[h==""]<-NA
names(h)
table(h$quem_elab)
str(h)
h$tempo<-2012-h$ano_ini
h$melh_orig<-h$niv_melhora[drop=T]
h$niv_melhora<-h$niv_melhora[drop=T]
h$bsc<-h$bsc[drop=T]


levels(h$niv_melhora)
levels(h$niv_melhora)[levels(h$niv_melhora)%in% c("elevado","muito elevado")] <- "Melhora"
levels(h$niv_melhora)[levels(h$niv_melhora)%in% c("nenhum","pouco",
"intermediário")] <- "Sem melhora"
#levels(h$niv_melhora)[levels(h$niv_melhora)%in% c("intermediário")] <-""

levels(h$quem_elab)
h$part<-h$quem_elab
levels(h$part)[levels(h$part)%in% c("alta direção")]<- "Direção"
levels(h$part)[levels(h$part)%in% c("alta direção\ngerentes",
"alta direção\ngerentes\nfuncionários","alta direção\ngerentes\noutros","gerentes",
"funcionários")] <- "Gerentes"
table(h$part)




#PARA SELECIONAR SOMENTE AS VARIÁVEIS QUE PENSO USAR NO MODELO

nb<-data.frame(melhora=h$melh_orig,bsc=h$bsc,champion=h$champion,ap_dir=h$apoio_bsc,
niv_tre=h$niv_treina,cons_ext=h$cext_bsc,reu_f_est=h$reu_func_estr,
com_est=h$comu_estr,ajuste=h$ajustes,ind_apr=h$ind_aprop,ind_desemp=h$ind_desd_dep,
mapa_est=h$mapa_estr,tempo=h$tempo)



levels(nb$melhora)
levels(nb$melhora)[levels(nb$melhora)%in% c("elevado","muito elevado")] <- 1
levels(nb$melhora)[levels(nb$melhora)%in% c("nenhum","pouco",
"intermediário")] <- 0


nb$desemp<-as.numeric(as.character(nb$melhora))




#PARA ELIMINAR OS NA'S


cd <- subset(nb, subset=!is.na(desemp)  
& !is.na(bsc)& !is.na(champion)& !is.na(ap_dir)& !is.na(niv_tre)& !is.na(cons_ext) 
& !is.na(reu_f_est)& !is.na(com_est)& !is.na(ajuste)& !is.na(ind_apr)&
 !is.na(ind_desemp)
& !is.na(mapa_est)& !is.na(tempo)& !is.na(desemp)) 
 dim(cd)


#MODELO DE REGRESSÃO
glm3<-glm(desemp~bsc+champion+ap_dir+niv_tre+cons_ext+reu_f_est+com_est+
ajuste+ind_apr+ind_desemp+mapa_est+tempo+desemp,family=binomial,data=cd)    

modelstep <- step(glm3, direction = "both")
logistic.display(modelstep) 
summary(modelstep)



Estou tentando aplicar uma regressão logística,  quero estimar um modelo aonde a variável resposta é o desempenho de determinada empresa, aonde tenho os níveis melhora=1, sem melhora=0 com outras variáveis. No link abaixo tem uma amostra do banco de dados.

http://www.datafilehost.com/download-996309b6.html

Alguém poderia dar uma avaliada no que estou fazendo? 
[ ]'s.

 
Edson Lira
Estatístico
Manaus-Amazonas
_______________________________________________
R-br mailing list
R-br em listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20121023/fd3055c7/attachment.html>


Mais detalhes sobre a lista de discussão R-br