[R-br] Variáveis contínuas explicando Variáveis categóricas

dtiezzi em usp.br dtiezzi em usp.br
Quinta Setembro 18 16:04:49 BRT 2014


As suas variáveis não são colineares? 

Por isso está saindo o NA no modelo de regressão 

Daniel 

----- Mensagem original -----

> De: "Jefferson Ferreira-Ferreira" <jecogeo em gmail.com>
> Para: r-br em listas.c3sl.ufpr.br
> Enviadas: Quinta-feira, 18 de Setembro de 2014 15:48:04
> Assunto: Re: [R-br] Variáveis contínuas explicando Variáveis
> categóricas

> Daniel e demais,

> Aparentemente não resolve, pois recebo NAs para diversos slopes. (ver
> summary do modelo abaixo). E acho que isso não pode estar certo.
> Segue aqui um exemplo dos meus dados. O que eu gostaria é de ver o
> quanto as variáveis categóricas explicam minha media_CBT e minha
> media_CCS.

> Alguma ideia???

> agua_quente 	detergentes 	agua_trat 	Filtr_leite 	Higie_resf
> 	pre_dipping 	toalha 	pos_dipping 	vacuo 	pulsador 	Aliment_pos
> 	media_CBT 	media_CCS
> 1 	0 	0 	1 	0 	1 	1 	1 	1 	1 	1 	931 	623.3333333
> 1 	0 	0 	1 	1 	0 	1 	1 	1 	1 	1 	163.6666667 	259
> 1 	0 	0 	1 	1 	1 	1 	1 	0 	0 	0 	690.3333333 	306.3333333
> 1 	0 	0 	1 	1 	1 	1 	1 	0 	0 	1 	690.3333333 	306.3333333

> summary(m)

> Call:
> lm(formula = dados$media_CBT ~ dados$agua_quente + dados$detergentes
> +
> dados$agua_trat + dados$Filtr_leite + dados$Higie_resf +
> dados$pre_dipping + dados$toalha + dados$pos_dipping + dados$vacuo)

> Residuals:
> 1 2 3 4
> 0.000e+00 -3.155e-30 4.019e-14 -4.019e-14

> Coefficients: (7 not defined because of singularities)
> Estimate Std. Error t value Pr(>|t|)
> (Intercept) 4.043e+02 8.988e-14 4.499e+15 <2e-16 ***
> dados$agua_quente NA NA NA NA
> dados$detergentes NA NA NA NA
> dados$agua_trat NA NA NA NA
> dados$Filtr_leite NA NA NA NA
> dados$Higie_resf -2.407e+02 6.962e-14 -3.457e+15 <2e-16 ***
> dados$pre_dipping 5.267e+02 6.962e-14 7.565e+15 <2e-16 ***
> dados$toalha NA NA NA NA
> dados$pos_dipping NA NA NA NA
> dados$vacuo NA NA NA NA
> ---
> Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

> Residual standard error: 5.684e-14 on 1 degrees of freedom
> Multiple R-squared: 1, Adjusted R-squared: 1
> F-statistic: 4.872e+31 on 2 and 1 DF, p-value: < 2.2e-16

> Em 18 de setembro de 2014 15:36, < dtiezzi em usp.br > escreveu:

> > Jefferson
> 

> > Montando o modele assim
> 

> > model <- lm(test$x ~ test$c1 + test$c2 + test$c3 + test$c4)
> 

> > não resolve seu problema?
> 

> > Daniel
> 

> > > De: "Jefferson Ferreira-Ferreira" < jecogeo em gmail.com >
> > 
> 
> > > Para: r-br em listas.c3sl.ufpr.br
> > 
> 
> > > Enviadas: Quinta-feira, 18 de Setembro de 2014 13:33:57
> > 
> 
> > > Assunto: Re: [R-br] Variáveis contínuas explicando Variáveis
> > > categóricas
> > 
> 

> > > Professor daniel,
> > 
> 
> > > Obrigado pela resposta. Ainda não testei essa alternativa. Mas a
> > > desvantagem dessa abordagem seria o grande número de modelos a
> > > serem
> > > ajustados, visto que tenho 11 variáveis explicativas categóricas
> > > para duas variáveis resposta numéricas contínuas. Isso me faria
> > > ajustar 22 modelos que teriam como premissa a independencia entre
> > > as
> > > variáveis explicativas.
> > 
> 

> > > O que quero dizer é: o quanto a combinação das variáveis
> > > categóricas
> > > c1 c2 c3 c4 c5 c6... etc (biárias =0 ou 1) explicam meu x
> > > (numérico
> > > contínuo).
> > 
> 

> > > Será que existe um modo de eu ajustar dois modelos? Tipo com a
> > > variável resposta X em função de todas as varíaveis explicativas
> > > categóricas e outro modelo com a variável resposta Y em função de
> > > todas as variáveis explicativas categóricas?
> > 
> 

> > > > c1 c2 c3 c4 x y
> > > 
> > 
> 
> > > > 0 1 1 1 931 623
> > > 
> > 
> 
> > > > 0 1 0 0 163 259
> > > 
> > 
> 
> > > > 1 0 1 0 690 306
> > > 
> > 
> 
> > > > 1 0 1 0 690 306
> > > 
> > 
> 

> > > --
> > 
> 

> > > Jefferson Ferreira-Ferreira
> > 
> 
> > > Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
> > 
> 

> > > Jefferson.ferreira em mamiraua.org.br
> > 
> 
> > > Instituto de Desenvolvimento Sustentável Mamirauá
> > 
> 

> > > Ministério da Ciência, Tecnologia e Inovação
> > 
> 
> > > Telefone: +55 97 3343-9710
> > 
> 

> > > Google Maps - Mapas deste e-mail :
> > 
> 

> > > Exibir mapa ampliado
> > 
> 

> > > Contatos particulares:
> > 
> 
> > > (55) 9615-0100
> > 
> 

> > > Em 18 de setembro de 2014 12:56, Daniel Tiezzi < dtiezzi em usp.br >
> > > escreveu:
> > 
> 

> > > > Você precisa fazer uma regressão.
> > > 
> > 
> 

> > > > Segue um modelo
> > > 
> > 
> 

> > > > # Regression analyses, standardized
> > > 
> > 
> 
> > > > model1.z <- lm(scale(PE$endurance) ~ scale(PE$age))
> > > 
> > 
> 
> > > > summary(model1.z)
> > > 
> > 
> 
> > > > confint(model1.z)
> > > 
> > 
> 

> > > > model2.z <- lm(scale(PE$endurance) ~ scale(PE$activeyears))
> > > 
> > 
> 
> > > > summary(model2.z)
> > > 
> > 
> 
> > > > confint(model2.z)
> > > 
> > 
> 

> > > > model3.z <- lm(scale(PE$endurance) ~ scale(PE$age) +
> > > > scale(PE$activeyears))
> > > 
> > 
> 
> > > > summary(model3.z)
> > > 
> > 
> 
> > > > confint(model3.z)
> > > 
> > 
> 

> > > > # Conduct a model comparison NHST to compare the fit of
> > > > model2.z
> > > > to
> > > > the fit of model3.z
> > > 
> > 
> 
> > > > anova(model2.z, model3.z)
> > > 
> > 
> 

> > > > Acho que seria assim
> > > 
> > 
> 

> > > > Daniel
> > > 
> > 
> 

> > > > Daniel Tiezzi, MD, PhD
> > > 
> > 
> 
> > > > Professor Associado
> > > 
> > 
> 
> > > > Departamento de Ginecologia e Obstetrícia
> > > 
> > 
> 
> > > > Setor de Mastologia e Oncologia Ginecológica
> > > 
> > 
> 
> > > > Faculdade de Medicina de Ribeirão Preto - USP
> > > 
> > 
> 
> > > > Tel.: 16 3602-2488
> > > 
> > 
> 
> > > > e-mail: dtiezzi em fmrp.usp.br
> > > 
> > 
> 

> > > > On Sep 18, 2014, at 12:47 PM, Jefferson Ferreira-Ferreira <
> > > > jecogeo em gmail.com > wrote:
> > > 
> > 
> 

> > > > > Prezados;
> > > > 
> > > 
> > 
> 

> > > > > Uma dúvida básica de um iniciante em análises estatísticas.
> > > > 
> > > 
> > 
> 
> > > > > Tenho uma série de variáveis categóricas binárias e duas
> > > > > variáveis
> > > > > contínuas. Eu gostaria de saber o quando minhas variáveis
> > > > > categóricas explicam minhas duas variáveis contínuas. Por
> > > > > exemplo:
> > > > 
> > > 
> > 
> 

> > > > > c1 c2 c3 c4 x y
> > > > 
> > > 
> > 
> 
> > > > > 0 1 1 1 931 623
> > > > 
> > > 
> > 
> 
> > > > > 0 1 0 0 163 259
> > > > 
> > > 
> > 
> 
> > > > > 1 0 1 0 690 306
> > > > 
> > > 
> > 
> 
> > > > > 1 0 1 0 690 306
> > > > 
> > > 
> > 
> 

> > > > > A pergunta é: o quanto a combinação das variáveis c explicam
> > > > > os
> > > > > valores de x e y? Ou, qual a correlação entre as variáveis c
> > > > > e
> > > > > as
> > > > > variáveis x e y?
> > > > 
> > > 
> > 
> 

> > > > > Podem me dar alguma ideia de análises possíveis?
> > > > 
> > > 
> > 
> 
> > > > > Obrigado.
> > > > 
> > > 
> > 
> 

> > > > > --
> > > > 
> > > 
> > 
> 

> > > > > Jefferson Ferreira-Ferreira
> > > > 
> > > 
> > 
> 
> > > > > Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
> > > > 
> > > 
> > 
> 

> > > > > Jefferson.ferreira em mamiraua.org.br
> > > > 
> > > 
> > 
> 
> > > > > Instituto de Desenvolvimento Sustentável Mamirauá
> > > > 
> > > 
> > 
> 

> > > > > Ministério da Ciência, Tecnologia e Inovação
> > > > 
> > > 
> > 
> 
> > > > > Telefone: +55 97 3343-9710
> > > > 
> > > 
> > 
> 

> > > > > Google Maps - Mapas deste e-mail :
> > > > 
> > > 
> > 
> 

> > > > > Exibir mapa ampliado
> > > > 
> > > 
> > 
> 

> > > > > Contatos particulares:
> > > > 
> > > 
> > 
> 
> > > > > (55) 9615-0100
> > > > 
> > > 
> > 
> 
> > > > > _______________________________________________
> > > > 
> > > 
> > 
> 
> > > > > R-br mailing list
> > > > 
> > > 
> > 
> 
> > > > > R-br em listas.c3sl.ufpr.br
> > > > 
> > > 
> > 
> 
> > > > > https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> > > > 
> > > 
> > 
> 
> > > > > Leia o guia de postagem ( http://www.leg.ufpr.br/r-br-guia )
> > > > > e
> > > > > forneça código mínimo reproduzível.
> > > > 
> > > 
> > 
> 
> > > > _______________________________________________
> > > 
> > 
> 
> > > > R-br mailing list
> > > 
> > 
> 
> > > > R-br em listas.c3sl.ufpr.br
> > > 
> > 
> 
> > > > https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> > > 
> > 
> 
> > > > Leia o guia de postagem ( http://www.leg.ufpr.br/r-br-guia ) e
> > > > forneça código mínimo reproduzível.
> > > 
> > 
> 

> > > _______________________________________________
> > 
> 
> > > R-br mailing list
> > 
> 
> > > R-br em listas.c3sl.ufpr.br
> > 
> 
> > > https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> > 
> 
> > > Leia o guia de postagem ( http://www.leg.ufpr.br/r-br-guia ) e
> > > forneça código mínimo reproduzível.
> > 
> 
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20140918/1292a077/attachment.html>


Mais detalhes sobre a lista de discussão R-br