[R-br] Variáveis contínuas explicando Variáveis categóricas

Daniel Tiezzi dtiezzi em usp.br
Quinta Setembro 18 16:45:19 BRT 2014


Desculpa,  eu viajei


Faça a correlação da matrix sem as variáveis contínuas

cor(matrix)


Daniel


Daniel Tiezzi, MD, PhD
Professor Associado
Departamento de Ginecologia e Obstetrícia
Setor de Mastologia e Oncologia Ginecológica
Faculdade de Medicina de Ribeirão Preto - USP
Tel.: 16 3602-2488
e-mail: dtiezzi em fmrp.usp.br





On Sep 18, 2014, at 4:41 PM, Jefferson Ferreira-Ferreira <jecogeo em gmail.com> wrote:

> 
> Daniel,
> 
> Tenho um erro:
> 
> Error in cor(dados$agua_quente + dados$detergentes + dados$agua_trat +  : 
>   forneça conjuntamente 'x' e 'y' ou algo semelhante a uma matriz 'x'
> 
> Em 18 de setembro de 2014 16:31, Daniel Tiezzi <dtiezzi em usp.br> escreveu:
> Faça uma matrix de correlação das suas variáveis.
> 
>  > cor(dados$agua_quente + dados$detergentes + dados$agua_trat + dados$Filtr_leite + dados$Higie_resf + dados$pre_dipping + dados$toalha + dados$pos_dipping + dados$vacuo)
> 
> Qual o retorno que você tem?
> 
> 
> 
> 
> 
> 
> Daniel Tiezzi, MD, PhD
> Professor Associado
> Departamento de Ginecologia e Obstetrícia
> Setor de Mastologia e Oncologia Ginecológica
> Faculdade de Medicina de Ribeirão Preto - USP
> Tel.: 16 3602-2488
> e-mail: dtiezzi em fmrp.usp.br
> 
> 
> 
> 
> 
> On Sep 18, 2014, at 4:24 PM, Jefferson Ferreira-Ferreira <jecogeo em gmail.com> wrote:
> 
>> 
>> Pois então...
>> 
>> Daniel ou mais algum colega da lista, teria alguma dica? Será que ANOVA ou lm seriam recomendadas para meus dados?
>> 
>> Em 18 de setembro de 2014 16:04, <dtiezzi em usp.br> escreveu:
>> As suas variáveis não são colineares?
>> 
>> Por isso está saindo o NA no modelo de regressão
>> 
>> Daniel
>> 
>> 
>> 
>> De: "Jefferson Ferreira-Ferreira" <jecogeo em gmail.com>
>> Para: r-br em listas.c3sl.ufpr.br
>> Enviadas: Quinta-feira, 18 de Setembro de 2014 15:48:04
>> 
>> Assunto: Re: [R-br] Variáveis contínuas explicando Variáveis categóricas
>> 
>> 
>> Daniel e demais,
>> 
>> Aparentemente não resolve, pois recebo NAs para diversos slopes. (ver summary do modelo abaixo). E acho que isso não pode estar certo.
>> Segue aqui um exemplo dos meus dados. O que eu gostaria é de ver o quanto as variáveis categóricas explicam minha media_CBT e minha media_CCS.
>> 
>> Alguma ideia???
>> 
>> 
>> agua_quente	detergentes	agua_trat	Filtr_leite	Higie_resf	pre_dipping	toalha	pos_dipping	vacuo	pulsador	Aliment_pos	media_CBT	media_CCS
>> 1	0	0	1	0	1	1	1	1	1	1	931	623.3333333
>> 1	0	0	1	1	0	1	1	1	1	1	163.6666667	259
>> 1	0	0	1	1	1	1	1	0	0	0	690.3333333	306.3333333
>> 1	0	0	1	1	1	1	1	0	0	1	690.3333333	306.3333333
>> 
>> 
>> 
>> summary(m)
>> 
>> Call:
>> lm(formula = dados$media_CBT ~ dados$agua_quente + dados$detergentes + 
>>     dados$agua_trat + dados$Filtr_leite + dados$Higie_resf + 
>>     dados$pre_dipping + dados$toalha + dados$pos_dipping + dados$vacuo)
>> 
>> Residuals:
>>          1          2          3          4 
>>  0.000e+00 -3.155e-30  4.019e-14 -4.019e-14 
>> 
>> Coefficients: (7 not defined because of singularities)
>>                     Estimate Std. Error    t value Pr(>|t|)    
>> (Intercept)        4.043e+02  8.988e-14  4.499e+15   <2e-16 ***
>> dados$agua_quente         NA         NA         NA       NA    
>> dados$detergentes         NA         NA         NA       NA    
>> dados$agua_trat           NA         NA         NA       NA    
>> dados$Filtr_leite         NA         NA         NA       NA    
>> dados$Higie_resf  -2.407e+02  6.962e-14 -3.457e+15   <2e-16 ***
>> dados$pre_dipping  5.267e+02  6.962e-14  7.565e+15   <2e-16 ***
>> dados$toalha              NA         NA         NA       NA    
>> dados$pos_dipping         NA         NA         NA       NA    
>> dados$vacuo               NA         NA         NA       NA    
>> ---
>> Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
>> 
>> Residual standard error: 5.684e-14 on 1 degrees of freedom
>> Multiple R-squared:      1,	Adjusted R-squared:      1 
>> F-statistic: 4.872e+31 on 2 and 1 DF,  p-value: < 2.2e-16
>> 
>> 
>> 
>> 
>> Em 18 de setembro de 2014 15:36, <dtiezzi em usp.br> escreveu:
>> Jefferson
>> 
>> Montando o modele assim
>> 
>> model <- lm(test$x ~ test$c1 + test$c2 + test$c3 + test$c4)
>> 
>> não resolve seu problema?
>> 
>> Daniel
>> 
>> 
>> De: "Jefferson Ferreira-Ferreira" <jecogeo em gmail.com>
>> Para: r-br em listas.c3sl.ufpr.br
>> Enviadas: Quinta-feira, 18 de Setembro de 2014 13:33:57
>> Assunto: Re: [R-br] Variáveis contínuas explicando Variáveis categóricas
>> 
>> 
>> 
>> Professor daniel,
>> Obrigado pela resposta. Ainda não testei essa alternativa. Mas a desvantagem dessa abordagem seria o grande número de modelos a serem ajustados, visto que tenho 11 variáveis explicativas categóricas para duas variáveis resposta numéricas contínuas. Isso me faria ajustar 22 modelos que teriam como premissa a independencia entre as variáveis explicativas.
>> 
>> O que quero dizer é: o quanto a combinação das variáveis categóricas c1 c2 c3 c4 c5 c6... etc (biárias =0 ou 1)  explicam meu x (numérico contínuo).  
>> 
>> Será que existe um modo de eu ajustar dois modelos? Tipo com a variável resposta X em função de todas as varíaveis explicativas categóricas e outro modelo com a variável resposta Y em função de todas as variáveis explicativas categóricas?
>> 
>> 
>> 
>> c1	c2	c3	c4	x		y
>> 0	1	1	1	931		623
>> 0	1	0	0	163		259
>> 1	0	1	0	690		306
>> 1	0	1	0	690		306
>> 
>> 
>> -- 
>> 
>> Jefferson Ferreira-Ferreira
>> Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
>> 
>> Jefferson.ferreira em mamiraua.org.br
>> Instituto de Desenvolvimento Sustentável Mamirauá
>> Ministério da Ciência, Tecnologia e Inovação
>> Telefone: +55 97 3343-9710
>> Google Maps - Mapas deste e-mail:
>> Exibir mapa ampliado
>> 
>> 
>> 
>> Contatos particulares:
>> (55) 9615-0100
>> 
>> 
>> 
>> 
>> Em 18 de setembro de 2014 12:56, Daniel Tiezzi <dtiezzi em usp.br> escreveu:
>> Você precisa fazer uma regressão.
>> 
>> Segue um modelo
>> 
>> # Regression analyses, standardized
>> model1.z <- lm(scale(PE$endurance) ~ scale(PE$age))
>> summary(model1.z)
>> confint(model1.z)
>> 
>> model2.z <- lm(scale(PE$endurance) ~ scale(PE$activeyears))
>> summary(model2.z)
>> confint(model2.z)
>> 
>> model3.z <- lm(scale(PE$endurance) ~ scale(PE$age) + scale(PE$activeyears))
>> summary(model3.z)
>> confint(model3.z)
>> 
>> # Conduct a model comparison NHST to compare the fit of model2.z to the fit of model3.z
>> anova(model2.z, model3.z)
>> 
>> 
>> Acho que seria assim
>> 
>> 
>> Daniel
>> 
>> 
>> 
>> 
>> Daniel Tiezzi, MD, PhD
>> Professor Associado
>> Departamento de Ginecologia e Obstetrícia
>> Setor de Mastologia e Oncologia Ginecológica
>> Faculdade de Medicina de Ribeirão Preto - USP
>> Tel.: 16 3602-2488
>> e-mail: dtiezzi em fmrp.usp.br
>> 
>> 
>> 
>> 
>> 
>> On Sep 18, 2014, at 12:47 PM, Jefferson Ferreira-Ferreira <jecogeo em gmail.com> wrote:
>> 
>> 
>> Prezados;
>> 
>> Uma dúvida básica de um iniciante em análises estatísticas.
>> Tenho uma série de variáveis categóricas binárias e duas variáveis contínuas. Eu gostaria de saber o quando minhas variáveis categóricas explicam minhas duas variáveis contínuas. Por exemplo:
>> 
>> c1	c2	c3	c4	x		y
>> 0	1	1	1	931		623
>> 0	1	0	0	163		259
>> 1	0	1	0	690		306
>> 1	0	1	0	690		306
>> 
>> 
>> A pergunta é: o quanto a combinação das variáveis c explicam os valores de x e y? Ou, qual a correlação entre as variáveis c e as variáveis x e y?
>> 
>> Podem me dar alguma ideia de análises possíveis?
>> Obrigado.
>> 
>> 
>> -- 
>> 
>> Jefferson Ferreira-Ferreira
>> Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
>> 
>> Jefferson.ferreira em mamiraua.org.br
>> Instituto de Desenvolvimento Sustentável Mamirauá
>> Ministério da Ciência, Tecnologia e Inovação
>> Telefone: +55 97 3343-9710
>> Google Maps - Mapas deste e-mail:
>> 
>> Exibir mapa ampliado
>> 
>> 
>> 
>> Contatos particulares:
>> (55) 9615-0100
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
>> 
>> 
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
>> 
>> 
>> 
>> 
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
>> 
>> 
>> 
>> 
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
>> 
>> 
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
>> 
>> 
>> 
>> -- 
>> 
>> Jefferson Ferreira-Ferreira
>> Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
>> 
>> Jefferson.ferreira em mamiraua.org.br
>> Instituto de Desenvolvimento Sustentável Mamirauá
>> Ministério da Ciência, Tecnologia e Inovação
>> Telefone: +55 97 3343-9710
>> Google Maps - Mapas deste e-mail:
>> Exibir mapa ampliado
>> 
>> 
>> 
>> Contatos particulares:
>> (55) 9615-0100
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
> 
> 
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
> 
> 
> 
> -- 
> 
> Jefferson Ferreira-Ferreira
> Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
> 
> Jefferson.ferreira em mamiraua.org.br
> Instituto de Desenvolvimento Sustentável Mamirauá
> Ministério da Ciência, Tecnologia e Inovação
> Telefone: +55 97 3343-9710
> Google Maps - Mapas deste e-mail:
> Exibir mapa ampliado
> 
> 
> 
> Contatos particulares:
> (55) 9615-0100
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20140918/4b3ffb95/attachment.html>


Mais detalhes sobre a lista de discussão R-br