Re: [R-br] Variáveis contínuas explicando Variáveis categóricas

Daniel e demais, Aparentemente não resolve, pois recebo NAs para diversos slopes. (ver summary do modelo abaixo). E acho que isso não pode estar certo. Segue aqui um exemplo dos meus dados. O que eu gostaria é de ver o quanto as variáveis categóricas explicam minha media_CBT e minha media_CCS. Alguma ideia??? agua_quente detergentes agua_trat Filtr_leite Higie_resf pre_dipping toalha pos_dipping vacuo pulsador Aliment_pos media_CBT media_CCS 1 0 0 1 0 1 1 1 1 1 1 931 623.3333333 1 0 0 1 1 0 1 1 1 1 1 163.6666667 259 1 0 0 1 1 1 1 1 0 0 0 690.3333333 306.3333333 1 0 0 1 1 1 1 1 0 0 1 690.3333333 306.3333333 summary(m) Call: lm(formula = dados$media_CBT ~ dados$agua_quente + dados$detergentes + dados$agua_trat + dados$Filtr_leite + dados$Higie_resf + dados$pre_dipping + dados$toalha + dados$pos_dipping + dados$vacuo) Residuals: 1 2 3 4 0.000e+00 -3.155e-30 4.019e-14 -4.019e-14 Coefficients: (7 not defined because of singularities) Estimate Std. Error t value Pr(>|t|) (Intercept) 4.043e+02 8.988e-14 4.499e+15 <2e-16 *** dados$agua_quente NA NA NA NA dados$detergentes NA NA NA NA dados$agua_trat NA NA NA NA dados$Filtr_leite NA NA NA NA dados$Higie_resf -2.407e+02 6.962e-14 -3.457e+15 <2e-16 *** dados$pre_dipping 5.267e+02 6.962e-14 7.565e+15 <2e-16 *** dados$toalha NA NA NA NA dados$pos_dipping NA NA NA NA dados$vacuo NA NA NA NA --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 5.684e-14 on 1 degrees of freedom Multiple R-squared: 1, Adjusted R-squared: 1 F-statistic: 4.872e+31 on 2 and 1 DF, p-value: < 2.2e-16 Em 18 de setembro de 2014 15:36, <dtiezzi@usp.br> escreveu:
Jefferson
Montando o modele assim
model <- lm(test$x ~ test$c1 + test$c2 + test$c3 + test$c4)
não resolve seu problema?
Daniel
------------------------------
*De: *"Jefferson Ferreira-Ferreira" <jecogeo@gmail.com> *Para: *r-br@listas.c3sl.ufpr.br *Enviadas: *Quinta-feira, 18 de Setembro de 2014 13:33:57 *Assunto: *Re: [R-br] Variáveis contínuas explicando Variáveis categóricas
Professor daniel, Obrigado pela resposta. Ainda não testei essa alternativa. Mas a desvantagem dessa abordagem seria o grande número de modelos a serem ajustados, visto que tenho 11 variáveis explicativas categóricas para duas variáveis resposta numéricas contínuas. Isso me faria ajustar 22 modelos que teriam como premissa a independencia entre as variáveis explicativas.
O que quero dizer é: o quanto a combinação das variáveis categóricas c1 c2 c3 c4 c5 c6... etc (biárias =0 ou 1) explicam meu x (numérico contínuo).
Será que existe um modo de eu ajustar dois modelos? Tipo com a variável resposta X em função de todas as varíaveis explicativas categóricas e outro modelo com a variável resposta Y em função de todas as variáveis explicativas categóricas?
c1 c2 c3 c4 x y 0 1 1 1 931 623 0 1 0 0 163 259 1 0 1 0 690 306 1 0 1 0 690 306
--
*Jefferson Ferreira-Ferreira*
Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
Jefferson.ferreira@mamiraua.org.br
*Instituto de Desenvolvimento Sustentável Mamirauá*
Ministério da Ciência, Tecnologia e Inovação
Telefone: +55 97 3343-9710
*Google Maps* - Mapas deste e-mail:
Exibir mapa ampliado <https://maps.google.com.br/maps?q=-3.355557,-64.731151&ll=-3.355471,-64.731145&spn=0.004632,0.006968&num=1&t=h&z=18>
*Contatos particulares:* *(55) 9615-0100*
Em 18 de setembro de 2014 12:56, Daniel Tiezzi <dtiezzi@usp.br> escreveu:
Você precisa fazer uma regressão.
Segue um modelo
# Regression analyses, standardized model1.z <- lm(scale(PE$endurance) ~ scale(PE$age)) summary(model1.z) confint(model1.z)
model2.z <- lm(scale(PE$endurance) ~ scale(PE$activeyears)) summary(model2.z) confint(model2.z)
model3.z <- lm(scale(PE$endurance) ~ scale(PE$age) + scale(PE$activeyears)) summary(model3.z) confint(model3.z)
# Conduct a model comparison NHST to compare the fit of model2.z to the fit of model3.z anova(model2.z, model3.z)
Acho que seria assim
Daniel
Daniel Tiezzi, MD, PhD Professor Associado Departamento de Ginecologia e Obstetrícia Setor de Mastologia e Oncologia Ginecológica Faculdade de Medicina de Ribeirão Preto - USP Tel.: 16 3602-2488 e-mail: dtiezzi@fmrp.usp.br
On Sep 18, 2014, at 12:47 PM, Jefferson Ferreira-Ferreira < jecogeo@gmail.com> wrote:
Prezados;
Uma dúvida básica de um iniciante em análises estatísticas. Tenho uma série de variáveis categóricas binárias e duas variáveis contínuas. Eu gostaria de saber o quando minhas variáveis categóricas explicam minhas duas variáveis contínuas. Por exemplo:
c1 c2 c3 c4 x y 0 1 1 1 931 623 0 1 0 0 163 259 1 0 1 0 690 306 1 0 1 0 690 306
A pergunta é: o quanto a combinação das variáveis c explicam os valores de x e y? Ou, qual a correlação entre as variáveis c e as variáveis x e y?
Podem me dar alguma ideia de análises possíveis? Obrigado.
--
*Jefferson Ferreira-Ferreira* Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
Jefferson.ferreira@mamiraua.org.br *Instituto de Desenvolvimento Sustentável Mamirauá*
Ministério da Ciência, Tecnologia e Inovação Telefone: +55 97 3343-9710
*Google Maps* - Mapas deste e-mail:
Exibir mapa ampliado <https://maps.google.com.br/maps?q=-3.355557,-64.731151&ll=-3.355471,-64.731145&spn=0.004632,0.006968&num=1&t=h&z=18>
*Contatos particulares:* *(55) 9615-0100* _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

As suas variáveis não são colineares? Por isso está saindo o NA no modelo de regressão Daniel ----- Mensagem original -----
De: "Jefferson Ferreira-Ferreira" <jecogeo@gmail.com> Para: r-br@listas.c3sl.ufpr.br Enviadas: Quinta-feira, 18 de Setembro de 2014 15:48:04 Assunto: Re: [R-br] Variáveis contínuas explicando Variáveis categóricas
Daniel e demais,
Aparentemente não resolve, pois recebo NAs para diversos slopes. (ver summary do modelo abaixo). E acho que isso não pode estar certo. Segue aqui um exemplo dos meus dados. O que eu gostaria é de ver o quanto as variáveis categóricas explicam minha media_CBT e minha media_CCS.
Alguma ideia???
agua_quente detergentes agua_trat Filtr_leite Higie_resf pre_dipping toalha pos_dipping vacuo pulsador Aliment_pos media_CBT media_CCS 1 0 0 1 0 1 1 1 1 1 1 931 623.3333333 1 0 0 1 1 0 1 1 1 1 1 163.6666667 259 1 0 0 1 1 1 1 1 0 0 0 690.3333333 306.3333333 1 0 0 1 1 1 1 1 0 0 1 690.3333333 306.3333333
summary(m)
Call: lm(formula = dados$media_CBT ~ dados$agua_quente + dados$detergentes + dados$agua_trat + dados$Filtr_leite + dados$Higie_resf + dados$pre_dipping + dados$toalha + dados$pos_dipping + dados$vacuo)
Residuals: 1 2 3 4 0.000e+00 -3.155e-30 4.019e-14 -4.019e-14
Coefficients: (7 not defined because of singularities) Estimate Std. Error t value Pr(>|t|) (Intercept) 4.043e+02 8.988e-14 4.499e+15 <2e-16 *** dados$agua_quente NA NA NA NA dados$detergentes NA NA NA NA dados$agua_trat NA NA NA NA dados$Filtr_leite NA NA NA NA dados$Higie_resf -2.407e+02 6.962e-14 -3.457e+15 <2e-16 *** dados$pre_dipping 5.267e+02 6.962e-14 7.565e+15 <2e-16 *** dados$toalha NA NA NA NA dados$pos_dipping NA NA NA NA dados$vacuo NA NA NA NA --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 5.684e-14 on 1 degrees of freedom Multiple R-squared: 1, Adjusted R-squared: 1 F-statistic: 4.872e+31 on 2 and 1 DF, p-value: < 2.2e-16
Em 18 de setembro de 2014 15:36, < dtiezzi@usp.br > escreveu:
Jefferson
Montando o modele assim
model <- lm(test$x ~ test$c1 + test$c2 + test$c3 + test$c4)
não resolve seu problema?
Daniel
De: "Jefferson Ferreira-Ferreira" < jecogeo@gmail.com >
Para: r-br@listas.c3sl.ufpr.br
Enviadas: Quinta-feira, 18 de Setembro de 2014 13:33:57
Assunto: Re: [R-br] Variáveis contínuas explicando Variáveis categóricas
Professor daniel,
Obrigado pela resposta. Ainda não testei essa alternativa. Mas a desvantagem dessa abordagem seria o grande número de modelos a serem ajustados, visto que tenho 11 variáveis explicativas categóricas para duas variáveis resposta numéricas contínuas. Isso me faria ajustar 22 modelos que teriam como premissa a independencia entre as variáveis explicativas.
O que quero dizer é: o quanto a combinação das variáveis categóricas c1 c2 c3 c4 c5 c6... etc (biárias =0 ou 1) explicam meu x (numérico contínuo).
Será que existe um modo de eu ajustar dois modelos? Tipo com a variável resposta X em função de todas as varíaveis explicativas categóricas e outro modelo com a variável resposta Y em função de todas as variáveis explicativas categóricas?
c1 c2 c3 c4 x y
0 1 1 1 931 623
0 1 0 0 163 259
1 0 1 0 690 306
1 0 1 0 690 306
--
Jefferson Ferreira-Ferreira
Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
Jefferson.ferreira@mamiraua.org.br
Instituto de Desenvolvimento Sustentável Mamirauá
Ministério da Ciência, Tecnologia e Inovação
Telefone: +55 97 3343-9710
Google Maps - Mapas deste e-mail :
Exibir mapa ampliado
Contatos particulares:
(55) 9615-0100
Em 18 de setembro de 2014 12:56, Daniel Tiezzi < dtiezzi@usp.br > escreveu:
Você precisa fazer uma regressão.
Segue um modelo
# Regression analyses, standardized
model1.z <- lm(scale(PE$endurance) ~ scale(PE$age))
summary(model1.z)
confint(model1.z)
model2.z <- lm(scale(PE$endurance) ~ scale(PE$activeyears))
summary(model2.z)
confint(model2.z)
model3.z <- lm(scale(PE$endurance) ~ scale(PE$age) + scale(PE$activeyears))
summary(model3.z)
confint(model3.z)
# Conduct a model comparison NHST to compare the fit of model2.z to the fit of model3.z
anova(model2.z, model3.z)
Acho que seria assim
Daniel
Daniel Tiezzi, MD, PhD
Professor Associado
Departamento de Ginecologia e Obstetrícia
Setor de Mastologia e Oncologia Ginecológica
Faculdade de Medicina de Ribeirão Preto - USP
Tel.: 16 3602-2488
e-mail: dtiezzi@fmrp.usp.br
On Sep 18, 2014, at 12:47 PM, Jefferson Ferreira-Ferreira < jecogeo@gmail.com > wrote:
Prezados;
Uma dúvida básica de um iniciante em análises estatísticas.
Tenho uma série de variáveis categóricas binárias e duas variáveis contínuas. Eu gostaria de saber o quando minhas variáveis categóricas explicam minhas duas variáveis contínuas. Por exemplo:
c1 c2 c3 c4 x y
0 1 1 1 931 623
0 1 0 0 163 259
1 0 1 0 690 306
1 0 1 0 690 306
A pergunta é: o quanto a combinação das variáveis c explicam os valores de x e y? Ou, qual a correlação entre as variáveis c e as variáveis x e y?
Podem me dar alguma ideia de análises possíveis?
Obrigado.
--
Jefferson Ferreira-Ferreira
Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
Jefferson.ferreira@mamiraua.org.br
Instituto de Desenvolvimento Sustentável Mamirauá
Ministério da Ciência, Tecnologia e Inovação
Telefone: +55 97 3343-9710
Google Maps - Mapas deste e-mail :
Exibir mapa ampliado
Contatos particulares:
(55) 9615-0100
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
Leia o guia de postagem ( http://www.leg.ufpr.br/r-br-guia ) e forneça código mínimo reproduzível.
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
Leia o guia de postagem ( http://www.leg.ufpr.br/r-br-guia ) e forneça código mínimo reproduzível.
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
Leia o guia de postagem ( http://www.leg.ufpr.br/r-br-guia ) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Pois então... Daniel ou mais algum colega da lista, teria alguma dica? Será que ANOVA ou lm seriam recomendadas para meus dados? Em 18 de setembro de 2014 16:04, <dtiezzi@usp.br> escreveu:
As suas variáveis não são colineares?
Por isso está saindo o NA no modelo de regressão
Daniel
------------------------------
*De: *"Jefferson Ferreira-Ferreira" <jecogeo@gmail.com> *Para: *r-br@listas.c3sl.ufpr.br *Enviadas: *Quinta-feira, 18 de Setembro de 2014 15:48:04
*Assunto: *Re: [R-br] Variáveis contínuas explicando Variáveis categóricas
Daniel e demais,
Aparentemente não resolve, pois recebo NAs para diversos slopes. (ver summary do modelo abaixo). E acho que isso não pode estar certo. Segue aqui um exemplo dos meus dados. O que eu gostaria é de ver o quanto as variáveis categóricas explicam minha media_CBT e minha media_CCS.
Alguma ideia???
agua_quente detergentes agua_trat Filtr_leite Higie_resf pre_dipping toalha pos_dipping vacuo pulsador Aliment_pos media_CBT media_CCS 1 0 0 1 0 1 1 1 1 1 1 931 623.3333333 1 0 0 1 1 0 1 1 1 1 1 163.6666667 259 1 0 0 1 1 1 1 1 0 0 0 690.3333333 306.3333333 1 0 0 1 1 1 1 1 0 0 1 690.3333333 306.3333333
summary(m)
Call: lm(formula = dados$media_CBT ~ dados$agua_quente + dados$detergentes + dados$agua_trat + dados$Filtr_leite + dados$Higie_resf + dados$pre_dipping + dados$toalha + dados$pos_dipping + dados$vacuo)
Residuals: 1 2 3 4 0.000e+00 -3.155e-30 4.019e-14 -4.019e-14
Coefficients: (7 not defined because of singularities) Estimate Std. Error t value Pr(>|t|) (Intercept) 4.043e+02 8.988e-14 4.499e+15 <2e-16 *** dados$agua_quente NA NA NA NA dados$detergentes NA NA NA NA dados$agua_trat NA NA NA NA dados$Filtr_leite NA NA NA NA dados$Higie_resf -2.407e+02 6.962e-14 -3.457e+15 <2e-16 *** dados$pre_dipping 5.267e+02 6.962e-14 7.565e+15 <2e-16 *** dados$toalha NA NA NA NA dados$pos_dipping NA NA NA NA dados$vacuo NA NA NA NA --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 5.684e-14 on 1 degrees of freedom Multiple R-squared: 1, Adjusted R-squared: 1 F-statistic: 4.872e+31 on 2 and 1 DF, p-value: < 2.2e-16
Em 18 de setembro de 2014 15:36, <dtiezzi@usp.br> escreveu:
Jefferson
Montando o modele assim
model <- lm(test$x ~ test$c1 + test$c2 + test$c3 + test$c4)
não resolve seu problema?
Daniel
------------------------------
*De: *"Jefferson Ferreira-Ferreira" <jecogeo@gmail.com> *Para: *r-br@listas.c3sl.ufpr.br *Enviadas: *Quinta-feira, 18 de Setembro de 2014 13:33:57 *Assunto: *Re: [R-br] Variáveis contínuas explicando Variáveis categóricas
Professor daniel, Obrigado pela resposta. Ainda não testei essa alternativa. Mas a desvantagem dessa abordagem seria o grande número de modelos a serem ajustados, visto que tenho 11 variáveis explicativas categóricas para duas variáveis resposta numéricas contínuas. Isso me faria ajustar 22 modelos que teriam como premissa a independencia entre as variáveis explicativas.
O que quero dizer é: o quanto a combinação das variáveis categóricas c1 c2 c3 c4 c5 c6... etc (biárias =0 ou 1) explicam meu x (numérico contínuo).
Será que existe um modo de eu ajustar dois modelos? Tipo com a variável resposta X em função de todas as varíaveis explicativas categóricas e outro modelo com a variável resposta Y em função de todas as variáveis explicativas categóricas?
c1 c2 c3 c4 x y 0 1 1 1 931 623 0 1 0 0 163 259 1 0 1 0 690 306 1 0 1 0 690 306
--
*Jefferson Ferreira-Ferreira*
Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
Jefferson.ferreira@mamiraua.org.br
*Instituto de Desenvolvimento Sustentável Mamirauá*
Ministério da Ciência, Tecnologia e Inovação
Telefone: +55 97 3343-9710
*Google Maps* - Mapas deste e-mail:
Exibir mapa ampliado <https://maps.google.com.br/maps?q=-3.355557,-64.731151&ll=-3.355471,-64.731145&spn=0.004632,0.006968&num=1&t=h&z=18>
*Contatos particulares:* *(55) 9615-0100*
Em 18 de setembro de 2014 12:56, Daniel Tiezzi <dtiezzi@usp.br> escreveu:
Você precisa fazer uma regressão.
Segue um modelo
# Regression analyses, standardized model1.z <- lm(scale(PE$endurance) ~ scale(PE$age)) summary(model1.z) confint(model1.z)
model2.z <- lm(scale(PE$endurance) ~ scale(PE$activeyears)) summary(model2.z) confint(model2.z)
model3.z <- lm(scale(PE$endurance) ~ scale(PE$age) + scale(PE$activeyears)) summary(model3.z) confint(model3.z)
# Conduct a model comparison NHST to compare the fit of model2.z to the fit of model3.z anova(model2.z, model3.z)
Acho que seria assim
Daniel
Daniel Tiezzi, MD, PhD Professor Associado Departamento de Ginecologia e Obstetrícia Setor de Mastologia e Oncologia Ginecológica Faculdade de Medicina de Ribeirão Preto - USP Tel.: 16 3602-2488 e-mail: dtiezzi@fmrp.usp.br
On Sep 18, 2014, at 12:47 PM, Jefferson Ferreira-Ferreira < jecogeo@gmail.com> wrote:
Prezados;
Uma dúvida básica de um iniciante em análises estatísticas. Tenho uma série de variáveis categóricas binárias e duas variáveis contínuas. Eu gostaria de saber o quando minhas variáveis categóricas explicam minhas duas variáveis contínuas. Por exemplo:
c1 c2 c3 c4 x y 0 1 1 1 931 623 0 1 0 0 163 259 1 0 1 0 690 306 1 0 1 0 690 306
A pergunta é: o quanto a combinação das variáveis c explicam os valores de x e y? Ou, qual a correlação entre as variáveis c e as variáveis x e y?
Podem me dar alguma ideia de análises possíveis? Obrigado.
--
*Jefferson Ferreira-Ferreira* Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
Jefferson.ferreira@mamiraua.org.br *Instituto de Desenvolvimento Sustentável Mamirauá*
Ministério da Ciência, Tecnologia e Inovação Telefone: +55 97 3343-9710
*Google Maps* - Mapas deste e-mail:
Exibir mapa ampliado <https://maps.google.com.br/maps?q=-3.355557,-64.731151&ll=-3.355471,-64.731145&spn=0.004632,0.006968&num=1&t=h&z=18>
*Contatos particulares:* *(55) 9615-0100* _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- *Jefferson Ferreira-Ferreira* Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI Jefferson.ferreira@mamiraua.org.br *Instituto de Desenvolvimento Sustentável Mamirauá* Ministério da Ciência, Tecnologia e Inovação Telefone: +55 97 3343-9710 *Google Maps* - Mapas deste e-mail: Exibir mapa ampliado <https://maps.google.com.br/maps?q=-3.355557,-64.731151&ll=-3.355471,-64.731145&spn=0.004632,0.006968&num=1&t=h&z=18> *Contatos particulares:* *(55) 9615-0100*

Faça uma matrix de correlação das suas variáveis.
cor(dados$agua_quente + dados$detergentes + dados$agua_trat + dados$Filtr_leite + dados$Higie_resf + dados$pre_dipping + dados$toalha + dados$pos_dipping + dados$vacuo)
Qual o retorno que você tem? Daniel Tiezzi, MD, PhD Professor Associado Departamento de Ginecologia e Obstetrícia Setor de Mastologia e Oncologia Ginecológica Faculdade de Medicina de Ribeirão Preto - USP Tel.: 16 3602-2488 e-mail: dtiezzi@fmrp.usp.br On Sep 18, 2014, at 4:24 PM, Jefferson Ferreira-Ferreira <jecogeo@gmail.com> wrote:
Pois então...
Daniel ou mais algum colega da lista, teria alguma dica? Será que ANOVA ou lm seriam recomendadas para meus dados?
Em 18 de setembro de 2014 16:04, <dtiezzi@usp.br> escreveu: As suas variáveis não são colineares?
Por isso está saindo o NA no modelo de regressão
Daniel
De: "Jefferson Ferreira-Ferreira" <jecogeo@gmail.com> Para: r-br@listas.c3sl.ufpr.br Enviadas: Quinta-feira, 18 de Setembro de 2014 15:48:04
Assunto: Re: [R-br] Variáveis contínuas explicando Variáveis categóricas
Daniel e demais,
Aparentemente não resolve, pois recebo NAs para diversos slopes. (ver summary do modelo abaixo). E acho que isso não pode estar certo. Segue aqui um exemplo dos meus dados. O que eu gostaria é de ver o quanto as variáveis categóricas explicam minha media_CBT e minha media_CCS.
Alguma ideia???
agua_quente detergentes agua_trat Filtr_leite Higie_resf pre_dipping toalha pos_dipping vacuo pulsador Aliment_pos media_CBT media_CCS 1 0 0 1 0 1 1 1 1 1 1 931 623.3333333 1 0 0 1 1 0 1 1 1 1 1 163.6666667 259 1 0 0 1 1 1 1 1 0 0 0 690.3333333 306.3333333 1 0 0 1 1 1 1 1 0 0 1 690.3333333 306.3333333
summary(m)
Call: lm(formula = dados$media_CBT ~ dados$agua_quente + dados$detergentes + dados$agua_trat + dados$Filtr_leite + dados$Higie_resf + dados$pre_dipping + dados$toalha + dados$pos_dipping + dados$vacuo)
Residuals: 1 2 3 4 0.000e+00 -3.155e-30 4.019e-14 -4.019e-14
Coefficients: (7 not defined because of singularities) Estimate Std. Error t value Pr(>|t|) (Intercept) 4.043e+02 8.988e-14 4.499e+15 <2e-16 *** dados$agua_quente NA NA NA NA dados$detergentes NA NA NA NA dados$agua_trat NA NA NA NA dados$Filtr_leite NA NA NA NA dados$Higie_resf -2.407e+02 6.962e-14 -3.457e+15 <2e-16 *** dados$pre_dipping 5.267e+02 6.962e-14 7.565e+15 <2e-16 *** dados$toalha NA NA NA NA dados$pos_dipping NA NA NA NA dados$vacuo NA NA NA NA --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 5.684e-14 on 1 degrees of freedom Multiple R-squared: 1, Adjusted R-squared: 1 F-statistic: 4.872e+31 on 2 and 1 DF, p-value: < 2.2e-16
Em 18 de setembro de 2014 15:36, <dtiezzi@usp.br> escreveu: Jefferson
Montando o modele assim
model <- lm(test$x ~ test$c1 + test$c2 + test$c3 + test$c4)
não resolve seu problema?
Daniel
De: "Jefferson Ferreira-Ferreira" <jecogeo@gmail.com> Para: r-br@listas.c3sl.ufpr.br Enviadas: Quinta-feira, 18 de Setembro de 2014 13:33:57 Assunto: Re: [R-br] Variáveis contínuas explicando Variáveis categóricas
Professor daniel, Obrigado pela resposta. Ainda não testei essa alternativa. Mas a desvantagem dessa abordagem seria o grande número de modelos a serem ajustados, visto que tenho 11 variáveis explicativas categóricas para duas variáveis resposta numéricas contínuas. Isso me faria ajustar 22 modelos que teriam como premissa a independencia entre as variáveis explicativas.
O que quero dizer é: o quanto a combinação das variáveis categóricas c1 c2 c3 c4 c5 c6... etc (biárias =0 ou 1) explicam meu x (numérico contínuo).
Será que existe um modo de eu ajustar dois modelos? Tipo com a variável resposta X em função de todas as varíaveis explicativas categóricas e outro modelo com a variável resposta Y em função de todas as variáveis explicativas categóricas?
c1 c2 c3 c4 x y 0 1 1 1 931 623 0 1 0 0 163 259 1 0 1 0 690 306 1 0 1 0 690 306
--
Jefferson Ferreira-Ferreira Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
Jefferson.ferreira@mamiraua.org.br Instituto de Desenvolvimento Sustentável Mamirauá Ministério da Ciência, Tecnologia e Inovação Telefone: +55 97 3343-9710 Google Maps - Mapas deste e-mail: Exibir mapa ampliado
Contatos particulares: (55) 9615-0100
Em 18 de setembro de 2014 12:56, Daniel Tiezzi <dtiezzi@usp.br> escreveu: Você precisa fazer uma regressão.
Segue um modelo
# Regression analyses, standardized model1.z <- lm(scale(PE$endurance) ~ scale(PE$age)) summary(model1.z) confint(model1.z)
model2.z <- lm(scale(PE$endurance) ~ scale(PE$activeyears)) summary(model2.z) confint(model2.z)
model3.z <- lm(scale(PE$endurance) ~ scale(PE$age) + scale(PE$activeyears)) summary(model3.z) confint(model3.z)
# Conduct a model comparison NHST to compare the fit of model2.z to the fit of model3.z anova(model2.z, model3.z)
Acho que seria assim
Daniel
Daniel Tiezzi, MD, PhD Professor Associado Departamento de Ginecologia e Obstetrícia Setor de Mastologia e Oncologia Ginecológica Faculdade de Medicina de Ribeirão Preto - USP Tel.: 16 3602-2488 e-mail: dtiezzi@fmrp.usp.br
On Sep 18, 2014, at 12:47 PM, Jefferson Ferreira-Ferreira <jecogeo@gmail.com> wrote:
Prezados;
Uma dúvida básica de um iniciante em análises estatísticas. Tenho uma série de variáveis categóricas binárias e duas variáveis contínuas. Eu gostaria de saber o quando minhas variáveis categóricas explicam minhas duas variáveis contínuas. Por exemplo:
c1 c2 c3 c4 x y 0 1 1 1 931 623 0 1 0 0 163 259 1 0 1 0 690 306 1 0 1 0 690 306
A pergunta é: o quanto a combinação das variáveis c explicam os valores de x e y? Ou, qual a correlação entre as variáveis c e as variáveis x e y?
Podem me dar alguma ideia de análises possíveis? Obrigado.
--
Jefferson Ferreira-Ferreira Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
Jefferson.ferreira@mamiraua.org.br Instituto de Desenvolvimento Sustentável Mamirauá Ministério da Ciência, Tecnologia e Inovação Telefone: +55 97 3343-9710 Google Maps - Mapas deste e-mail:
Exibir mapa ampliado
Contatos particulares: (55) 9615-0100 _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
--
Jefferson Ferreira-Ferreira Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
Jefferson.ferreira@mamiraua.org.br Instituto de Desenvolvimento Sustentável Mamirauá Ministério da Ciência, Tecnologia e Inovação Telefone: +55 97 3343-9710 Google Maps - Mapas deste e-mail: Exibir mapa ampliado
Contatos particulares: (55) 9615-0100 _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Daniel, Tenho um erro: Error in cor(dados$agua_quente + dados$detergentes + dados$agua_trat + : forneça conjuntamente 'x' e 'y' ou algo semelhante a uma matriz 'x' Em 18 de setembro de 2014 16:31, Daniel Tiezzi <dtiezzi@usp.br> escreveu:
Faça uma matrix de correlação das suas variáveis.
cor(dados$agua_quente + dados$detergentes + dados$agua_trat + dados$Filtr_leite + dados$Higie_resf + dados$pre_dipping + dados$toalha + dados$pos_dipping + dados$vacuo)
Qual o retorno que você tem?
Daniel Tiezzi, MD, PhD Professor Associado Departamento de Ginecologia e Obstetrícia Setor de Mastologia e Oncologia Ginecológica Faculdade de Medicina de Ribeirão Preto - USP Tel.: 16 3602-2488 e-mail: dtiezzi@fmrp.usp.br
On Sep 18, 2014, at 4:24 PM, Jefferson Ferreira-Ferreira < jecogeo@gmail.com> wrote:
Pois então...
Daniel ou mais algum colega da lista, teria alguma dica? Será que ANOVA ou lm seriam recomendadas para meus dados?
Em 18 de setembro de 2014 16:04, <dtiezzi@usp.br> escreveu:
As suas variáveis não são colineares?
Por isso está saindo o NA no modelo de regressão
Daniel
------------------------------
*De: *"Jefferson Ferreira-Ferreira" <jecogeo@gmail.com> *Para: *r-br@listas.c3sl.ufpr.br *Enviadas: *Quinta-feira, 18 de Setembro de 2014 15:48:04
*Assunto: *Re: [R-br] Variáveis contínuas explicando Variáveis categóricas
Daniel e demais,
Aparentemente não resolve, pois recebo NAs para diversos slopes. (ver summary do modelo abaixo). E acho que isso não pode estar certo. Segue aqui um exemplo dos meus dados. O que eu gostaria é de ver o quanto as variáveis categóricas explicam minha media_CBT e minha media_CCS.
Alguma ideia???
agua_quente detergentes agua_trat Filtr_leite Higie_resf pre_dipping toalha pos_dipping vacuo pulsador Aliment_pos media_CBT media_CCS 1 0 0 1 0 1 1 1 1 1 1 931 623.3333333 1 0 0 1 1 0 1 1 1 1 1 163.6666667 259 1 0 0 1 1 1 1 1 0 0 0 690.3333333 306.3333333 1 0 0 1 1 1 1 1 0 0 1 690.3333333 306.3333333
summary(m)
Call: lm(formula = dados$media_CBT ~ dados$agua_quente + dados$detergentes + dados$agua_trat + dados$Filtr_leite + dados$Higie_resf + dados$pre_dipping + dados$toalha + dados$pos_dipping + dados$vacuo)
Residuals: 1 2 3 4 0.000e+00 -3.155e-30 4.019e-14 -4.019e-14
Coefficients: (7 not defined because of singularities) Estimate Std. Error t value Pr(>|t|) (Intercept) 4.043e+02 8.988e-14 4.499e+15 <2e-16 *** dados$agua_quente NA NA NA NA dados$detergentes NA NA NA NA dados$agua_trat NA NA NA NA dados$Filtr_leite NA NA NA NA dados$Higie_resf -2.407e+02 6.962e-14 -3.457e+15 <2e-16 *** dados$pre_dipping 5.267e+02 6.962e-14 7.565e+15 <2e-16 *** dados$toalha NA NA NA NA dados$pos_dipping NA NA NA NA dados$vacuo NA NA NA NA --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 5.684e-14 on 1 degrees of freedom Multiple R-squared: 1, Adjusted R-squared: 1 F-statistic: 4.872e+31 on 2 and 1 DF, p-value: < 2.2e-16
Em 18 de setembro de 2014 15:36, <dtiezzi@usp.br> escreveu:
Jefferson
Montando o modele assim
model <- lm(test$x ~ test$c1 + test$c2 + test$c3 + test$c4)
não resolve seu problema?
Daniel
------------------------------
*De: *"Jefferson Ferreira-Ferreira" <jecogeo@gmail.com> *Para: *r-br@listas.c3sl.ufpr.br *Enviadas: *Quinta-feira, 18 de Setembro de 2014 13:33:57 *Assunto: *Re: [R-br] Variáveis contínuas explicando Variáveis categóricas
Professor daniel, Obrigado pela resposta. Ainda não testei essa alternativa. Mas a desvantagem dessa abordagem seria o grande número de modelos a serem ajustados, visto que tenho 11 variáveis explicativas categóricas para duas variáveis resposta numéricas contínuas. Isso me faria ajustar 22 modelos que teriam como premissa a independencia entre as variáveis explicativas.
O que quero dizer é: o quanto a combinação das variáveis categóricas c1 c2 c3 c4 c5 c6... etc (biárias =0 ou 1) explicam meu x (numérico contínuo).
Será que existe um modo de eu ajustar dois modelos? Tipo com a variável resposta X em função de todas as varíaveis explicativas categóricas e outro modelo com a variável resposta Y em função de todas as variáveis explicativas categóricas?
c1 c2 c3 c4 x y 0 1 1 1 931 623 0 1 0 0 163 259 1 0 1 0 690 306 1 0 1 0 690 306
--
*Jefferson Ferreira-Ferreira* Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
Jefferson.ferreira@mamiraua.org.br *Instituto de Desenvolvimento Sustentável Mamirauá*
Ministério da Ciência, Tecnologia e Inovação Telefone: +55 97 3343-9710
*Google Maps* - Mapas deste e-mail:
Exibir mapa ampliado <https://maps.google.com.br/maps?q=-3.355557,-64.731151&ll=-3.355471,-64.731145&spn=0.004632,0.006968&num=1&t=h&z=18>
*Contatos particulares:* *(55) 9615-0100*
Em 18 de setembro de 2014 12:56, Daniel Tiezzi <dtiezzi@usp.br> escreveu:
Você precisa fazer uma regressão.
Segue um modelo
# Regression analyses, standardized model1.z <- lm(scale(PE$endurance) ~ scale(PE$age)) summary(model1.z) confint(model1.z)
model2.z <- lm(scale(PE$endurance) ~ scale(PE$activeyears)) summary(model2.z) confint(model2.z)
model3.z <- lm(scale(PE$endurance) ~ scale(PE$age) + scale(PE$activeyears)) summary(model3.z) confint(model3.z)
# Conduct a model comparison NHST to compare the fit of model2.z to the fit of model3.z anova(model2.z, model3.z)
Acho que seria assim
Daniel
Daniel Tiezzi, MD, PhD Professor Associado Departamento de Ginecologia e Obstetrícia Setor de Mastologia e Oncologia Ginecológica Faculdade de Medicina de Ribeirão Preto - USP Tel.: 16 3602-2488 e-mail: dtiezzi@fmrp.usp.br
On Sep 18, 2014, at 12:47 PM, Jefferson Ferreira-Ferreira < jecogeo@gmail.com> wrote:
Prezados;
Uma dúvida básica de um iniciante em análises estatísticas. Tenho uma série de variáveis categóricas binárias e duas variáveis contínuas. Eu gostaria de saber o quando minhas variáveis categóricas explicam minhas duas variáveis contínuas. Por exemplo:
c1 c2 c3 c4 x y 0 1 1 1 931 623 0 1 0 0 163 259 1 0 1 0 690 306 1 0 1 0 690 306
A pergunta é: o quanto a combinação das variáveis c explicam os valores de x e y? Ou, qual a correlação entre as variáveis c e as variáveis x e y?
Podem me dar alguma ideia de análises possíveis? Obrigado.
--
*Jefferson Ferreira-Ferreira* Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
Jefferson.ferreira@mamiraua.org.br *Instituto de Desenvolvimento Sustentável Mamirauá*
Ministério da Ciência, Tecnologia e Inovação Telefone: +55 97 3343-9710
*Google Maps* - Mapas deste e-mail:
Exibir mapa ampliado <https://maps.google.com.br/maps?q=-3.355557,-64.731151&ll=-3.355471,-64.731145&spn=0.004632,0.006968&num=1&t=h&z=18>
*Contatos particulares:* *(55) 9615-0100* _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
--
*Jefferson Ferreira-Ferreira* Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
Jefferson.ferreira@mamiraua.org.br *Instituto de Desenvolvimento Sustentável Mamirauá*
Ministério da Ciência, Tecnologia e Inovação Telefone: +55 97 3343-9710
*Google Maps* - Mapas deste e-mail:
Exibir mapa ampliado <https://maps.google.com.br/maps?q=-3.355557,-64.731151&ll=-3.355471,-64.731145&spn=0.004632,0.006968&num=1&t=h&z=18>
*Contatos particulares:* *(55) 9615-0100* _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- *Jefferson Ferreira-Ferreira* Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI Jefferson.ferreira@mamiraua.org.br *Instituto de Desenvolvimento Sustentável Mamirauá* Ministério da Ciência, Tecnologia e Inovação Telefone: +55 97 3343-9710 *Google Maps* - Mapas deste e-mail: Exibir mapa ampliado <https://maps.google.com.br/maps?q=-3.355557,-64.731151&ll=-3.355471,-64.731145&spn=0.004632,0.006968&num=1&t=h&z=18> *Contatos particulares:* *(55) 9615-0100*

Desculpa, eu viajei Faça a correlação da matrix sem as variáveis contínuas cor(matrix) Daniel Daniel Tiezzi, MD, PhD Professor Associado Departamento de Ginecologia e Obstetrícia Setor de Mastologia e Oncologia Ginecológica Faculdade de Medicina de Ribeirão Preto - USP Tel.: 16 3602-2488 e-mail: dtiezzi@fmrp.usp.br On Sep 18, 2014, at 4:41 PM, Jefferson Ferreira-Ferreira <jecogeo@gmail.com> wrote:
Daniel,
Tenho um erro:
Error in cor(dados$agua_quente + dados$detergentes + dados$agua_trat + : forneça conjuntamente 'x' e 'y' ou algo semelhante a uma matriz 'x'
Em 18 de setembro de 2014 16:31, Daniel Tiezzi <dtiezzi@usp.br> escreveu: Faça uma matrix de correlação das suas variáveis.
cor(dados$agua_quente + dados$detergentes + dados$agua_trat + dados$Filtr_leite + dados$Higie_resf + dados$pre_dipping + dados$toalha + dados$pos_dipping + dados$vacuo)
Qual o retorno que você tem?
Daniel Tiezzi, MD, PhD Professor Associado Departamento de Ginecologia e Obstetrícia Setor de Mastologia e Oncologia Ginecológica Faculdade de Medicina de Ribeirão Preto - USP Tel.: 16 3602-2488 e-mail: dtiezzi@fmrp.usp.br
On Sep 18, 2014, at 4:24 PM, Jefferson Ferreira-Ferreira <jecogeo@gmail.com> wrote:
Pois então...
Daniel ou mais algum colega da lista, teria alguma dica? Será que ANOVA ou lm seriam recomendadas para meus dados?
Em 18 de setembro de 2014 16:04, <dtiezzi@usp.br> escreveu: As suas variáveis não são colineares?
Por isso está saindo o NA no modelo de regressão
Daniel
De: "Jefferson Ferreira-Ferreira" <jecogeo@gmail.com> Para: r-br@listas.c3sl.ufpr.br Enviadas: Quinta-feira, 18 de Setembro de 2014 15:48:04
Assunto: Re: [R-br] Variáveis contínuas explicando Variáveis categóricas
Daniel e demais,
Aparentemente não resolve, pois recebo NAs para diversos slopes. (ver summary do modelo abaixo). E acho que isso não pode estar certo. Segue aqui um exemplo dos meus dados. O que eu gostaria é de ver o quanto as variáveis categóricas explicam minha media_CBT e minha media_CCS.
Alguma ideia???
agua_quente detergentes agua_trat Filtr_leite Higie_resf pre_dipping toalha pos_dipping vacuo pulsador Aliment_pos media_CBT media_CCS 1 0 0 1 0 1 1 1 1 1 1 931 623.3333333 1 0 0 1 1 0 1 1 1 1 1 163.6666667 259 1 0 0 1 1 1 1 1 0 0 0 690.3333333 306.3333333 1 0 0 1 1 1 1 1 0 0 1 690.3333333 306.3333333
summary(m)
Call: lm(formula = dados$media_CBT ~ dados$agua_quente + dados$detergentes + dados$agua_trat + dados$Filtr_leite + dados$Higie_resf + dados$pre_dipping + dados$toalha + dados$pos_dipping + dados$vacuo)
Residuals: 1 2 3 4 0.000e+00 -3.155e-30 4.019e-14 -4.019e-14
Coefficients: (7 not defined because of singularities) Estimate Std. Error t value Pr(>|t|) (Intercept) 4.043e+02 8.988e-14 4.499e+15 <2e-16 *** dados$agua_quente NA NA NA NA dados$detergentes NA NA NA NA dados$agua_trat NA NA NA NA dados$Filtr_leite NA NA NA NA dados$Higie_resf -2.407e+02 6.962e-14 -3.457e+15 <2e-16 *** dados$pre_dipping 5.267e+02 6.962e-14 7.565e+15 <2e-16 *** dados$toalha NA NA NA NA dados$pos_dipping NA NA NA NA dados$vacuo NA NA NA NA --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 5.684e-14 on 1 degrees of freedom Multiple R-squared: 1, Adjusted R-squared: 1 F-statistic: 4.872e+31 on 2 and 1 DF, p-value: < 2.2e-16
Em 18 de setembro de 2014 15:36, <dtiezzi@usp.br> escreveu: Jefferson
Montando o modele assim
model <- lm(test$x ~ test$c1 + test$c2 + test$c3 + test$c4)
não resolve seu problema?
Daniel
De: "Jefferson Ferreira-Ferreira" <jecogeo@gmail.com> Para: r-br@listas.c3sl.ufpr.br Enviadas: Quinta-feira, 18 de Setembro de 2014 13:33:57 Assunto: Re: [R-br] Variáveis contínuas explicando Variáveis categóricas
Professor daniel, Obrigado pela resposta. Ainda não testei essa alternativa. Mas a desvantagem dessa abordagem seria o grande número de modelos a serem ajustados, visto que tenho 11 variáveis explicativas categóricas para duas variáveis resposta numéricas contínuas. Isso me faria ajustar 22 modelos que teriam como premissa a independencia entre as variáveis explicativas.
O que quero dizer é: o quanto a combinação das variáveis categóricas c1 c2 c3 c4 c5 c6... etc (biárias =0 ou 1) explicam meu x (numérico contínuo).
Será que existe um modo de eu ajustar dois modelos? Tipo com a variável resposta X em função de todas as varíaveis explicativas categóricas e outro modelo com a variável resposta Y em função de todas as variáveis explicativas categóricas?
c1 c2 c3 c4 x y 0 1 1 1 931 623 0 1 0 0 163 259 1 0 1 0 690 306 1 0 1 0 690 306
--
Jefferson Ferreira-Ferreira Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
Jefferson.ferreira@mamiraua.org.br Instituto de Desenvolvimento Sustentável Mamirauá Ministério da Ciência, Tecnologia e Inovação Telefone: +55 97 3343-9710 Google Maps - Mapas deste e-mail: Exibir mapa ampliado
Contatos particulares: (55) 9615-0100
Em 18 de setembro de 2014 12:56, Daniel Tiezzi <dtiezzi@usp.br> escreveu: Você precisa fazer uma regressão.
Segue um modelo
# Regression analyses, standardized model1.z <- lm(scale(PE$endurance) ~ scale(PE$age)) summary(model1.z) confint(model1.z)
model2.z <- lm(scale(PE$endurance) ~ scale(PE$activeyears)) summary(model2.z) confint(model2.z)
model3.z <- lm(scale(PE$endurance) ~ scale(PE$age) + scale(PE$activeyears)) summary(model3.z) confint(model3.z)
# Conduct a model comparison NHST to compare the fit of model2.z to the fit of model3.z anova(model2.z, model3.z)
Acho que seria assim
Daniel
Daniel Tiezzi, MD, PhD Professor Associado Departamento de Ginecologia e Obstetrícia Setor de Mastologia e Oncologia Ginecológica Faculdade de Medicina de Ribeirão Preto - USP Tel.: 16 3602-2488 e-mail: dtiezzi@fmrp.usp.br
On Sep 18, 2014, at 12:47 PM, Jefferson Ferreira-Ferreira <jecogeo@gmail.com> wrote:
Prezados;
Uma dúvida básica de um iniciante em análises estatísticas. Tenho uma série de variáveis categóricas binárias e duas variáveis contínuas. Eu gostaria de saber o quando minhas variáveis categóricas explicam minhas duas variáveis contínuas. Por exemplo:
c1 c2 c3 c4 x y 0 1 1 1 931 623 0 1 0 0 163 259 1 0 1 0 690 306 1 0 1 0 690 306
A pergunta é: o quanto a combinação das variáveis c explicam os valores de x e y? Ou, qual a correlação entre as variáveis c e as variáveis x e y?
Podem me dar alguma ideia de análises possíveis? Obrigado.
--
Jefferson Ferreira-Ferreira Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
Jefferson.ferreira@mamiraua.org.br Instituto de Desenvolvimento Sustentável Mamirauá Ministério da Ciência, Tecnologia e Inovação Telefone: +55 97 3343-9710 Google Maps - Mapas deste e-mail:
Exibir mapa ampliado
Contatos particulares: (55) 9615-0100 _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
--
Jefferson Ferreira-Ferreira Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
Jefferson.ferreira@mamiraua.org.br Instituto de Desenvolvimento Sustentável Mamirauá Ministério da Ciência, Tecnologia e Inovação Telefone: +55 97 3343-9710 Google Maps - Mapas deste e-mail: Exibir mapa ampliado
Contatos particulares: (55) 9615-0100 _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
--
Jefferson Ferreira-Ferreira Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
Jefferson.ferreira@mamiraua.org.br Instituto de Desenvolvimento Sustentável Mamirauá Ministério da Ciência, Tecnologia e Inovação Telefone: +55 97 3343-9710 Google Maps - Mapas deste e-mail: Exibir mapa ampliado
Contatos particulares: (55) 9615-0100 _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

d <- dados[ ,-c( )] cor(d) Daniel Tiezzi, MD, PhD Professor Associado Departamento de Ginecologia e Obstetrícia Setor de Mastologia e Oncologia Ginecológica Faculdade de Medicina de Ribeirão Preto - USP Tel.: 16 3602-2488 e-mail: dtiezzi@fmrp.usp.br On Sep 18, 2014, at 4:41 PM, Jefferson Ferreira-Ferreira <jecogeo@gmail.com> wrote:
Daniel,
Tenho um erro:
Error in cor(dados$agua_quente + dados$detergentes + dados$agua_trat + : forneça conjuntamente 'x' e 'y' ou algo semelhante a uma matriz 'x'
Em 18 de setembro de 2014 16:31, Daniel Tiezzi <dtiezzi@usp.br> escreveu: Faça uma matrix de correlação das suas variáveis.
cor(dados$agua_quente + dados$detergentes + dados$agua_trat + dados$Filtr_leite + dados$Higie_resf + dados$pre_dipping + dados$toalha + dados$pos_dipping + dados$vacuo)
Qual o retorno que você tem?
Daniel Tiezzi, MD, PhD Professor Associado Departamento de Ginecologia e Obstetrícia Setor de Mastologia e Oncologia Ginecológica Faculdade de Medicina de Ribeirão Preto - USP Tel.: 16 3602-2488 e-mail: dtiezzi@fmrp.usp.br
On Sep 18, 2014, at 4:24 PM, Jefferson Ferreira-Ferreira <jecogeo@gmail.com> wrote:
Pois então...
Daniel ou mais algum colega da lista, teria alguma dica? Será que ANOVA ou lm seriam recomendadas para meus dados?
Em 18 de setembro de 2014 16:04, <dtiezzi@usp.br> escreveu: As suas variáveis não são colineares?
Por isso está saindo o NA no modelo de regressão
Daniel
De: "Jefferson Ferreira-Ferreira" <jecogeo@gmail.com> Para: r-br@listas.c3sl.ufpr.br Enviadas: Quinta-feira, 18 de Setembro de 2014 15:48:04
Assunto: Re: [R-br] Variáveis contínuas explicando Variáveis categóricas
Daniel e demais,
Aparentemente não resolve, pois recebo NAs para diversos slopes. (ver summary do modelo abaixo). E acho que isso não pode estar certo. Segue aqui um exemplo dos meus dados. O que eu gostaria é de ver o quanto as variáveis categóricas explicam minha media_CBT e minha media_CCS.
Alguma ideia???
agua_quente detergentes agua_trat Filtr_leite Higie_resf pre_dipping toalha pos_dipping vacuo pulsador Aliment_pos media_CBT media_CCS 1 0 0 1 0 1 1 1 1 1 1 931 623.3333333 1 0 0 1 1 0 1 1 1 1 1 163.6666667 259 1 0 0 1 1 1 1 1 0 0 0 690.3333333 306.3333333 1 0 0 1 1 1 1 1 0 0 1 690.3333333 306.3333333
summary(m)
Call: lm(formula = dados$media_CBT ~ dados$agua_quente + dados$detergentes + dados$agua_trat + dados$Filtr_leite + dados$Higie_resf + dados$pre_dipping + dados$toalha + dados$pos_dipping + dados$vacuo)
Residuals: 1 2 3 4 0.000e+00 -3.155e-30 4.019e-14 -4.019e-14
Coefficients: (7 not defined because of singularities) Estimate Std. Error t value Pr(>|t|) (Intercept) 4.043e+02 8.988e-14 4.499e+15 <2e-16 *** dados$agua_quente NA NA NA NA dados$detergentes NA NA NA NA dados$agua_trat NA NA NA NA dados$Filtr_leite NA NA NA NA dados$Higie_resf -2.407e+02 6.962e-14 -3.457e+15 <2e-16 *** dados$pre_dipping 5.267e+02 6.962e-14 7.565e+15 <2e-16 *** dados$toalha NA NA NA NA dados$pos_dipping NA NA NA NA dados$vacuo NA NA NA NA --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 5.684e-14 on 1 degrees of freedom Multiple R-squared: 1, Adjusted R-squared: 1 F-statistic: 4.872e+31 on 2 and 1 DF, p-value: < 2.2e-16
Em 18 de setembro de 2014 15:36, <dtiezzi@usp.br> escreveu: Jefferson
Montando o modele assim
model <- lm(test$x ~ test$c1 + test$c2 + test$c3 + test$c4)
não resolve seu problema?
Daniel
De: "Jefferson Ferreira-Ferreira" <jecogeo@gmail.com> Para: r-br@listas.c3sl.ufpr.br Enviadas: Quinta-feira, 18 de Setembro de 2014 13:33:57 Assunto: Re: [R-br] Variáveis contínuas explicando Variáveis categóricas
Professor daniel, Obrigado pela resposta. Ainda não testei essa alternativa. Mas a desvantagem dessa abordagem seria o grande número de modelos a serem ajustados, visto que tenho 11 variáveis explicativas categóricas para duas variáveis resposta numéricas contínuas. Isso me faria ajustar 22 modelos que teriam como premissa a independencia entre as variáveis explicativas.
O que quero dizer é: o quanto a combinação das variáveis categóricas c1 c2 c3 c4 c5 c6... etc (biárias =0 ou 1) explicam meu x (numérico contínuo).
Será que existe um modo de eu ajustar dois modelos? Tipo com a variável resposta X em função de todas as varíaveis explicativas categóricas e outro modelo com a variável resposta Y em função de todas as variáveis explicativas categóricas?
c1 c2 c3 c4 x y 0 1 1 1 931 623 0 1 0 0 163 259 1 0 1 0 690 306 1 0 1 0 690 306
--
Jefferson Ferreira-Ferreira Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
Jefferson.ferreira@mamiraua.org.br Instituto de Desenvolvimento Sustentável Mamirauá Ministério da Ciência, Tecnologia e Inovação Telefone: +55 97 3343-9710 Google Maps - Mapas deste e-mail: Exibir mapa ampliado
Contatos particulares: (55) 9615-0100
Em 18 de setembro de 2014 12:56, Daniel Tiezzi <dtiezzi@usp.br> escreveu: Você precisa fazer uma regressão.
Segue um modelo
# Regression analyses, standardized model1.z <- lm(scale(PE$endurance) ~ scale(PE$age)) summary(model1.z) confint(model1.z)
model2.z <- lm(scale(PE$endurance) ~ scale(PE$activeyears)) summary(model2.z) confint(model2.z)
model3.z <- lm(scale(PE$endurance) ~ scale(PE$age) + scale(PE$activeyears)) summary(model3.z) confint(model3.z)
# Conduct a model comparison NHST to compare the fit of model2.z to the fit of model3.z anova(model2.z, model3.z)
Acho que seria assim
Daniel
Daniel Tiezzi, MD, PhD Professor Associado Departamento de Ginecologia e Obstetrícia Setor de Mastologia e Oncologia Ginecológica Faculdade de Medicina de Ribeirão Preto - USP Tel.: 16 3602-2488 e-mail: dtiezzi@fmrp.usp.br
On Sep 18, 2014, at 12:47 PM, Jefferson Ferreira-Ferreira <jecogeo@gmail.com> wrote:
Prezados;
Uma dúvida básica de um iniciante em análises estatísticas. Tenho uma série de variáveis categóricas binárias e duas variáveis contínuas. Eu gostaria de saber o quando minhas variáveis categóricas explicam minhas duas variáveis contínuas. Por exemplo:
c1 c2 c3 c4 x y 0 1 1 1 931 623 0 1 0 0 163 259 1 0 1 0 690 306 1 0 1 0 690 306
A pergunta é: o quanto a combinação das variáveis c explicam os valores de x e y? Ou, qual a correlação entre as variáveis c e as variáveis x e y?
Podem me dar alguma ideia de análises possíveis? Obrigado.
--
Jefferson Ferreira-Ferreira Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
Jefferson.ferreira@mamiraua.org.br Instituto de Desenvolvimento Sustentável Mamirauá Ministério da Ciência, Tecnologia e Inovação Telefone: +55 97 3343-9710 Google Maps - Mapas deste e-mail:
Exibir mapa ampliado
Contatos particulares: (55) 9615-0100 _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
--
Jefferson Ferreira-Ferreira Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
Jefferson.ferreira@mamiraua.org.br Instituto de Desenvolvimento Sustentável Mamirauá Ministério da Ciência, Tecnologia e Inovação Telefone: +55 97 3343-9710 Google Maps - Mapas deste e-mail: Exibir mapa ampliado
Contatos particulares: (55) 9615-0100 _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
--
Jefferson Ferreira-Ferreira Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
Jefferson.ferreira@mamiraua.org.br Instituto de Desenvolvimento Sustentável Mamirauá Ministério da Ciência, Tecnologia e Inovação Telefone: +55 97 3343-9710 Google Maps - Mapas deste e-mail: Exibir mapa ampliado
Contatos particulares: (55) 9615-0100 _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
participantes (3)
-
Daniel Tiezzi
-
dtiezzi@usp.br
-
Jefferson Ferreira-Ferreira