[R-br] Variáveis contínuas explicando Variáveis categóricas
Daniel Tiezzi
dtiezzi em usp.br
Quinta Setembro 18 16:31:59 BRT 2014
Faça uma matrix de correlação das suas variáveis.
> cor(dados$agua_quente + dados$detergentes + dados$agua_trat + dados$Filtr_leite + dados$Higie_resf + dados$pre_dipping + dados$toalha + dados$pos_dipping + dados$vacuo)
Qual o retorno que você tem?
Daniel Tiezzi, MD, PhD
Professor Associado
Departamento de Ginecologia e Obstetrícia
Setor de Mastologia e Oncologia Ginecológica
Faculdade de Medicina de Ribeirão Preto - USP
Tel.: 16 3602-2488
e-mail: dtiezzi em fmrp.usp.br
On Sep 18, 2014, at 4:24 PM, Jefferson Ferreira-Ferreira <jecogeo em gmail.com> wrote:
>
> Pois então...
>
> Daniel ou mais algum colega da lista, teria alguma dica? Será que ANOVA ou lm seriam recomendadas para meus dados?
>
> Em 18 de setembro de 2014 16:04, <dtiezzi em usp.br> escreveu:
> As suas variáveis não são colineares?
>
> Por isso está saindo o NA no modelo de regressão
>
> Daniel
>
>
>
> De: "Jefferson Ferreira-Ferreira" <jecogeo em gmail.com>
> Para: r-br em listas.c3sl.ufpr.br
> Enviadas: Quinta-feira, 18 de Setembro de 2014 15:48:04
>
> Assunto: Re: [R-br] Variáveis contínuas explicando Variáveis categóricas
>
>
> Daniel e demais,
>
> Aparentemente não resolve, pois recebo NAs para diversos slopes. (ver summary do modelo abaixo). E acho que isso não pode estar certo.
> Segue aqui um exemplo dos meus dados. O que eu gostaria é de ver o quanto as variáveis categóricas explicam minha media_CBT e minha media_CCS.
>
> Alguma ideia???
>
>
> agua_quente detergentes agua_trat Filtr_leite Higie_resf pre_dipping toalha pos_dipping vacuo pulsador Aliment_pos media_CBT media_CCS
> 1 0 0 1 0 1 1 1 1 1 1 931 623.3333333
> 1 0 0 1 1 0 1 1 1 1 1 163.6666667 259
> 1 0 0 1 1 1 1 1 0 0 0 690.3333333 306.3333333
> 1 0 0 1 1 1 1 1 0 0 1 690.3333333 306.3333333
>
>
>
> summary(m)
>
> Call:
> lm(formula = dados$media_CBT ~ dados$agua_quente + dados$detergentes +
> dados$agua_trat + dados$Filtr_leite + dados$Higie_resf +
> dados$pre_dipping + dados$toalha + dados$pos_dipping + dados$vacuo)
>
> Residuals:
> 1 2 3 4
> 0.000e+00 -3.155e-30 4.019e-14 -4.019e-14
>
> Coefficients: (7 not defined because of singularities)
> Estimate Std. Error t value Pr(>|t|)
> (Intercept) 4.043e+02 8.988e-14 4.499e+15 <2e-16 ***
> dados$agua_quente NA NA NA NA
> dados$detergentes NA NA NA NA
> dados$agua_trat NA NA NA NA
> dados$Filtr_leite NA NA NA NA
> dados$Higie_resf -2.407e+02 6.962e-14 -3.457e+15 <2e-16 ***
> dados$pre_dipping 5.267e+02 6.962e-14 7.565e+15 <2e-16 ***
> dados$toalha NA NA NA NA
> dados$pos_dipping NA NA NA NA
> dados$vacuo NA NA NA NA
> ---
> Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
>
> Residual standard error: 5.684e-14 on 1 degrees of freedom
> Multiple R-squared: 1, Adjusted R-squared: 1
> F-statistic: 4.872e+31 on 2 and 1 DF, p-value: < 2.2e-16
>
>
>
>
> Em 18 de setembro de 2014 15:36, <dtiezzi em usp.br> escreveu:
> Jefferson
>
> Montando o modele assim
>
> model <- lm(test$x ~ test$c1 + test$c2 + test$c3 + test$c4)
>
> não resolve seu problema?
>
> Daniel
>
>
> De: "Jefferson Ferreira-Ferreira" <jecogeo em gmail.com>
> Para: r-br em listas.c3sl.ufpr.br
> Enviadas: Quinta-feira, 18 de Setembro de 2014 13:33:57
> Assunto: Re: [R-br] Variáveis contínuas explicando Variáveis categóricas
>
>
>
> Professor daniel,
> Obrigado pela resposta. Ainda não testei essa alternativa. Mas a desvantagem dessa abordagem seria o grande número de modelos a serem ajustados, visto que tenho 11 variáveis explicativas categóricas para duas variáveis resposta numéricas contínuas. Isso me faria ajustar 22 modelos que teriam como premissa a independencia entre as variáveis explicativas.
>
> O que quero dizer é: o quanto a combinação das variáveis categóricas c1 c2 c3 c4 c5 c6... etc (biárias =0 ou 1) explicam meu x (numérico contínuo).
>
> Será que existe um modo de eu ajustar dois modelos? Tipo com a variável resposta X em função de todas as varíaveis explicativas categóricas e outro modelo com a variável resposta Y em função de todas as variáveis explicativas categóricas?
>
>
>
> c1 c2 c3 c4 x y
> 0 1 1 1 931 623
> 0 1 0 0 163 259
> 1 0 1 0 690 306
> 1 0 1 0 690 306
>
>
> --
>
> Jefferson Ferreira-Ferreira
> Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
>
> Jefferson.ferreira em mamiraua.org.br
> Instituto de Desenvolvimento Sustentável Mamirauá
> Ministério da Ciência, Tecnologia e Inovação
> Telefone: +55 97 3343-9710
> Google Maps - Mapas deste e-mail:
> Exibir mapa ampliado
>
>
>
> Contatos particulares:
> (55) 9615-0100
>
>
>
>
> Em 18 de setembro de 2014 12:56, Daniel Tiezzi <dtiezzi em usp.br> escreveu:
> Você precisa fazer uma regressão.
>
> Segue um modelo
>
> # Regression analyses, standardized
> model1.z <- lm(scale(PE$endurance) ~ scale(PE$age))
> summary(model1.z)
> confint(model1.z)
>
> model2.z <- lm(scale(PE$endurance) ~ scale(PE$activeyears))
> summary(model2.z)
> confint(model2.z)
>
> model3.z <- lm(scale(PE$endurance) ~ scale(PE$age) + scale(PE$activeyears))
> summary(model3.z)
> confint(model3.z)
>
> # Conduct a model comparison NHST to compare the fit of model2.z to the fit of model3.z
> anova(model2.z, model3.z)
>
>
> Acho que seria assim
>
>
> Daniel
>
>
>
>
> Daniel Tiezzi, MD, PhD
> Professor Associado
> Departamento de Ginecologia e Obstetrícia
> Setor de Mastologia e Oncologia Ginecológica
> Faculdade de Medicina de Ribeirão Preto - USP
> Tel.: 16 3602-2488
> e-mail: dtiezzi em fmrp.usp.br
>
>
>
>
>
> On Sep 18, 2014, at 12:47 PM, Jefferson Ferreira-Ferreira <jecogeo em gmail.com> wrote:
>
>
> Prezados;
>
> Uma dúvida básica de um iniciante em análises estatísticas.
> Tenho uma série de variáveis categóricas binárias e duas variáveis contínuas. Eu gostaria de saber o quando minhas variáveis categóricas explicam minhas duas variáveis contínuas. Por exemplo:
>
> c1 c2 c3 c4 x y
> 0 1 1 1 931 623
> 0 1 0 0 163 259
> 1 0 1 0 690 306
> 1 0 1 0 690 306
>
>
> A pergunta é: o quanto a combinação das variáveis c explicam os valores de x e y? Ou, qual a correlação entre as variáveis c e as variáveis x e y?
>
> Podem me dar alguma ideia de análises possíveis?
> Obrigado.
>
>
> --
>
> Jefferson Ferreira-Ferreira
> Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
>
> Jefferson.ferreira em mamiraua.org.br
> Instituto de Desenvolvimento Sustentável Mamirauá
> Ministério da Ciência, Tecnologia e Inovação
> Telefone: +55 97 3343-9710
> Google Maps - Mapas deste e-mail:
>
> Exibir mapa ampliado
>
>
>
> Contatos particulares:
> (55) 9615-0100
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
>
>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
>
>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
>
>
>
> --
>
> Jefferson Ferreira-Ferreira
> Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
>
> Jefferson.ferreira em mamiraua.org.br
> Instituto de Desenvolvimento Sustentável Mamirauá
> Ministério da Ciência, Tecnologia e Inovação
> Telefone: +55 97 3343-9710
> Google Maps - Mapas deste e-mail:
> Exibir mapa ampliado
>
>
>
> Contatos particulares:
> (55) 9615-0100
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20140918/685c23aa/attachment.html>
Mais detalhes sobre a lista de discussão R-br