[R-br] Variáveis contínuas explicando Variáveis categóricas

Jefferson Ferreira-Ferreira jecogeo em gmail.com
Quinta Setembro 18 16:24:59 BRT 2014


Pois então...

Daniel ou mais algum colega da lista, teria alguma dica? Será que ANOVA ou
lm seriam recomendadas para meus dados?

Em 18 de setembro de 2014 16:04, <dtiezzi em usp.br> escreveu:

> As suas variáveis não são colineares?
>
> Por isso está saindo o NA no modelo de regressão
>
> Daniel
>
>
>
> ------------------------------
>
> *De: *"Jefferson Ferreira-Ferreira" <jecogeo em gmail.com>
> *Para: *r-br em listas.c3sl.ufpr.br
> *Enviadas: *Quinta-feira, 18 de Setembro de 2014 15:48:04
>
> *Assunto: *Re: [R-br] Variáveis contínuas explicando Variáveis categóricas
>
>
> Daniel e demais,
>
> Aparentemente não resolve, pois recebo NAs para diversos slopes. (ver
> summary do modelo abaixo). E acho que isso não pode estar certo.
> Segue aqui um exemplo dos meus dados. O que eu gostaria é de ver o quanto
> as variáveis categóricas explicam minha media_CBT e minha media_CCS.
>
> Alguma ideia???
>
>
>       agua_quente detergentes agua_trat Filtr_leite Higie_resf pre_dipping
> toalha pos_dipping vacuo pulsador Aliment_pos media_CBT media_CCS  1 0 0 1
> 0 1 1 1 1 1 1 931 623.3333333  1 0 0 1 1 0 1 1 1 1 1 163.6666667 259  1 0
> 0 1 1 1 1 1 0 0 0 690.3333333 306.3333333  1 0 0 1 1 1 1 1 0 0 1
> 690.3333333 306.3333333
>
>
>
> summary(m)
>
> Call:
> lm(formula = dados$media_CBT ~ dados$agua_quente + dados$detergentes +
>     dados$agua_trat + dados$Filtr_leite + dados$Higie_resf +
>     dados$pre_dipping + dados$toalha + dados$pos_dipping + dados$vacuo)
>
> Residuals:
>          1          2          3          4
>  0.000e+00 -3.155e-30  4.019e-14 -4.019e-14
>
> Coefficients: (7 not defined because of singularities)
>                     Estimate Std. Error    t value Pr(>|t|)
> (Intercept)        4.043e+02  8.988e-14  4.499e+15   <2e-16 ***
> dados$agua_quente         NA         NA         NA       NA
> dados$detergentes         NA         NA         NA       NA
> dados$agua_trat           NA         NA         NA       NA
> dados$Filtr_leite         NA         NA         NA       NA
> dados$Higie_resf  -2.407e+02  6.962e-14 -3.457e+15   <2e-16 ***
> dados$pre_dipping  5.267e+02  6.962e-14  7.565e+15   <2e-16 ***
> dados$toalha              NA         NA         NA       NA
> dados$pos_dipping         NA         NA         NA       NA
> dados$vacuo               NA         NA         NA       NA
> ---
> Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
>
> Residual standard error: 5.684e-14 on 1 degrees of freedom
> Multiple R-squared:      1, Adjusted R-squared:      1
> F-statistic: 4.872e+31 on 2 and 1 DF,  p-value: < 2.2e-16
>
>
>
>
> Em 18 de setembro de 2014 15:36, <dtiezzi em usp.br> escreveu:
>
>> Jefferson
>>
>> Montando o modele assim
>>
>> model <- lm(test$x ~ test$c1 + test$c2 + test$c3 + test$c4)
>>
>> não resolve seu problema?
>>
>> Daniel
>>
>>
>> ------------------------------
>>
>> *De: *"Jefferson Ferreira-Ferreira" <jecogeo em gmail.com>
>> *Para: *r-br em listas.c3sl.ufpr.br
>> *Enviadas: *Quinta-feira, 18 de Setembro de 2014 13:33:57
>> *Assunto: *Re: [R-br] Variáveis contínuas explicando Variáveis
>> categóricas
>>
>>
>>
>> Professor daniel,
>> Obrigado pela resposta. Ainda não testei essa alternativa. Mas a
>> desvantagem dessa abordagem seria o grande número de modelos a serem
>> ajustados, visto que tenho 11 variáveis explicativas categóricas para duas
>> variáveis resposta numéricas contínuas. Isso me faria ajustar 22 modelos
>> que teriam como premissa a independencia entre as variáveis explicativas.
>>
>> O que quero dizer é: o quanto a combinação das variáveis categóricas c1
>> c2 c3 c4 c5 c6... etc (biárias =0 ou 1)  explicam meu x (numérico
>> contínuo).
>>
>> Será que existe um modo de eu ajustar dois modelos? Tipo com a variável
>> resposta X em função de todas as varíaveis explicativas categóricas e outro
>> modelo com a variável resposta Y em função de todas as variáveis
>> explicativas categóricas?
>>
>>
>>
>> c1 c2 c3 c4 x y
>> 0 1 1 1 931 623
>> 0 1 0 0 163 259
>> 1 0 1 0 690 306
>> 1 0 1 0 690 306
>>
>>
>> --
>>
>> *Jefferson Ferreira-Ferreira*
>>
>> Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
>>
>>
>> Jefferson.ferreira em mamiraua.org.br
>>
>> *Instituto de Desenvolvimento Sustentável Mamirauá*
>>
>> Ministério da Ciência, Tecnologia e Inovação
>>
>> Telefone: +55 97 3343-9710
>>
>> *Google Maps* - Mapas deste e-mail:
>>
>> Exibir mapa ampliado
>> <https://maps.google.com.br/maps?q=-3.355557,-64.731151&ll=-3.355471,-64.731145&spn=0.004632,0.006968&num=1&t=h&z=18>
>>
>>
>> *Contatos particulares:*
>> *(55) 9615-0100*
>>
>>
>>
>>
>> Em 18 de setembro de 2014 12:56, Daniel Tiezzi <dtiezzi em usp.br> escreveu:
>>
>>> Você precisa fazer uma regressão.
>>>
>>> Segue um modelo
>>>
>>> # Regression analyses, standardized
>>> model1.z <- lm(scale(PE$endurance) ~ scale(PE$age))
>>> summary(model1.z)
>>> confint(model1.z)
>>>
>>> model2.z <- lm(scale(PE$endurance) ~ scale(PE$activeyears))
>>> summary(model2.z)
>>> confint(model2.z)
>>>
>>> model3.z <- lm(scale(PE$endurance) ~ scale(PE$age) +
>>> scale(PE$activeyears))
>>> summary(model3.z)
>>> confint(model3.z)
>>>
>>> # Conduct a model comparison NHST to compare the fit of model2.z to the
>>> fit of model3.z
>>> anova(model2.z, model3.z)
>>>
>>>
>>> Acho que seria assim
>>>
>>>
>>> Daniel
>>>
>>>
>>>
>>>
>>> Daniel Tiezzi, MD, PhD
>>> Professor Associado
>>> Departamento de Ginecologia e Obstetrícia
>>> Setor de Mastologia e Oncologia Ginecológica
>>> Faculdade de Medicina de Ribeirão Preto - USP
>>> Tel.: 16 3602-2488
>>> e-mail: dtiezzi em fmrp.usp.br
>>>
>>>
>>>
>>>
>>>
>>> On Sep 18, 2014, at 12:47 PM, Jefferson Ferreira-Ferreira <
>>> jecogeo em gmail.com> wrote:
>>>
>>>
>>> Prezados;
>>>
>>> Uma dúvida básica de um iniciante em análises estatísticas.
>>> Tenho uma série de variáveis categóricas binárias e duas variáveis
>>> contínuas. Eu gostaria de saber o quando minhas variáveis categóricas
>>> explicam minhas duas variáveis contínuas. Por exemplo:
>>>
>>> c1 c2 c3 c4 x y
>>> 0 1 1 1 931 623
>>> 0 1 0 0 163 259
>>> 1 0 1 0 690 306
>>> 1 0 1 0 690 306
>>>
>>>
>>> A pergunta é: o quanto a combinação das variáveis c explicam os valores
>>> de x e y? Ou, qual a correlação entre as variáveis c e as variáveis x e y?
>>>
>>> Podem me dar alguma ideia de análises possíveis?
>>> Obrigado.
>>>
>>>
>>> --
>>>
>>> *Jefferson Ferreira-Ferreira*
>>> Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
>>>
>>> Jefferson.ferreira em mamiraua.org.br
>>> *Instituto de Desenvolvimento Sustentável Mamirauá*
>>>
>>> Ministério da Ciência, Tecnologia e Inovação
>>> Telefone: +55 97 3343-9710
>>>
>>> *Google Maps* - Mapas deste e-mail:
>>>
>>> Exibir mapa ampliado
>>> <https://maps.google.com.br/maps?q=-3.355557,-64.731151&ll=-3.355471,-64.731145&spn=0.004632,0.006968&num=1&t=h&z=18>
>>>
>>>
>>>
>>> *Contatos particulares:*
>>> *(55) 9615-0100*
>>>  _______________________________________________
>>> R-br mailing list
>>> R-br em listas.c3sl.ufpr.br
>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>> código mínimo reproduzível.
>>>
>>>
>>>
>>> _______________________________________________
>>> R-br mailing list
>>> R-br em listas.c3sl.ufpr.br
>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>> código mínimo reproduzível.
>>>
>>
>>
>>
>>
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>>
>>
>>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>



-- 

*Jefferson Ferreira-Ferreira*

Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI


Jefferson.ferreira em mamiraua.org.br

*Instituto de Desenvolvimento Sustentável Mamirauá*

Ministério da Ciência, Tecnologia e Inovação

Telefone: +55 97 3343-9710

*Google Maps* - Mapas deste e-mail:

Exibir mapa ampliado
<https://maps.google.com.br/maps?q=-3.355557,-64.731151&ll=-3.355471,-64.731145&spn=0.004632,0.006968&num=1&t=h&z=18>


*Contatos particulares:*
*(55) 9615-0100*
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20140918/cd78824a/attachment.html>


Mais detalhes sobre a lista de discussão R-br