[R-br] Variáveis contínuas explicando Variáveis categóricas

Jefferson Ferreira-Ferreira jecogeo em gmail.com
Quinta Setembro 18 16:41:31 BRT 2014


Daniel,

Tenho um erro:

Error in cor(dados$agua_quente + dados$detergentes + dados$agua_trat +  :
  forneça conjuntamente 'x' e 'y' ou algo semelhante a uma matriz 'x'

Em 18 de setembro de 2014 16:31, Daniel Tiezzi <dtiezzi em usp.br> escreveu:

> Faça uma matrix de correlação das suas variáveis.
>
>  > cor(dados$agua_quente + dados$detergentes + dados$agua_trat +
> dados$Filtr_leite + dados$Higie_resf + dados$pre_dipping + dados$toalha +
> dados$pos_dipping + dados$vacuo)
>
> Qual o retorno que você tem?
>
>
>
>
>
>
> Daniel Tiezzi, MD, PhD
> Professor Associado
> Departamento de Ginecologia e Obstetrícia
> Setor de Mastologia e Oncologia Ginecológica
> Faculdade de Medicina de Ribeirão Preto - USP
> Tel.: 16 3602-2488
> e-mail: dtiezzi em fmrp.usp.br
>
>
>
>
>
> On Sep 18, 2014, at 4:24 PM, Jefferson Ferreira-Ferreira <
> jecogeo em gmail.com> wrote:
>
>
> Pois então...
>
> Daniel ou mais algum colega da lista, teria alguma dica? Será que ANOVA ou
> lm seriam recomendadas para meus dados?
>
> Em 18 de setembro de 2014 16:04, <dtiezzi em usp.br> escreveu:
>
>> As suas variáveis não são colineares?
>>
>> Por isso está saindo o NA no modelo de regressão
>>
>> Daniel
>>
>>
>>
>> ------------------------------
>>
>> *De: *"Jefferson Ferreira-Ferreira" <jecogeo em gmail.com>
>> *Para: *r-br em listas.c3sl.ufpr.br
>> *Enviadas: *Quinta-feira, 18 de Setembro de 2014 15:48:04
>>
>> *Assunto: *Re: [R-br] Variáveis contínuas explicando Variáveis
>> categóricas
>>
>>
>> Daniel e demais,
>>
>> Aparentemente não resolve, pois recebo NAs para diversos slopes. (ver
>> summary do modelo abaixo). E acho que isso não pode estar certo.
>> Segue aqui um exemplo dos meus dados. O que eu gostaria é de ver o quanto
>> as variáveis categóricas explicam minha media_CBT e minha media_CCS.
>>
>> Alguma ideia???
>>
>>
>>       agua_quente detergentes agua_trat Filtr_leite Higie_resf
>> pre_dipping toalha pos_dipping vacuo pulsador Aliment_pos media_CBT
>> media_CCS  1 0 0 1 0 1 1 1 1 1 1 931 623.3333333  1 0 0 1 1 0 1 1 1 1 1
>> 163.6666667 259  1 0 0 1 1 1 1 1 0 0 0 690.3333333 306.3333333  1 0 0 1 1
>> 1 1 1 0 0 1 690.3333333 306.3333333
>>
>>
>>
>> summary(m)
>>
>> Call:
>> lm(formula = dados$media_CBT ~ dados$agua_quente + dados$detergentes +
>>     dados$agua_trat + dados$Filtr_leite + dados$Higie_resf +
>>     dados$pre_dipping + dados$toalha + dados$pos_dipping + dados$vacuo)
>>
>> Residuals:
>>          1          2          3          4
>>  0.000e+00 -3.155e-30  4.019e-14 -4.019e-14
>>
>> Coefficients: (7 not defined because of singularities)
>>                     Estimate Std. Error    t value Pr(>|t|)
>> (Intercept)        4.043e+02  8.988e-14  4.499e+15   <2e-16 ***
>> dados$agua_quente         NA         NA         NA       NA
>> dados$detergentes         NA         NA         NA       NA
>> dados$agua_trat           NA         NA         NA       NA
>> dados$Filtr_leite         NA         NA         NA       NA
>> dados$Higie_resf  -2.407e+02  6.962e-14 -3.457e+15   <2e-16 ***
>> dados$pre_dipping  5.267e+02  6.962e-14  7.565e+15   <2e-16 ***
>> dados$toalha              NA         NA         NA       NA
>> dados$pos_dipping         NA         NA         NA       NA
>> dados$vacuo               NA         NA         NA       NA
>> ---
>> Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
>>
>> Residual standard error: 5.684e-14 on 1 degrees of freedom
>> Multiple R-squared:      1, Adjusted R-squared:      1
>> F-statistic: 4.872e+31 on 2 and 1 DF,  p-value: < 2.2e-16
>>
>>
>>
>>
>> Em 18 de setembro de 2014 15:36, <dtiezzi em usp.br> escreveu:
>>
>>> Jefferson
>>>
>>> Montando o modele assim
>>>
>>> model <- lm(test$x ~ test$c1 + test$c2 + test$c3 + test$c4)
>>>
>>> não resolve seu problema?
>>>
>>> Daniel
>>>
>>>
>>> ------------------------------
>>>
>>> *De: *"Jefferson Ferreira-Ferreira" <jecogeo em gmail.com>
>>> *Para: *r-br em listas.c3sl.ufpr.br
>>> *Enviadas: *Quinta-feira, 18 de Setembro de 2014 13:33:57
>>> *Assunto: *Re: [R-br] Variáveis contínuas explicando Variáveis
>>> categóricas
>>>
>>>
>>>
>>> Professor daniel,
>>> Obrigado pela resposta. Ainda não testei essa alternativa. Mas a
>>> desvantagem dessa abordagem seria o grande número de modelos a serem
>>> ajustados, visto que tenho 11 variáveis explicativas categóricas para duas
>>> variáveis resposta numéricas contínuas. Isso me faria ajustar 22 modelos
>>> que teriam como premissa a independencia entre as variáveis explicativas.
>>>
>>> O que quero dizer é: o quanto a combinação das variáveis categóricas c1
>>> c2 c3 c4 c5 c6... etc (biárias =0 ou 1)  explicam meu x (numérico
>>> contínuo).
>>>
>>> Será que existe um modo de eu ajustar dois modelos? Tipo com a variável
>>> resposta X em função de todas as varíaveis explicativas categóricas e outro
>>> modelo com a variável resposta Y em função de todas as variáveis
>>> explicativas categóricas?
>>>
>>>
>>>
>>> c1 c2 c3 c4 x y
>>> 0 1 1 1 931 623
>>> 0 1 0 0 163 259
>>> 1 0 1 0 690 306
>>> 1 0 1 0 690 306
>>>
>>>
>>> --
>>>
>>> *Jefferson Ferreira-Ferreira*
>>> Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
>>>
>>> Jefferson.ferreira em mamiraua.org.br
>>> *Instituto de Desenvolvimento Sustentável Mamirauá*
>>>
>>> Ministério da Ciência, Tecnologia e Inovação
>>> Telefone: +55 97 3343-9710
>>>
>>> *Google Maps* - Mapas deste e-mail:
>>>
>>> Exibir mapa ampliado
>>> <https://maps.google.com.br/maps?q=-3.355557,-64.731151&ll=-3.355471,-64.731145&spn=0.004632,0.006968&num=1&t=h&z=18>
>>>
>>>
>>>
>>> *Contatos particulares:*
>>> *(55) 9615-0100*
>>>
>>>
>>>
>>>
>>> Em 18 de setembro de 2014 12:56, Daniel Tiezzi <dtiezzi em usp.br>
>>> escreveu:
>>>
>>>> Você precisa fazer uma regressão.
>>>>
>>>> Segue um modelo
>>>>
>>>> # Regression analyses, standardized
>>>> model1.z <- lm(scale(PE$endurance) ~ scale(PE$age))
>>>> summary(model1.z)
>>>> confint(model1.z)
>>>>
>>>> model2.z <- lm(scale(PE$endurance) ~ scale(PE$activeyears))
>>>> summary(model2.z)
>>>> confint(model2.z)
>>>>
>>>> model3.z <- lm(scale(PE$endurance) ~ scale(PE$age) +
>>>> scale(PE$activeyears))
>>>> summary(model3.z)
>>>> confint(model3.z)
>>>>
>>>> # Conduct a model comparison NHST to compare the fit of model2.z to the
>>>> fit of model3.z
>>>> anova(model2.z, model3.z)
>>>>
>>>>
>>>> Acho que seria assim
>>>>
>>>>
>>>> Daniel
>>>>
>>>>
>>>>
>>>>
>>>> Daniel Tiezzi, MD, PhD
>>>> Professor Associado
>>>> Departamento de Ginecologia e Obstetrícia
>>>> Setor de Mastologia e Oncologia Ginecológica
>>>> Faculdade de Medicina de Ribeirão Preto - USP
>>>> Tel.: 16 3602-2488
>>>> e-mail: dtiezzi em fmrp.usp.br
>>>>
>>>>
>>>>
>>>>
>>>>
>>>> On Sep 18, 2014, at 12:47 PM, Jefferson Ferreira-Ferreira <
>>>> jecogeo em gmail.com> wrote:
>>>>
>>>>
>>>> Prezados;
>>>>
>>>> Uma dúvida básica de um iniciante em análises estatísticas.
>>>> Tenho uma série de variáveis categóricas binárias e duas variáveis
>>>> contínuas. Eu gostaria de saber o quando minhas variáveis categóricas
>>>> explicam minhas duas variáveis contínuas. Por exemplo:
>>>>
>>>> c1 c2 c3 c4 x y
>>>> 0 1 1 1 931 623
>>>> 0 1 0 0 163 259
>>>> 1 0 1 0 690 306
>>>> 1 0 1 0 690 306
>>>>
>>>>
>>>> A pergunta é: o quanto a combinação das variáveis c explicam os valores
>>>> de x e y? Ou, qual a correlação entre as variáveis c e as variáveis x e y?
>>>>
>>>> Podem me dar alguma ideia de análises possíveis?
>>>> Obrigado.
>>>>
>>>>
>>>> --
>>>>
>>>> *Jefferson Ferreira-Ferreira*
>>>> Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
>>>>
>>>> Jefferson.ferreira em mamiraua.org.br
>>>> *Instituto de Desenvolvimento Sustentável Mamirauá*
>>>>
>>>> Ministério da Ciência, Tecnologia e Inovação
>>>> Telefone: +55 97 3343-9710
>>>>
>>>> *Google Maps* - Mapas deste e-mail:
>>>>
>>>> Exibir mapa ampliado
>>>> <https://maps.google.com.br/maps?q=-3.355557,-64.731151&ll=-3.355471,-64.731145&spn=0.004632,0.006968&num=1&t=h&z=18>
>>>>
>>>>
>>>>
>>>> *Contatos particulares:*
>>>> *(55) 9615-0100*
>>>>  _______________________________________________
>>>> R-br mailing list
>>>> R-br em listas.c3sl.ufpr.br
>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>>> código mínimo reproduzível.
>>>>
>>>>
>>>>
>>>> _______________________________________________
>>>> R-br mailing list
>>>> R-br em listas.c3sl.ufpr.br
>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>>> código mínimo reproduzível.
>>>>
>>>
>>>
>>>
>>>
>>> _______________________________________________
>>> R-br mailing list
>>> R-br em listas.c3sl.ufpr.br
>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>> código mínimo reproduzível.
>>>
>>>
>>>
>>
>>
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>>
>>
>>
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>>
>
>
>
> --
>
> *Jefferson Ferreira-Ferreira*
> Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
>
> Jefferson.ferreira em mamiraua.org.br
> *Instituto de Desenvolvimento Sustentável Mamirauá*
>
> Ministério da Ciência, Tecnologia e Inovação
> Telefone: +55 97 3343-9710
>
> *Google Maps* - Mapas deste e-mail:
>
> Exibir mapa ampliado
> <https://maps.google.com.br/maps?q=-3.355557,-64.731151&ll=-3.355471,-64.731145&spn=0.004632,0.006968&num=1&t=h&z=18>
>
>
>
> *Contatos particulares:*
> *(55) 9615-0100*
>  _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>



-- 

*Jefferson Ferreira-Ferreira*

Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI


Jefferson.ferreira em mamiraua.org.br

*Instituto de Desenvolvimento Sustentável Mamirauá*

Ministério da Ciência, Tecnologia e Inovação

Telefone: +55 97 3343-9710

*Google Maps* - Mapas deste e-mail:

Exibir mapa ampliado
<https://maps.google.com.br/maps?q=-3.355557,-64.731151&ll=-3.355471,-64.731145&spn=0.004632,0.006968&num=1&t=h&z=18>


*Contatos particulares:*
*(55) 9615-0100*
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20140918/aea9510b/attachment-0001.html>


Mais detalhes sobre a lista de discussão R-br