[R-br] Variáveis contínuas explicando Variáveis categóricas

Alexandre Serpa serpa.alexandre em gmail.com
Terça Outubro 7 18:05:48 BRT 2014


Prezado Jefferson,

Considerandos seus dados e as perguntas que você enviou, acredito que você
pode utilizar uma MANOVA já que suas variáveis dependentes são contínuas.
Além disso, a MANOVA permite o uso de variáveis indepentens binárias, o que
não é possível com a ANOVA - se minha memória estiver boa.

Grosso modo, a MANOVA é um tipo de regressão linear que te permite extrair
tanto a correlação quanto a variância explicada por suas variáveis.

Atenciosamente,


Alexandre Serpa

Psicólogo
Especialista em Métodos Computacionais Estatísticos
Mestre em Educação
Doutorando em Psicologia
email:   serpa.alexandre em gmail.com

Em 7 de outubro de 2014 17:51, Jose Claudio Faria <
joseclaudio.faria em gmail.com> escreveu:

> Jefferson,
>
> Seria interessante dar uma investigada nas possibilidades fornecidas pelas
> árvores classificação,
> como Y é categórico em seu caso: Y = f(x1, x2, ..., xn),
> sendo predito por x1, x2, ..., xn em escalas intervalares ou proporcionais.
>
> Existe a técnica para o caso Y ser univariado ou multivariado.
>
> Uma referência no Brasil é o Cesar Augusto Taconeli da UFPR (
> cetaconeli_at_gmail.com).
>
> Entre em contato com ele pois embora existam pacotes no R que dão suporte
> a técnica de análise, ela não é muito fácil.
>
> Na ausência de melhores informações, vai aqui um link do curso que o César
> deu aqui na UESC em junho de 2013:
> http://nbcgib.uesc.br/lec/llec/cursos/arv-cla-regressao
>
> Os pressupostos da técnica são bem brandos.
>
> Ab,
>
>
>
> ///\\\///\\\///\\\///\\\///\\\///\\\///\\\///\\\
> Jose Claudio Faria
> Estatistica
> UESC/DCET/Brasil
> joseclaudio.faria at gmail.com
> Telefones:
> 55(73)3680.5545 - UESC
> 55(73)9966.9100 - VIVO
> 55(73)9100.7351 - TIM
> 55(73)8817.6159 - OI
> ///\\\///\\\///\\\///\\\///\\\///\\\///\\\///\\\
>
> 2014-09-18 19:41 GMT-03:00 Vinicius Brito Rocha <viniciusbritor em gmail.com>
> :
>
> Vi nos seus dados que vc está tratando seus dados num modelo do tipo.
>> existe, não existe. 1 ou 0. E sua variável resposta é alguma métrica, sei
>> lá tipo consumo de energia...
>> minha sugestão é que vc use algum tipo de classe, ou categoria e agregue
>> seus dados pela média ou quem sabe soma, com classes independentes.
>> Para evitar problema de homocedasticidade.
>> O modelo de regressão linear de fato supõe que seus dados sejam valores
>> médios de algum critério, para determinadas observações.
>> Isso provavelmente vai te ajudar bastante. pode ser que não seja possível
>> em função da sua regra de negócio.
>>
>> espero ter ajudado.
>>
>> Boa sorte.
>>
>> abs
>>
>> vinicius
>>
>> Em 18 de setembro de 2014 18:52, Leonardo Ferreira Fontenelle <
>> leonardof em leonardof.med.br> escreveu:
>>
>>  Se você só estiver interessado por elas em conjunto, pode simplesmente
>>> comparar (com anova) um modelo com todas as C e sem nenhuma C (e deixando o
>>> resto igual).
>>>
>>> Leonardo Ferreira Fontenelle <http://lattes.cnpq.br/9234772336296638>
>>>
>>>
>>> Em Qui 18 set. 2014, às 13:33, Jefferson Ferreira-Ferreira escreveu:
>>>
>>>
>>> Professor daniel,
>>> Obrigado pela resposta. Ainda não testei essa alternativa. Mas a
>>> desvantagem dessa abordagem seria o grande número de modelos a serem
>>> ajustados, visto que tenho 11 variáveis explicativas categóricas para duas
>>> variáveis resposta numéricas contínuas. Isso me faria ajustar 22 modelos
>>> que teriam como premissa a independencia entre as variáveis explicativas.
>>>
>>> O que quero dizer é: o quanto a combinação das variáveis categóricas c1
>>> c2 c3 c4 c5 c6... etc (biárias =0 ou 1)  explicam meu x (numérico
>>> contínuo).
>>>
>>> Será que existe um modo de eu ajustar dois modelos? Tipo com a variável
>>> resposta X em função de todas as varíaveis explicativas categóricas e outro
>>> modelo com a variável resposta Y em função de todas as variáveis
>>> explicativas categóricas?
>>>
>>>
>>>
>>>
>>> c1c2c3c4xy
>>> 0111931623
>>> 0100163259
>>> 1010690306
>>> 1010690306
>>>
>>>
>>>
>>> --
>>>
>>>
>>> *Jefferson Ferreira-Ferreira*
>>>
>>> Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
>>>
>>>
>>>
>>> Jefferson.ferreira em mamiraua.org.br
>>>
>>> *Instituto de Desenvolvimento Sustentável Mamirauá*
>>>
>>>
>>> Ministério da Ciência, Tecnologia e Inovação
>>>
>>> Telefone: +55 97 3343-9710
>>>
>>>
>>> *Google Maps* - Mapas deste e-mail:
>>>
>>>
>>> Exibir mapa ampliado
>>> <https://maps.google.com.br/maps?q=-3.355557,-64.731151&ll=-3.355471,-64.731145&spn=0.004632,0.006968&num=1&t=h&z=18>
>>>
>>>
>>>
>>>
>>> *Contatos particulares:*
>>>  *(55) 9615-0100 <%2855%29%209615-0100>*
>>>
>>>
>>>
>>>
>>> Em 18 de setembro de 2014 12:56, Daniel Tiezzi <dtiezzi em usp.br>
>>> escreveu:
>>>
>>> Você precisa fazer uma regressão.
>>>
>>> Segue um modelo
>>>
>>> # Regression analyses, standardized
>>> model1.z <- lm(scale(PE$endurance) ~ scale(PE$age))
>>> summary(model1.z)
>>> confint(model1.z)
>>>
>>> model2.z <- lm(scale(PE$endurance) ~ scale(PE$activeyears))
>>> summary(model2.z)
>>> confint(model2.z)
>>>
>>> model3.z <- lm(scale(PE$endurance) ~ scale(PE$age) +
>>> scale(PE$activeyears))
>>> summary(model3.z)
>>> confint(model3.z)
>>>
>>> # Conduct a model comparison NHST to compare the fit of model2.z to the
>>> fit of model3.z
>>> anova(model2.z, model3.z)
>>>
>>>
>>> Acho que seria assim
>>>
>>>
>>> Daniel
>>>
>>>
>>>
>>>
>>> Daniel Tiezzi, MD, PhD
>>> Professor Associado
>>> Departamento de Ginecologia e Obstetrícia
>>> Setor de Mastologia e Oncologia Ginecológica
>>> Faculdade de Medicina de Ribeirão Preto - USP
>>> Tel.: 16 3602-2488
>>> e-mail: dtiezzi em fmrp.usp.br
>>>
>>>
>>>
>>>
>>>
>>> On Sep 18, 2014, at 12:47 PM, Jefferson Ferreira-Ferreira <
>>> jecogeo em gmail.com> wrote:
>>>
>>>
>>>
>>> Prezados;
>>>
>>> Uma dúvida básica de um iniciante em análises estatísticas.
>>> Tenho uma série de variáveis categóricas binárias e duas variáveis
>>> contínuas. Eu gostaria de saber o quando minhas variáveis categóricas
>>> explicam minhas duas variáveis contínuas. Por exemplo:
>>>
>>> c1c2c3c4xy
>>> 0111931623
>>> 0100163259
>>> 1010690306
>>> 1010690306
>>>
>>>
>>> A pergunta é: o quanto a combinação das variáveis c explicam os valores
>>> de x e y? Ou, qual a correlação entre as variáveis c e as variáveis x e y?
>>>
>>> Podem me dar alguma ideia de análises possíveis?
>>> Obrigado.
>>>
>>>
>>> --
>>>
>>> *Jefferson Ferreira-Ferreira*
>>> Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
>>>
>>>
>>> Jefferson.ferreira em mamiraua.org.br
>>> *Instituto de Desenvolvimento Sustentável Mamirauá*
>>>
>>>
>>> Ministério da Ciência, Tecnologia e Inovação
>>> Telefone: +55 97 3343-9710
>>>
>>>
>>> *Google Maps* - Mapas deste e-mail:
>>>
>>>
>>> Exibir mapa ampliado
>>> <https://maps.google.com.br/maps?q=-3.355557,-64.731151&ll=-3.355471,-64.731145&spn=0.004632,0.006968&num=1&t=h&z=18>
>>>
>>>
>>>
>>> *Contatos particulares:*
>>>  *(55) 9615-0100 <%2855%29%209615-0100>*
>>>   _______________________________________________
>>> R-br mailing list
>>> R-br em listas.c3sl.ufpr.br
>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>> código mínimo reproduzível.
>>>
>>>
>>>
>>> _______________________________________________
>>>  R-br mailing list
>>>  R-br em listas.c3sl.ufpr.br
>>>  https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>  Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>> código mínimo reproduzível.
>>>
>>>
>>>
>>>
>>>  *_______________________________________________*
>>> R-br mailing list
>>> R-br em listas.c3sl.ufpr.br
>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>> código mínimo reproduzível.
>>>
>>>
>>>
>>> _______________________________________________
>>> R-br mailing list
>>> R-br em listas.c3sl.ufpr.br
>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>> código mínimo reproduzível.
>>>
>>
>>
>>
>> --
>> *Vinicius Brito Rocha.*
>> *Estatístico e Atuário *
>> *M.Sc. Engenharia de Produção/PO*
>>
>>
>>
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20141007/3e5393bb/attachment.html>


Mais detalhes sobre a lista de discussão R-br