[R-br] Variáveis contínuas explicando Variáveis categóricas

Vinicius Brito Rocha viniciusbritor em gmail.com
Quinta Setembro 18 19:41:23 BRT 2014


Vi nos seus dados que vc está tratando seus dados num modelo do tipo.
existe, não existe. 1 ou 0. E sua variável resposta é alguma métrica, sei
lá tipo consumo de energia...
minha sugestão é que vc use algum tipo de classe, ou categoria e agregue
seus dados pela média ou quem sabe soma, com classes independentes.
Para evitar problema de homocedasticidade.
O modelo de regressão linear de fato supõe que seus dados sejam valores
médios de algum critério, para determinadas observações.
Isso provavelmente vai te ajudar bastante. pode ser que não seja possível
em função da sua regra de negócio.

espero ter ajudado.

Boa sorte.

abs

vinicius

Em 18 de setembro de 2014 18:52, Leonardo Ferreira Fontenelle <
leonardof em leonardof.med.br> escreveu:

>  Se você só estiver interessado por elas em conjunto, pode simplesmente
> comparar (com anova) um modelo com todas as C e sem nenhuma C (e deixando o
> resto igual).
>
> Leonardo Ferreira Fontenelle <http://lattes.cnpq.br/9234772336296638>
>
>
> Em Qui 18 set. 2014, às 13:33, Jefferson Ferreira-Ferreira escreveu:
>
>
> Professor daniel,
> Obrigado pela resposta. Ainda não testei essa alternativa. Mas a
> desvantagem dessa abordagem seria o grande número de modelos a serem
> ajustados, visto que tenho 11 variáveis explicativas categóricas para duas
> variáveis resposta numéricas contínuas. Isso me faria ajustar 22 modelos
> que teriam como premissa a independencia entre as variáveis explicativas.
>
> O que quero dizer é: o quanto a combinação das variáveis categóricas c1 c2
> c3 c4 c5 c6... etc (biárias =0 ou 1)  explicam meu x (numérico contínuo).
>
> Será que existe um modo de eu ajustar dois modelos? Tipo com a variável
> resposta X em função de todas as varíaveis explicativas categóricas e outro
> modelo com a variável resposta Y em função de todas as variáveis
> explicativas categóricas?
>
>
>
>
> c1c2c3c4xy
> 0111931623
> 0100163259
> 1010690306
> 1010690306
>
>
>
> --
>
>
> *Jefferson Ferreira-Ferreira*
>
> Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
>
>
>
> Jefferson.ferreira em mamiraua.org.br
>
> *Instituto de Desenvolvimento Sustentável Mamirauá*
>
>
> Ministério da Ciência, Tecnologia e Inovação
>
> Telefone: +55 97 3343-9710
>
>
> *Google Maps* - Mapas deste e-mail:
>
>
> Exibir mapa ampliado
> <https://maps.google.com.br/maps?q=-3.355557,-64.731151&ll=-3.355471,-64.731145&spn=0.004632,0.006968&num=1&t=h&z=18>
>
>
>
>
> *Contatos particulares:*
>  *(55) 9615-0100 <%2855%29%209615-0100>*
>
>
>
>
> Em 18 de setembro de 2014 12:56, Daniel Tiezzi <dtiezzi em usp.br> escreveu:
>
> Você precisa fazer uma regressão.
>
> Segue um modelo
>
> # Regression analyses, standardized
> model1.z <- lm(scale(PE$endurance) ~ scale(PE$age))
> summary(model1.z)
> confint(model1.z)
>
> model2.z <- lm(scale(PE$endurance) ~ scale(PE$activeyears))
> summary(model2.z)
> confint(model2.z)
>
> model3.z <- lm(scale(PE$endurance) ~ scale(PE$age) + scale(PE$activeyears))
> summary(model3.z)
> confint(model3.z)
>
> # Conduct a model comparison NHST to compare the fit of model2.z to the
> fit of model3.z
> anova(model2.z, model3.z)
>
>
> Acho que seria assim
>
>
> Daniel
>
>
>
>
> Daniel Tiezzi, MD, PhD
> Professor Associado
> Departamento de Ginecologia e Obstetrícia
> Setor de Mastologia e Oncologia Ginecológica
> Faculdade de Medicina de Ribeirão Preto - USP
> Tel.: 16 3602-2488
> e-mail: dtiezzi em fmrp.usp.br
>
>
>
>
>
> On Sep 18, 2014, at 12:47 PM, Jefferson Ferreira-Ferreira <
> jecogeo em gmail.com> wrote:
>
>
>
> Prezados;
>
> Uma dúvida básica de um iniciante em análises estatísticas.
> Tenho uma série de variáveis categóricas binárias e duas variáveis
> contínuas. Eu gostaria de saber o quando minhas variáveis categóricas
> explicam minhas duas variáveis contínuas. Por exemplo:
>
> c1c2c3c4xy
> 0111931623
> 0100163259
> 1010690306
> 1010690306
>
>
> A pergunta é: o quanto a combinação das variáveis c explicam os valores de
> x e y? Ou, qual a correlação entre as variáveis c e as variáveis x e y?
>
> Podem me dar alguma ideia de análises possíveis?
> Obrigado.
>
>
> --
>
> *Jefferson Ferreira-Ferreira*
> Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
>
>
> Jefferson.ferreira em mamiraua.org.br
> *Instituto de Desenvolvimento Sustentável Mamirauá*
>
>
> Ministério da Ciência, Tecnologia e Inovação
> Telefone: +55 97 3343-9710
>
>
> *Google Maps* - Mapas deste e-mail:
>
>
> Exibir mapa ampliado
> <https://maps.google.com.br/maps?q=-3.355557,-64.731151&ll=-3.355471,-64.731145&spn=0.004632,0.006968&num=1&t=h&z=18>
>
>
>
> *Contatos particulares:*
>  *(55) 9615-0100 <%2855%29%209615-0100>*
>   _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
>
>
> _______________________________________________
>  R-br mailing list
>  R-br em listas.c3sl.ufpr.br
>  https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>  Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
>
>
>
>  *_______________________________________________*
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>



-- 
*Vinicius Brito Rocha.*
*Estatístico e Atuário *
*M.Sc. Engenharia de Produção/PO*
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20140918/d8a22417/attachment-0001.html>


Mais detalhes sobre a lista de discussão R-br