Vi nos seus dados que vc está tratando seus dados num modelo do tipo. existe, não existe. 1 ou 0. E sua variável resposta é alguma métrica, sei lá tipo consumo de energia...
minha sugestão é que vc use algum tipo de classe, ou categoria e agregue seus dados pela média ou quem sabe soma, com classes independentes.
Para evitar problema de homocedasticidade.
O modelo de regressão linear de fato supõe que seus dados sejam valores médios de algum critério, para determinadas observações.
Isso provavelmente vai te ajudar bastante. pode ser que não seja possível em função da sua regra de negócio.

espero ter ajudado.

Boa sorte.

abs

vinicius

Em 18 de setembro de 2014 18:52, Leonardo Ferreira Fontenelle <leonardof@leonardof.med.br> escreveu:
Se você só estiver interessado por elas em conjunto, pode simplesmente comparar (com anova) um modelo com todas as C e sem nenhuma C (e deixando o resto igual).
 
 
 
Em Qui 18 set. 2014, às 13:33, Jefferson Ferreira-Ferreira escreveu:
 
Professor daniel,
Obrigado pela resposta. Ainda não testei essa alternativa. Mas a desvantagem dessa abordagem seria o grande número de modelos a serem ajustados, visto que tenho 11 variáveis explicativas categóricas para duas variáveis resposta numéricas contínuas. Isso me faria ajustar 22 modelos que teriam como premissa a independencia entre as variáveis explicativas.
 
O que quero dizer é: o quanto a combinação das variáveis categóricas c1 c2 c3 c4 c5 c6... etc (biárias =0 ou 1)  explicam meu x (numérico contínuo).  
 
Será que existe um modo de eu ajustar dois modelos? Tipo com a variável resposta X em função de todas as varíaveis explicativas categóricas e outro modelo com a variável resposta Y em função de todas as variáveis explicativas categóricas?
 
 
 
c1c2c3c4xy
0111931623
0100163259
1010690306
1010690306
 
 
-- 


Jefferson Ferreira-Ferreira

Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI



Jefferson.ferreira@mamiraua.org.br

Instituto de Desenvolvimento Sustentável Mamirauá


Ministério da Ciência, Tecnologia e Inovação

Telefone: +55 97 3343-9710


Google Maps - Mapas deste e-mail:


Exibir mapa ampliado




Contatos particulares:
 
 
 
 
Em 18 de setembro de 2014 12:56, Daniel Tiezzi <dtiezzi@usp.br> escreveu:
Você precisa fazer uma regressão.
 
Segue um modelo
 
# Regression analyses, standardized
model1.z <- lm(scale(PE$endurance) ~ scale(PE$age))
summary(model1.z)
confint(model1.z)
 
model2.z <- lm(scale(PE$endurance) ~ scale(PE$activeyears))
summary(model2.z)
confint(model2.z)
 
model3.z <- lm(scale(PE$endurance) ~ scale(PE$age) + scale(PE$activeyears))
summary(model3.z)
confint(model3.z)
 
# Conduct a model comparison NHST to compare the fit of model2.z to the fit of model3.z
anova(model2.z, model3.z)
 
 
Acho que seria assim
 
 
Daniel
 
 
 
 
Daniel Tiezzi, MD, PhD
Professor Associado
Departamento de Ginecologia e Obstetrícia
Setor de Mastologia e Oncologia Ginecológica
Faculdade de Medicina de Ribeirão Preto - USP
 
 
 
 
 
On Sep 18, 2014, at 12:47 PM, Jefferson Ferreira-Ferreira <jecogeo@gmail.com> wrote:
 
 
Prezados;
 
Uma dúvida básica de um iniciante em análises estatísticas.
Tenho uma série de variáveis categóricas binárias e duas variáveis contínuas. Eu gostaria de saber o quando minhas variáveis categóricas explicam minhas duas variáveis contínuas. Por exemplo:
 
c1c2c3c4xy
0111931623
0100163259
1010690306
1010690306
 
 
A pergunta é: o quanto a combinação das variáveis c explicam os valores de x e y? Ou, qual a correlação entre as variáveis c e as variáveis x e y?
 
Podem me dar alguma ideia de análises possíveis?
Obrigado.
 
 
--
 
Jefferson Ferreira-Ferreira
Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI


Instituto de Desenvolvimento Sustentável Mamirauá


Ministério da Ciência, Tecnologia e Inovação


Google Maps - Mapas deste e-mail:


 
 
 
Contatos particulares:
_______________________________________________
R-br mailing list
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
 
 
_______________________________________________
R-br mailing list
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
 
 
 
_______________________________________________
R-br mailing list
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
 

_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.



--
Vinicius Brito Rocha.
Estatístico e Atuário 
M.Sc. Engenharia de Produção/PO