[R-br] Variáveis contínuas explicando Variáveis categóricas

Jose Claudio Faria joseclaudio.faria em gmail.com
Terça Outubro 7 17:51:29 BRT 2014


Jefferson,

Seria interessante dar uma investigada nas possibilidades fornecidas pelas
árvores classificação,
como Y é categórico em seu caso: Y = f(x1, x2, ..., xn),
sendo predito por x1, x2, ..., xn em escalas intervalares ou proporcionais.

Existe a técnica para o caso Y ser univariado ou multivariado.

Uma referência no Brasil é o Cesar Augusto Taconeli da UFPR (
cetaconeli_at_gmail.com).

Entre em contato com ele pois embora existam pacotes no R que dão suporte a
técnica de análise, ela não é muito fácil.

Na ausência de melhores informações, vai aqui um link do curso que o César
deu aqui na UESC em junho de 2013:
http://nbcgib.uesc.br/lec/llec/cursos/arv-cla-regressao

Os pressupostos da técnica são bem brandos.

Ab,



///\\\///\\\///\\\///\\\///\\\///\\\///\\\///\\\
Jose Claudio Faria
Estatistica
UESC/DCET/Brasil
joseclaudio.faria at gmail.com
Telefones:
55(73)3680.5545 - UESC
55(73)9966.9100 - VIVO
55(73)9100.7351 - TIM
55(73)8817.6159 - OI
///\\\///\\\///\\\///\\\///\\\///\\\///\\\///\\\

2014-09-18 19:41 GMT-03:00 Vinicius Brito Rocha <viniciusbritor em gmail.com>:

> Vi nos seus dados que vc está tratando seus dados num modelo do tipo.
> existe, não existe. 1 ou 0. E sua variável resposta é alguma métrica, sei
> lá tipo consumo de energia...
> minha sugestão é que vc use algum tipo de classe, ou categoria e agregue
> seus dados pela média ou quem sabe soma, com classes independentes.
> Para evitar problema de homocedasticidade.
> O modelo de regressão linear de fato supõe que seus dados sejam valores
> médios de algum critério, para determinadas observações.
> Isso provavelmente vai te ajudar bastante. pode ser que não seja possível
> em função da sua regra de negócio.
>
> espero ter ajudado.
>
> Boa sorte.
>
> abs
>
> vinicius
>
> Em 18 de setembro de 2014 18:52, Leonardo Ferreira Fontenelle <
> leonardof em leonardof.med.br> escreveu:
>
>  Se você só estiver interessado por elas em conjunto, pode simplesmente
>> comparar (com anova) um modelo com todas as C e sem nenhuma C (e deixando o
>> resto igual).
>>
>> Leonardo Ferreira Fontenelle <http://lattes.cnpq.br/9234772336296638>
>>
>>
>> Em Qui 18 set. 2014, às 13:33, Jefferson Ferreira-Ferreira escreveu:
>>
>>
>> Professor daniel,
>> Obrigado pela resposta. Ainda não testei essa alternativa. Mas a
>> desvantagem dessa abordagem seria o grande número de modelos a serem
>> ajustados, visto que tenho 11 variáveis explicativas categóricas para duas
>> variáveis resposta numéricas contínuas. Isso me faria ajustar 22 modelos
>> que teriam como premissa a independencia entre as variáveis explicativas.
>>
>> O que quero dizer é: o quanto a combinação das variáveis categóricas c1
>> c2 c3 c4 c5 c6... etc (biárias =0 ou 1)  explicam meu x (numérico
>> contínuo).
>>
>> Será que existe um modo de eu ajustar dois modelos? Tipo com a variável
>> resposta X em função de todas as varíaveis explicativas categóricas e outro
>> modelo com a variável resposta Y em função de todas as variáveis
>> explicativas categóricas?
>>
>>
>>
>>
>> c1c2c3c4xy
>> 0111931623
>> 0100163259
>> 1010690306
>> 1010690306
>>
>>
>>
>> --
>>
>>
>> *Jefferson Ferreira-Ferreira*
>>
>> Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
>>
>>
>>
>> Jefferson.ferreira em mamiraua.org.br
>>
>> *Instituto de Desenvolvimento Sustentável Mamirauá*
>>
>>
>> Ministério da Ciência, Tecnologia e Inovação
>>
>> Telefone: +55 97 3343-9710
>>
>>
>> *Google Maps* - Mapas deste e-mail:
>>
>>
>> Exibir mapa ampliado
>> <https://maps.google.com.br/maps?q=-3.355557,-64.731151&ll=-3.355471,-64.731145&spn=0.004632,0.006968&num=1&t=h&z=18>
>>
>>
>>
>>
>> *Contatos particulares:*
>>  *(55) 9615-0100 <%2855%29%209615-0100>*
>>
>>
>>
>>
>> Em 18 de setembro de 2014 12:56, Daniel Tiezzi <dtiezzi em usp.br> escreveu:
>>
>> Você precisa fazer uma regressão.
>>
>> Segue um modelo
>>
>> # Regression analyses, standardized
>> model1.z <- lm(scale(PE$endurance) ~ scale(PE$age))
>> summary(model1.z)
>> confint(model1.z)
>>
>> model2.z <- lm(scale(PE$endurance) ~ scale(PE$activeyears))
>> summary(model2.z)
>> confint(model2.z)
>>
>> model3.z <- lm(scale(PE$endurance) ~ scale(PE$age) +
>> scale(PE$activeyears))
>> summary(model3.z)
>> confint(model3.z)
>>
>> # Conduct a model comparison NHST to compare the fit of model2.z to the
>> fit of model3.z
>> anova(model2.z, model3.z)
>>
>>
>> Acho que seria assim
>>
>>
>> Daniel
>>
>>
>>
>>
>> Daniel Tiezzi, MD, PhD
>> Professor Associado
>> Departamento de Ginecologia e Obstetrícia
>> Setor de Mastologia e Oncologia Ginecológica
>> Faculdade de Medicina de Ribeirão Preto - USP
>> Tel.: 16 3602-2488
>> e-mail: dtiezzi em fmrp.usp.br
>>
>>
>>
>>
>>
>> On Sep 18, 2014, at 12:47 PM, Jefferson Ferreira-Ferreira <
>> jecogeo em gmail.com> wrote:
>>
>>
>>
>> Prezados;
>>
>> Uma dúvida básica de um iniciante em análises estatísticas.
>> Tenho uma série de variáveis categóricas binárias e duas variáveis
>> contínuas. Eu gostaria de saber o quando minhas variáveis categóricas
>> explicam minhas duas variáveis contínuas. Por exemplo:
>>
>> c1c2c3c4xy
>> 0111931623
>> 0100163259
>> 1010690306
>> 1010690306
>>
>>
>> A pergunta é: o quanto a combinação das variáveis c explicam os valores
>> de x e y? Ou, qual a correlação entre as variáveis c e as variáveis x e y?
>>
>> Podem me dar alguma ideia de análises possíveis?
>> Obrigado.
>>
>>
>> --
>>
>> *Jefferson Ferreira-Ferreira*
>> Geógrafo – GEOPROCESSAMENTO IDSM | Coordenadoria de TI
>>
>>
>> Jefferson.ferreira em mamiraua.org.br
>> *Instituto de Desenvolvimento Sustentável Mamirauá*
>>
>>
>> Ministério da Ciência, Tecnologia e Inovação
>> Telefone: +55 97 3343-9710
>>
>>
>> *Google Maps* - Mapas deste e-mail:
>>
>>
>> Exibir mapa ampliado
>> <https://maps.google.com.br/maps?q=-3.355557,-64.731151&ll=-3.355471,-64.731145&spn=0.004632,0.006968&num=1&t=h&z=18>
>>
>>
>>
>> *Contatos particulares:*
>>  *(55) 9615-0100 <%2855%29%209615-0100>*
>>   _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>>
>>
>>
>> _______________________________________________
>>  R-br mailing list
>>  R-br em listas.c3sl.ufpr.br
>>  https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>  Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>>
>>
>>
>>
>>  *_______________________________________________*
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>>
>>
>>
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>>
>
>
>
> --
> *Vinicius Brito Rocha.*
> *Estatístico e Atuário *
> *M.Sc. Engenharia de Produção/PO*
>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20141007/867844bc/attachment.html>


Mais detalhes sobre a lista de discussão R-br