regressão linear polinomial: classificar em simples ou múltipla (dúvida conceitual)

Caros membros, Vou usar da lista para possivelmente redimir uma dúvida conceitual, pois não vejo melhor local para fazê-lo, dado ao perfil dos usuários. Muitos autores classificam os modelos de regressão linear assim: 1- Simples (y = Bo + B1X) 2- Polinomial (y = Bo + B1X + B2X^2 + + B3X^3...) 3- Múltipla (y = Bo + B1X + B2Y + B3XY...) Outros (dando ênfase na variável preditora) classificam as polinomiais (dependentes de apenas uma variável fixa ou aleatória) como simples e usam r² (minúsculo) para o coef. de determinação, independente do grau do polinômio. Já outros (dando ênfase no modelo) classificam as polinomiais (dependentes de apenas uma variável fixa ou aleatória) como múltipla, e usam R² (maiúsculo) para o coef. de determinação, desde que tenha mais de um grau e independente do número de graus do polinômio. Gostaria muito da opinião do pessoal mais especializado sobre esse assunto! Não seria uma caso como o da "a cerveja que desce redondo"? Ou seja se a ênfase está no substantivo (cerveja) deveria ser: desce redonda. Outros pensam que "redondo" é um advérbio e se refere ao verbo "descer", portanto, que está correta a concordância no masculino. http://salp-pmf.blogspot.com.br/2012/06/cerveja-que-desce-redondo-ou-redonda... Ab, -- ///\\\///\\\///\\\///\\\///\\\///\\\///\\\///\\\ Jose Claudio Faria Estatistica UESC/DCET/Brasil joseclaudio.faria at gmail.com Telefones: 55(73)3680.5545 - UESC 55(73)9100.7351 - TIM 55(73)8817.6159 - OI ///\\\///\\\///\\\///\\\///\\\///\\\///\\\///\\\

Na minha humilde opinião, regressão linear simples remete à f(x) = b_0+b_1*x. Todo preditor linear com mais termos do que esse do lado direito seria regressão linear múltipla. Um caso particular é quando os termos a mais são potências naturais da mesma variável x, ou seja, o polinômio {x⁰, x¹, x², x³, ..., x^n}. Quanto à representação do R², se r² ou R², eu nunca prestei muita atenção. Acredito que r² (minúsculo) seja acidental nas publicações nacionais pois em livros em inglês, artigos internacionais, e saídas dos aplicativos que conheço soltam R². À disposição. Walmes.

Na Universidade Federal de Viçosa - UFV (onde iniciei meus sentimentos de amor e ódio pela estatística) o pensamento predominante (na verdade consensual) era considerar os modelos polinomiais como um caso particular das múltiplas. Assim como o Walmes o fez. Em minha dissertação de mestrado trabalhei com regressão linear (séries de Fourier) para estimar umidade e temperatura do solo amostrado quinzenalmente por um período de 6 meses. Ou seja, Umidade ou Temperatura em função do tempo (apenas uma variável preditora). Alguns modelos chegavam a ter 9 parâmetros ou mais para serem estimados. Acho bem difícil classificar esses modelos como regressão linear simples! Na UFV era obrigatório nas dissertações, teses e publicações o uso do R2 (maiúsculo) nos casos das polinomiais (grau >=2) . O que acho certo pois no caso da regressão linear simples existe a relação funcional: r = sqrt(r^2) Ou seja, a raiz quadrada do coef. de determinação é o próprio coeficiente de correlação (r), e para este existe consenso de usar sempre o r (minúsculo). O motivo da minha consulta é que estou finalizando meu semestre letivo para o curso de Agronomia com esse assunto. Ao mostrar o material didático preparado em R a um professor da área surgiu a dúvida: ele pensa diferente e classifica as polinomiais na família das simples. Como não encontrei nada na literatura que disponho no momento, e no curto tempo disponível, apelei para a lista. Obrigado por se manifestar Walmes, gostaria de conhecer mais opiniões (pois ainda estou em sala de aula). Ab, 2013/12/11 walmes . <walmeszeviani@gmail.com>:
Na minha humilde opinião, regressão linear simples remete à f(x) = b_0+b_1*x. Todo preditor linear com mais termos do que esse do lado direito seria regressão linear múltipla. Um caso particular é quando os termos a mais são potências naturais da mesma variável x, ou seja, o polinômio {x⁰, x¹, x², x³, ..., x^n}. Quanto à representação do R², se r² ou R², eu nunca prestei muita atenção. Acredito que r² (minúsculo) seja acidental nas publicações nacionais pois em livros em inglês, artigos internacionais, e saídas dos aplicativos que conheço soltam R².
À disposição. Walmes.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- ///\\\///\\\///\\\///\\\///\\\///\\\///\\\///\\\ Jose Claudio Faria Estatistica UESC/DCET/Brasil joseclaudio.faria at gmail.com Telefones: 55(73)3680.5545 - UESC 55(73)9100.7351 - TIM 55(73)8817.6159 - OI ///\\\///\\\///\\\///\\\///\\\///\\\///\\\///\\\

Prezado Faria, Essas discussões são bem úteis. Eu acredito que repensar o simples é muito útil, ou melhor, repensar aquilo que é considerado trivial é muito útil. Existe ainda muito equívoco nesses conceitos fundamentais. Bem, seja y a resposta e x a explicativa. Do meu ponto de vista, o fato da correlação ao quadrado entre y e x ser igual ao R² é decorrente de um resultado mais geral, de o R² ser o quadrado da correlação entre valor ajustado (f) e observado (y). Na regressão linear simples, em particular, o predito é uma função linear de uma única variável (x), f = b0+b1*x, e sabemos que a correlação entre duas variáveis não se altera para transformações lineares aplicadas nestas. Seja qual for o modelo (gaussiano fixo) o R² é o quadrado da correlação entre predito e observado. Este é inclusive o que uso para calcular R² em modelos não lineares (que não tem R² na saída default do R) e é o que tem sido usado na literatura para modelos mistos e lineares generalizados. No entanto, nesses modelos o R² não interpretado da mesma forma geométrica que é em modelo lineares gaussianos, porque não representa de fato a razão entre comprimento de vetores no espaço. Walmes.

A distinção entre simples e múltipla, creio, é puramente didática. Como falaram, a simples pode ser visualizada facilmente como uma reta e alguns resultados (como o R2) são mais fáceis de serem derivados. Já na múltipla temos mais dimensões (mais de um preditor) e a intuição fica mais complicada e a derivação de resultados tbm. Em livros de econometria a distinção é essa, mas é puramente didática. Se seus alunos tiverem bom conhecimento de álgebra linear, pode ser mais fácil entrar direto na múltipla. Enfim é uma questão didática. abçs Manoel 2013/12/11 Elias T Krainski <eliaskrainski@yahoo.com.br>
Existe ainda muito equívoco nesses conceitos fundamentais.
Ja vi considerarem 'regressao multipla' como 'regressao multivariada'...
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Manoel Galdino https://sites.google.com/site/galdinomcz/

Se seus alunos tiverem bom conhecimento de álgebra linear, pode ser mais fácil entrar direto na múltipla. Enfim é uma questão didática.
Plenamente de acordo. O metodo dos minimos quadrados tem quase 220 anos. GLM como familia mais de 30 anos. Li num livro de matematica que atualmente nao faz sentido fazer um curso de integral de Riemann e outro de integral de Lebesgue. Ninguem tem tempo para isso hoje em dia. Assim, na estatistica acho que DEVEMOS INICIAR com GLM. Na meu bacharelado fiz um semestre de correlacao, um de LM e outro de GLM... Nessa perda de tempo que eu vivenciei, a minha geracao JA PERDEU para o pessoal de Machine Learning.

Agradeço a todos as opiniões emitidas assim como a coragem de as emitir. (se calar em assuntois polêmicos é sempre mais fácil). No meu ponto de vista a discussão foi no mínimo salutar! Quanto ao ensino de regressão, dado ao público de graduação (Agronomia), inicio a parte conceitual com a abordagem de ajustamento via transladação do eixo da variável de resposta para a média da proditora (baseado em Wonnacott&Wonnacott). Considero ser o método mais didático para introdução ao estudo de regressão linear simples pois pressupõe apenas conhecimento de derivada parcial. A solução do sistema linear fica extremamente facilitada e compreensível com esta abordagem conceitual. Posteriormente generalizo para a solução de mínimo quadrado via álgebra de matrizes e uso o R como ferramenta didática. Quem tiver interesse dê uma olhada neses links: - http://nbcgib.uesc.br/lec/professores/jcfaria/disciplinas/cet076 - http://nbcgib.uesc.br/lec/download/faria/cet076/r/scripts/08_regressao_linea... A apostila é a de CET076. Ab, 2013/12/11 Elias T Krainski <eliaskrainski@yahoo.com.br>:
Se seus alunos tiverem bom conhecimento de álgebra linear, pode ser mais fácil entrar direto na múltipla. Enfim é uma questão didática.
Plenamente de acordo. O metodo dos minimos quadrados tem quase 220 anos. GLM como familia mais de 30 anos. Li num livro de matematica que atualmente nao faz sentido fazer um curso de integral de Riemann e outro de integral de Lebesgue. Ninguem tem tempo para isso hoje em dia. Assim, na estatistica acho que DEVEMOS INICIAR com GLM. Na meu bacharelado fiz um semestre de correlacao, um de LM e outro de GLM... Nessa perda de tempo que eu vivenciei, a minha geracao JA PERDEU para o pessoal de Machine Learning.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- ///\\\///\\\///\\\///\\\///\\\///\\\///\\\///\\\ Jose Claudio Faria Estatistica UESC/DCET/Brasil joseclaudio.faria at gmail.com Telefones: 55(73)3680.5545 - UESC 55(73)9100.7351 - TIM 55(73)8817.6159 - OI ///\\\///\\\///\\\///\\\///\\\///\\\///\\\///\\\

Boa tarde, José. Eu concordo com o Walmes. Regressão linear *simples *me remete ao ajuste de reta. E apenas nesse caso específico o coeficiente de determinação é o quadrado do coeficiente de correlação. Portanto, acho que o coeficiente de determinação deva ser escrito R², sempre. Já quanto a classificação de polinomial e múltipla. Eu não acho que eles sejam excludentes. Uma regressão linear simples (reta) não deixa de ser uma regressão polinomial, não é verdade? É um polinômio de ordem 1. hehehe E se vc tem 2 ou mais parâmetros (sejam x e y ou x e x^2) a regressão é múltipla (múltiplos parâmetros). Portanto y = x + x^2 + x^3, na minha opinião, é uma regressão polinomial *e* múltipla. Mas é só minha opinião, sem nenhuma referência no momento! Abraços, Lucas Petri Damiani 2013/12/11 Jose Claudio Faria <joseclaudio.faria@gmail.com>
Na Universidade Federal de Viçosa - UFV (onde iniciei meus sentimentos de amor e ódio pela estatística) o pensamento predominante (na verdade consensual) era considerar os modelos polinomiais como um caso particular das múltiplas. Assim como o Walmes o fez.
Em minha dissertação de mestrado trabalhei com regressão linear (séries de Fourier) para estimar umidade e temperatura do solo amostrado quinzenalmente por um período de 6 meses. Ou seja, Umidade ou Temperatura em função do tempo (apenas uma variável preditora). Alguns modelos chegavam a ter 9 parâmetros ou mais para serem estimados. Acho bem difícil classificar esses modelos como regressão linear simples!
Na UFV era obrigatório nas dissertações, teses e publicações o uso do R2 (maiúsculo) nos casos das polinomiais (grau >=2) . O que acho certo pois no caso da regressão linear simples existe a relação funcional:
r = sqrt(r^2)
Ou seja, a raiz quadrada do coef. de determinação é o próprio coeficiente de correlação (r), e para este existe consenso de usar sempre o r (minúsculo).
O motivo da minha consulta é que estou finalizando meu semestre letivo para o curso de Agronomia com esse assunto. Ao mostrar o material didático preparado em R a um professor da área surgiu a dúvida: ele pensa diferente e classifica as polinomiais na família das simples.
Como não encontrei nada na literatura que disponho no momento, e no curto tempo disponível, apelei para a lista.
Obrigado por se manifestar Walmes, gostaria de conhecer mais opiniões (pois ainda estou em sala de aula).
Ab,
2013/12/11 walmes . <walmeszeviani@gmail.com>:
Na minha humilde opinião, regressão linear simples remete à f(x) = b_0+b_1*x. Todo preditor linear com mais termos do que esse do lado direito seria regressão linear múltipla. Um caso particular é quando os termos a mais são potências naturais da mesma variável x, ou seja, o polinômio {x⁰, x¹, x², x³, ..., x^n}. Quanto à representação do R², se r² ou R², eu nunca prestei muita atenção. Acredito que r² (minúsculo) seja acidental nas publicações nacionais pois em livros em inglês, artigos internacionais, e saídas dos aplicativos que conheço soltam R².
À disposição. Walmes.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- ///\\\///\\\///\\\///\\\///\\\///\\\///\\\///\\\ Jose Claudio Faria Estatistica UESC/DCET/Brasil joseclaudio.faria at gmail.com Telefones: 55(73)3680.5545 - UESC 55(73)9100.7351 - TIM 55(73)8817.6159 - OI ///\\\///\\\///\\\///\\\///\\\///\\\///\\\///\\\ _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
participantes (5)
-
Elias T Krainski
-
Jose Claudio Faria
-
Lucas Petri Damiani
-
Manoel Galdino
-
walmes .