Transformação Box Cox

Boa tarde pessoal, Tenho uma variável resposta constituída de comprimento de raízes, porém tenho muitos valores zero (a planta não desenvolveu a raiz). Tentei fazer uma transformação de box-cox para tentar normalizar os dados, porém quando fiz: boxcox(MVR ~ FTR, data = dados, lambda = seq(-1, 1, 0.1)) Error in boxcox.default(MVR ~ FTR, data = dados, lambda = seq(-1, 1,0.1)) : response variable must be positive Isso ocorre devido ao excesso de zeros? Alguma sugestão de como modelar os dados?Desde já agradeço Ana Paula

Isso é porque a transformação box cox é para dados positivos, y > 0. O núcleo da tranformação é a função não linear y_t = y^lambda, então y > 0, pois y = 0 e lambda = -1 daria 0^{-1} = 1/0 e isso não existe, certo? Portanto, y > 0. Se os seus dados tem muitos zeros isso já indica que mesmo aplicando uma transformação os problemas com relação ao afastamento de pressupostos permanecerão devido a alta frequência de valores únicos (o zero no caso) que estarão presentes seja qual for a transformação aplicada. O seu dado pode ser pensado com um dado de mistura. Primeiro você tem a probabilidade ou não de enraizar e se enraizar você tem uma distribuição de probabilidades para o comprimento. Ambos (probabilidade e comprimento) podem ser modelados como função dos seus tratamentos. Na minha opinião essa seria uma análise muito interessante com aceite em revistas de ciências agrárias porque esse tipo de situação em comum. À disposição. Walmes.

Ana Paula, Todas as resposta que você obteve são ótimas! Mas, como atuante na área de ciências agrárias, recomendo fortemente analisar conforme sugestão do Walmes: probabilidade de enraizar ou não e a distribuição do enraizamento. Ja orientei algo parecido e da boa publicação. Laia Em 26/11/2013 16:57, "walmes ." <walmeszeviani@gmail.com> escreveu:
Isso é porque a transformação box cox é para dados positivos, y > 0. O núcleo da tranformação é a função não linear y_t = y^lambda, então y > 0, pois y = 0 e lambda = -1 daria 0^{-1} = 1/0 e isso não existe, certo? Portanto, y > 0. Se os seus dados tem muitos zeros isso já indica que mesmo aplicando uma transformação os problemas com relação ao afastamento de pressupostos permanecerão devido a alta frequência de valores únicos (o zero no caso) que estarão presentes seja qual for a transformação aplicada. O seu dado pode ser pensado com um dado de mistura. Primeiro você tem a probabilidade ou não de enraizar e se enraizar você tem uma distribuição de probabilidades para o comprimento. Ambos (probabilidade e comprimento) podem ser modelados como função dos seus tratamentos. Na minha opinião essa seria uma análise muito interessante com aceite em revistas de ciências agrárias porque esse tipo de situação em comum.
À disposição. Walmes.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Ana, a mensagem é clara. Os valores precisam ser positivos >0. Daniel \begin{signature} Daniel Marcelino ☁ dm.silva@umontreal.ca ☎ 1+(514) 343-6111 #3799 Skype: d.marcelino ✎ Canada Research Chair in Electoral Studies Université de Montréal C.P. 6128 succursale Centre-ville Montreal, QC, H3C 3J7 Canada \end{signature} "Small steps towards a much better world" 2013/11/26 ana paula coelho madeira <apcmadeira@hotmail.com>
Boa tarde pessoal,
Tenho uma variável resposta constituída de comprimento de raízes, porém tenho muitos valores zero (a planta não desenvolveu a raiz). Tentei fazer uma transformação de box-cox para tentar normalizar os dados, porém quando fiz:
boxcox(MVR ~ FTR, data = dados, lambda = seq(-1, 1, 0.1))
Error in boxcox.default(MVR ~ FTR, data = dados, lambda = seq(-1, 1,0.1)) : response variable must be positive
Isso ocorre devido ao excesso de zeros? Alguma sugestão de como modelar os dados? Desde já agradeço
Ana Paula
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Se a seus dados tiverem zeros ocasionais, você poderia tentar substitui-los por uma costante de valor pequeno como .5. Daniel \begin{signature} Daniel Marcelino ☁ dm.silva@umontreal.ca ☎ 1+(514) 343-6111 #3799 Skype: d.marcelino ✎ Canada Research Chair in Electoral Studies Université de Montréal C.P. 6128 succursale Centre-ville Montreal, QC, H3C 3J7 Canada \end{signature} "Small steps towards a much better world" 2013/11/27 Daniel Marcelino <dmarcelino@live.com>
Ana, a mensagem é clara. Os valores precisam ser positivos >0.
Daniel
\begin{signature} Daniel Marcelino ☁ dm.silva@umontreal.ca ☎ 1+(514) 343-6111 #3799 Skype: d.marcelino ✎ Canada Research Chair in Electoral Studies Université de Montréal C.P. 6128 succursale Centre-ville Montreal, QC, H3C 3J7 Canada \end{signature}
"Small steps towards a much better world"
2013/11/26 ana paula coelho madeira <apcmadeira@hotmail.com>
Boa tarde pessoal,
Tenho uma variável resposta constituída de comprimento de raízes, porém tenho muitos valores zero (a planta não desenvolveu a raiz). Tentei fazer uma transformação de box-cox para tentar normalizar os dados, porém quando fiz:
boxcox(MVR ~ FTR, data = dados, lambda = seq(-1, 1, 0.1))
Error in boxcox.default(MVR ~ FTR, data = dados, lambda = seq(-1, 1,0.1)) : response variable must be positive
Isso ocorre devido ao excesso de zeros? Alguma sugestão de como modelar os dados? Desde já agradeço
Ana Paula
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Senhores, boa tarde! Para algumas transformações que não admitem valores negativos (e zeros), já via recomendação de adicionar uma constante à todos os dados da série, normalmente 0.5 ou 1.0. Mas realmente não sei se seria válido para esse caso. Ana Paula, talvez o texto que segue possa lhe ser útil: Osborne, Jason (2002). Notes on the use of data transformations. Practical Assessment, Research & Evaluation, 8(6). Retrieved November 27, 2013 from http://PAREonline.net/getvn.asp?v=8&n=6 . Éder Comunello <c <comunello.eder@gmail.com>omunello.eder@gmail.com> Dourados, MS - [22 16.5'S, 54 49'W]

Resíduos com variância não constante no nível 2. Oi pessoal, td bem? Estou com um problema e gostaria solicitar ajuda a vocês, utilizei o seguinte modelo de @ Nível Hierárquico: fm <- lmer(lp ~ ise+ mise + (1+mise|cod) + (0+ise | cod), data=base, REML=F) resN2<- ranef(fm)$cod só que quando faz o gráfico dos valores estimados do nível 2 VS os resíduos do nível 2, observe que existem uma correlação muito forte entre essas variáveis.... isto leva a que meus resíduos não tenham variância constante...!!! Alguma ajuda ou sugestão que posso fazer para corrigir este erro?? Obrigado pela atenção Julio

Forneça um CMR. À disposição. Walmes.
participantes (6)
-
ana paula coelho madeira
-
Daniel Marcelino
-
Julio Racchumi. R.
-
Marcelo Laia
-
walmes .
-
Éder Comunello