Transformação Box-Cox

Boa tarde pessoal, Tenho uma variável resposta constituída de medidas de peso, porém alguns valores são representados por zeros, estava tentando fazer uma transformação de box-cox para tentar normalizar os dados, porém quando fiz: boxcox(peso ~ trat, data = dados, plotit = T) Erro em boxcox.default(peso ~ trat, data = dados, plotit = T) : response variable must be positive Apareceu o seguinte erro, então gostaria de saber se são os zeros que estão causando o erro? Obrigado, Alexandre dos Santos Engenheiro Florestal, MSc. Universidade Federal de Lavras Departamento de Entomologia Laboratório de Entomologia Florestal Caixa Postal 3037 37200-000 - Lavras/MG Fone: +55 (35) 3829-5122

Sim. São os zeros. Reposta deve ser positiva (>0). Se sua variável é contínua, porque ocorrem valores zero com frequência elevada? À disposição. Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================

Mais que isso, o que seriam Pesos zero? Em 21 de dezembro de 2011 15:56, Walmes Zeviani <walmeszeviani@gmail.com>escreveu:
Sim. São os zeros. Reposta deve ser positiva (>0). Se sua variável é contínua, porque ocorrem valores zero com frequência elevada?
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Fernando A.B. Colugnati

Você pode usar uma Normal inflacionada de zeros, usando o mesmo raciocínio da Poisson inflacionada. Porém, como essa contínua é positiva, você pode usar distribuição de suporte nos reais positivos, como a gama, lognormal, weibull, e inflacionar de zeros. Uma vez que a função de verossimilhança pode ser escrita, a tarefa de estimação pode ser feita com a optim(). Mas fezes=0 é porque não houve insetos na unidade experimental? Esse modelo iria dar duas coisas: qual a probabilidade de ter fezes? e se tem, qual a distribuição? Gama inflacionada de zeros já existe na literatura. À disposição. Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================

Walmes, Tinha pensado na Gamma inflacionada de zeros, porém não estou trabalhando com os dados temporais de maneira acumulada, mais estou trabalhando com os dados observados em cada avaliação no tempo o que acho que descaracterizaria o uso da Gamma. Em relaçao a natureza dos dados, temos que quando há um ataque intenso de lagartas em uma floresta, literalmente chove fezes, então algumas metodologias antigas estabeleceram verificar a eficiência de alguma medida de controle baseado no peso das fezes, ou seja quanto mais efetivo o método, menor a quantidade de fezes ao longo do tempo. Porém, esta metodologia foi estabelecida em uma época na ciência entomológica em que fazer teste de normalidade e homocedasticidade era um luxo, por isso estou sofrendo tanto com esses dados, Obrigado pelas valiosas sugestões, Alexandre dos Santos Engenheiro Florestal, MSc. Universidade Federal de Lavras Departamento de Entomologia Laboratório de Entomologia Florestal Caixa Postal 3037 37200-000 - Lavras/MG Fone: +55 (35) 3829-5122 ________________________________ De: Walmes Zeviani <walmeszeviani@gmail.com> Para: r-br@listas.c3sl.ufpr.br Enviadas: Quarta-feira, 21 de Dezembro de 2011 16:43 Assunto: Re: [R-br] Transformação Box-Cox Você pode usar uma Normal inflacionada de zeros, usando o mesmo raciocínio da Poisson inflacionada. Porém, como essa contínua é positiva, você pode usar distribuição de suporte nos reais positivos, como a gama, lognormal, weibull, e inflacionar de zeros. Uma vez que a função de verossimilhança pode ser escrita, a tarefa de estimação pode ser feita com a optim(). Mas fezes=0 é porque não houve insetos na unidade experimental? Esse modelo iria dar duas coisas: qual a probabilidade de ter fezes? e se tem, qual a distribuição? Gama inflacionada de zeros já existe na literatura. À disposição. Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ========================================================================== _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Os dados não precisam ser valores acumulados para usar a gama inflacionada de zeros. À disposição. Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================

On 12/21/2011 03:06 PM, Alexandre Santos wrote:
Boa tarde pessoal,
Tenho uma variável resposta constituída de medidas de peso, porém alguns valores são representados por zeros, estava tentando fazer uma transformação de box-cox para tentar normalizar os dados, porém quando fiz:
boxcox(peso ~ trat, data = dados, plotit = T) Erro em boxcox.default(peso ~ trat, data = dados, plotit = T) : response variable must be positive
Apareceu o seguinte erro, então gostaria de saber se são os zeros que estão causando o erro?
Obrigado, *Alexandre dos Santos *Engenheiro Florestal, MSc.
Alexandre não pode haver peso = 0, isto deve estar ocorrendo por dois motivos. Primeiro alguém não registrou o peso logo este valor é ausente (missing). Segundo o peso é menor que o limite de detecção da balança logo este valor é não disponível (not available). A solução, na minha opinião, é imputar valores no caso dos valores ausentes é fácil. Normalmente o peso tem distribuição normal - pelo menos na área da saúde - logo veja a média e o desvio padrão e use rnorm. No caso dos valores disponíveis é um pouco mais difícil. Descubra o valor de sensibilidade inferior da balança e faça uma runif entre 0 e este valor. É importante seguir esta ordem para não alterar os valores da distribuição para os casos ausentes. Após isto refaça sua análise pois pode ser que os dados sejam normais desde o início. []s e Felis Natal Tura
participantes (4)
-
Alexandre Santos
-
Bernardo Rangel Tura
-
Fernando Colugnati
-
Walmes Zeviani