
Olá Pessoal, Sou iniciante na utilização do R, ainda não tive a oportunidade de participar de um treinamento com o mesmo, estou tentando aprender a utilizá-lo apenas com a leitura de apostilas, o que tem gerado muitas dúvidas. Esta semana estava trabalhando com o preço de imóveis rurais em 40 regiões de um mesmo estado, os meus dados possuem duas coluna REG (região) e VTN (preço), quando fiz o teste de normalidade foi verificado que os dados não tinham distribuição normal, então gostaria de realizar o teste BoxCox para verificar qual a melhor transformação para tornar os dados com distribuição normal. Gostaria de saber sobre o procedimento passo a passo pois a maioria das apostilas que vi falando sobre este teste não ficaram tão claras para mim, por exemplo na ajuda do R tem dois exemplos: boxcox(Volume ~ log(Height) + log(Girth), data = trees, lambda = seq(-0.25, 0.25, length = 10)) boxcox(Days+1 ~ Eth*Sex*Age*Lrn, data = quine, lambda = seq(-0.05, 0.45, len = 20)) Para mim está complicado saber com os dados que tenho, o que eu teria que informar e também o que é esse sinal "~" e qual a sua função. Desculpa se as dúvidas são muito básicas, desde já agradeço a atenção. -- Hélder Gramacho dos Santos Engenheiro Agrônomo Mestrando Ciênc. Geod. Tec. Geoinformação-UFPE * agrohelder@gmail.com <agrohelder@hotmail.com> *

No primeiro caso indica que uma transformação log pode ser considerada (aceita a hipótese de que lambda==0). m0 <- lm(Volume~log(Height)+log(Girth), data=trees) par(mfrow=c(2,2)) plot(m0) layout(1) require(MASS) boxcox(m0, lambda=seq(-0.25, 0.25, length=10)) abline(v=0, col=2) m1 <- lm(log(Volume)~log(Height)+log(Girth), data=trees) par(mfrow=c(2,2)) plot(m1) layout(1) À disposição. Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br skype: walmeszeviani twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================

Olá Walmes, Obrigado pela resposta, minha dúvida ainda é bem básica olha só como estou fazendo:
dados<-read.table(file="DADOS_N_NORMAIS.csv",sep=",",header=T,dec=".") dados REG VTN1 VTN2 1 Andradina 7713.50 9090.91 2 Araraquara 10743.80 10927.46 3 Araçatuba 8677.69 9917.36 4 Assis 0.00 5268.60 5 Avaré 8677.69 8790.38 6 Barretos 10330.58 10330.58 7 Bauru 0.00 0.00 8 Botucatu 9445.10 10909.09 9 Bragança Paulista 11386.59 12267.56 10 Campinas 9228.65 13739.67 11 Catanduva 8795.75 10743.80 12 Dracena 4700.41 5920.80 13 Fernandópolis 7988.98 8677.69 14 Franca 8801.65 9691.96 15 General Salgado 8719.01 9356.55 16 Guaratinguetá 2561.98 3246.75 17 Itapetininga 9447.78 10800.15 18 Itapeva 5406.34 6060.61 19 Jaboticabal 8264.46 11983.47 20 Jales 0.00 10123.97 21 Jaú 5475.21 9194.21 22 Limeira 12534.44 13016.53 23 Lins 8884.30 10468.32 24 Marília 5454.55 6311.04 25 Mogi Mirim 13085.40 15289.26 26 Mogi das Cruzes 8942.52 9513.09 27 Orlândia 0.00 13774.10 28 Ourinhos 9958.68 10440.77 29 Pindamonhangaba 4958.68 7914.81 30 Piracicaba 7300.28 10212.51 31 Presidente Prudente 3751.15 4309.33 32 Presidente Venceslau 0.00 0.00 33 Registro 2654.96 1977.11 34 Ribeirao Preto 11404.96 11511.22 35 Sorocaba 14462.81 13688.02 36 Sao José do Rio Preto 13429.75 14003.67 37 Sao Joao da Boa Vista 9435.26 9729.53 38 Sao Paulo 6466.94 10789.26 39 Tupa 2768.60 3140.50 40 Votuporanga 8884.30 9366.39 attach(dados) shapiro.test(VTN1)
Shapiro-Wilk normality test data: VTN1 W = 0.9369, p-value = 0.02713
library(MASS) boxcox(VTN1) Erro: $ operator is invalid for atomic vectors
Chega neste ponto estou fazendo algo muito errado só não sei o que é... Hélder 2013/6/25 walmes . <walmeszeviani@gmail.com>
No primeiro caso indica que uma transformação log pode ser considerada (aceita a hipótese de que lambda==0).
m0 <- lm(Volume~log(Height)+log(Girth), data=trees) par(mfrow=c(2,2)) plot(m0) layout(1)
require(MASS) boxcox(m0, lambda=seq(-0.25, 0.25, length=10)) abline(v=0, col=2)
m1 <- lm(log(Volume)~log(Height)+log(Girth), data=trees) par(mfrow=c(2,2)) plot(m1) layout(1)
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br skype: walmeszeviani twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Hélder Gramacho dos Santos Engenheiro Agrônomo Mestrando Ciênc. Geod. Tec. Geoinformação-UFPE * agrohelder@gmail.com <agrohelder@hotmail.com> *

Não faz sentido testar a normalidade dos dados (Y) se você sabe a princípio que Y depende de covariaveis (X). Em um modelo de regressão supoe-se que Y|x tenha distribuição normal e não Y, ou seja, não se supoe nada para a distribuição marginal de Y e sim para sua distribuição condicional. A suposição de normalidade então avaliada nos resíduos e não nos dados. Dê uma olhada nessa matéria https://ridiculas.wordpress.com/2012/11/30/como-fazer-e-interpretar-o-grafic... À disposição. Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br skype: walmeszeviani twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================

Olá Walmes, Entendi a sua explicação. No meu caso o objetivo de verificar a normalidade seria para em seguida verificar a existência de Autocorrelação Espacial por meios do Índice de Moran Global e posteriomente do Índice de Moran Local (LISA) fazendo a identificação de Aglomerados. Neste caso também devo seguir o procedimento que você indicou anteriormente ou existe outra forma de proceder? Em 25 de junho de 2013 13:41, walmes . <walmeszeviani@gmail.com> escreveu:
Não faz sentido testar a normalidade dos dados (Y) se você sabe a princípio que Y depende de covariaveis (X). Em um modelo de regressão supoe-se que Y|x tenha distribuição normal e não Y, ou seja, não se supoe nada para a distribuição marginal de Y e sim para sua distribuição condicional. A suposição de normalidade então avaliada nos resíduos e não nos dados. Dê uma olhada nessa matéria
https://ridiculas.wordpress.com/2012/11/30/como-fazer-e-interpretar-o-grafic...
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br skype: walmeszeviani twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Hélder Gramacho dos Santos Engenheiro Agrônomo Mestrando Ciênc. Geod. Tec. Geoinformação-UFPE * agrohelder@gmail.com <agrohelder@hotmail.com> *

Análise espacial não é minha área de competência mas a lista tem vários membros com experiência nisso que poderão de ajudar. À disposição. Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br skype: walmeszeviani twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
participantes (2)
-
Helder Gramacho
-
walmes .