<div dir="ltr"><div class="gmail_default" style="font-family:trebuchet ms,sans-serif">Segue CMR com comentários.<br></div><div class="gmail_default" style="font-family:trebuchet ms,sans-serif"><br><span style="font-family:courier new,monospace">require(lattice)<br>
require(nlme)<br><br>## Segue o código (com dados fictícios) para exemplificar o meu problema: <br>local <- as.factor(c(rep(1,6), rep(2,6)));<br>blo <- as.factor(rep(c(rep(1,3), rep(2,3)),2))<br><br>## Para que criar como fator se vai usar como numérico?<br>
## lat <- as.factor(rep(1:3,4));<br>## long <- as.factor(rep(c(rep(1,3), rep(2,3)),2))<br>lat <- rep(1:3,4);<br>long <- rep(c(rep(1,3), rep(2,3)),2);<br><br>xyplot(lat~long|local, groups=blo)<br><br>## Dentro de um bloco não se tem variação no valor de longitude. Isso<br>
## pode implicar em problemas de identificabilidade dependendo do modelo<br>## considerado para os dados. O Elias já comentou isso.<br><br>## blo_local <- as.factor(c(rep("1_1",3), rep("2_1",3), rep("1_2",3), rep("2_2",3)))<br>
blo_local <- interaction(blo, local)<br><br>trat <- as.factor(c(2,3,1,1,3,2,1,3,2,3,2,1))<br>resp <- c(2,1.9,1.9,1.8,2,1.9,2,2.1,2.3,2,1.9,1.8)<br>dados <- data.frame(local, trat, blo, lat, long, blo_local, resp)<br>
str(dados)<br><br>### M1 - BA (efeito de blocos aleatório)<br>M1 <- lme(resp~1+trat+local+local:trat,<br>          random=list(blo_local=pdIdent(~1)),<br>          method="REML", na.action=na.omit, data=dados, keep.data=FALSE)<br>
summary(M1)<br><br>### M2 - Exp H (sem efeito de blocos - função exponencial para R -<br>### heterogeneidade de variâncias nos locais)<br>M2 <- gls(resp~1+trat+local+local:trat,<br>          weight=varComb(varIdent(form=~1|local)),<br>
          correlation=corExp(form=~lat+long|local, metric="euclidean",<br>              nugget=FALSE),<br>          method="REML", na.action=na.omit, data=dados)<br>summary(M2)<br><br>### M3 - BA-Exp-H (PROBLEMA - blocos aleatórios - função exponencial - heterogeneidade de variâncias) <br>
## M3 <- lme(resp~1+trat+local+local:trat, random=list(blo_local=pdIdent(~1)),<br>##           weight=varComb(varIdent(form=~1|local)),<br>##           correlation=corExp(form=~lat+long|local,<br>##               metric="euclidean", nugget=FALSE),<br>
##           method="REML", na.action=na.omit, data=dados)<br>##<br>## Erro em lme.formula(resp ~ 1 + trat + local + local:trat, random = list(blo_local = pdIdent(~1)),  : <br>##   incompatible formulas for groups in 'random' and 'correlation'<br>
<br>## O modelo acima apresenta problema de especificação. Teóricamente é um<br>## modelo válido mas pelo visto não declarável na lme(). Ela requer que<br>## a correlação seja dentro dos níveis do fator de efeito aleatório, no<br>
## caso, os blocos dentro de locais, e por isso que não aceita o tempo<br>## '|local' par o argumento correlation. Abaixo segue um modelo válido<br>## que assume que existe correlção entre observações dentro do mesmo<br>
## bloco, e portanto, observações e diferentes blocos são<br>## independentes. Se entre essas parcelas existe uma distância grande,<br>## até que é uma suposição plausível.<br><br>M4 <- lme(resp~1+trat+local+local:trat,<br>
          random=list(blo_local=pdIdent(~1)),<br>          weight=varComb(varIdent(form=~1|local)),<br>          correlation=corExp(form=~lat+long,<br>              metric="euclidean", nugget=FALSE),<br>          method="REML", na.action=na.omit, data=dados)<br>
summary(M4)<br></span><br></div><div class="gmail_default" style="font-family:trebuchet ms,sans-serif">Todos os modelo considerados são válidos, muito embora eu considere o maior modelo muito grande, pelo menos para os dados usados como exemplo (especificação de efeitos fixos, efeitos aleatórios, correlação entre observações, variância separada por local). É possível simular dados para um modelo com todos esses termos mas nem sempre é possível estimar a partir de dados, principalmente com variâncias de efeito aleatório indo para zero. Modelos grandes assim começam apresentar fraca identificabilidade.<br>
<br></div><div class="gmail_default" style="font-family:trebuchet ms,sans-serif">Não foi dada uma descrição minuciosa do experimento e objetivo da análise mas eu acredito que o modelo mais adequado (embora grande) seja aquele no qual os blocos dentro de locais sejam aleatórios, exista correlação entre parcelas dentro um mesmo local (inclusive de blocos diferentes) e variância separada por local. Na minha experiência, como na pratica existe uma relação média variância, locais mais produtivos tem maior variabilidade também e declarar variância heterogênea pode fazer a diferença. A questão é se esse modelo é declarável.<br>
<br></div><div class="gmail_default" style="font-family:trebuchet ms,sans-serif">Quanto aos blocos terem ou não efeito efeito aleatório eu não vejo problemas em assumir efeito fixo não. A análise continua válida mas muda um pouco a interpretação (inferência ampla ou restrita, ver Schabenberger & Pearce (2002?)). Blocos com efeito aleatório tem um apelo maior, principalmente no caso desbalanceado. A verossimilhança é resultado de uma integral sobre o domínio dos efeitos aleatórios, o que pode ser visto como uma espécie de verossimilhança média.<br>
<br></div><div class="gmail_default" style="font-family:trebuchet ms,sans-serif">Semanas atrás o Éder Borges (dessa lista) apresentou para nós do LEG e o Havard Rue o ajuste de um modelo, via INLA, muito interessante. Se eu não estiver desmemoriado, era um experimento de melhoramento genético, um local, muitos blocos (linha coluna) de efeito aleatório, material genético também aleatório, correlação entre parcelas (que são bem próximas), havia muito desbalanceamento também, e cultivares testes e muitas das cultivares que competiam tinham uma só repetição. Talvez você pode considerar o INLA nas suas análises também.<br>
</div><div class="gmail_default" style="font-family:trebuchet ms,sans-serif"><br>À disposição.<br>Walmes.<br></div></div>