<html><head></head><body><div style="color:#000; background-color:#fff; font-family:Helvetica Neue, Helvetica, Arial, Lucida Grande, sans-serif;font-size:16px"><div id="yui_3_16_0_ym19_1_1498049847166_132816" dir="ltr"><span id="yui_3_16_0_ym19_1_1498049847166_133224">Bom dia, pessoal.<br id="yui_3_16_0_ym19_1_1498049847166_133123"><br id="yui_3_16_0_ym19_1_1498049847166_133124">Minha dúvida é particularmente sobre o cálculo de somas de quadrados tipo III (mas também do tipo II) no R com conjuntos de dados desbalanceados.<br id="yui_3_16_0_ym19_1_1498049847166_133125"><br id="yui_3_16_0_ym19_1_1498049847166_133126">Estou ciente da polêmica em torno do uso destas somas de quadrados na comunidade estatística, mas gostaria muito de poder calculá-las no R, e, a não ser que eu esteja enganado, nem sempre o R as calcula corretamente.<br id="yui_3_16_0_ym19_1_1498049847166_133127"><br id="yui_3_16_0_ym19_1_1498049847166_133128">Pesquisando na rede, descobri que em geral são apontadas duas maneiras de se calcular somas de quadrados tipo III no R: a) Utilizando a função drop1() em modelos ajustados com a especificação de contrastes contr.sum (ou contr.helmert), e b) utilizando a função Anova() (com "A" maiúsculo), do pacote car. <br id="yui_3_16_0_ym19_1_1498049847166_133129"><br id="yui_3_16_0_ym19_1_1498049847166_133130">Abaixo, eu apresento um exemplo simulado de um ensaio fatorial altamente desbalanceado, faltando várias combinações entre os níveis dos dois fatores. A interação entre eles, por exemplo, apresenta um único grau de liberdade, tamanho o desbalanceamento.<br id="yui_3_16_0_ym19_1_1498049847166_133131"><br id="yui_3_16_0_ym19_1_1498049847166_133132">dados <- data.frame(y=c(35.44627,43.43353,40.20125,38.1061,39.96211,44.21636,19.78237,23.58636,31.73537,<br id="yui_3_16_0_ym19_1_1498049847166_133133"> 36.49977,38.71573,41.00456,19.6787,16.43436,32.05407,33.3784,18.58266,17.74051),<br id="yui_3_16_0_ym19_1_1498049847166_133134"> factorA=as.factor(c(2,2,4,4,4,4,6,6,6,6,6,6,8,8,8,8,10,10)),<br id="yui_3_16_0_ym19_1_1498049847166_133135"> factorB=as.factor(c(2,2,1.5,1.5,2.5,2.5,1,1,2,2,3,3,1.5,1.5,2.5,2.5,2,2)))<br id="yui_3_16_0_ym19_1_1498049847166_133136"><br id="yui_3_16_0_ym19_1_1498049847166_133137">Tenho em mente o modelo contendo os fatores A e B, bem como sua interação. <br id="yui_3_16_0_ym19_1_1498049847166_133138"><br id="yui_3_16_0_ym19_1_1498049847166_133139">No SAS, utilizando o proc glm, obtenho as seguintes somas de quadrados tipo I, tipo II e tipo III:<br id="yui_3_16_0_ym19_1_1498049847166_133140"><br id="yui_3_16_0_ym19_1_1498049847166_133141">Source DF Type I SS<br id="yui_3_16_0_ym19_1_1498049847166_133142"><br id="yui_3_16_0_ym19_1_1498049847166_133143">factorA 4 964.4164933<br id="yui_3_16_0_ym19_1_1498049847166_133144">factorB 3 500.0771638<br id="yui_3_16_0_ym19_1_1498049847166_133145">factorA*factorB 1 68.7277880<br id="yui_3_16_0_ym19_1_1498049847166_133146"><br id="yui_3_16_0_ym19_1_1498049847166_133147">Source DF Type II SS<br id="yui_3_16_0_ym19_1_1498049847166_133148"><br id="yui_3_16_0_ym19_1_1498049847166_133149">factorA 3 954.6730970<br id="yui_3_16_0_ym19_1_1498049847166_133150">factorB 3 500.0771638<br id="yui_3_16_0_ym19_1_1498049847166_133151">factorA*factorB 1 68.7277880<br id="yui_3_16_0_ym19_1_1498049847166_133152"><br id="yui_3_16_0_ym19_1_1498049847166_133153">Source DF Type III SS<br id="yui_3_16_0_ym19_1_1498049847166_133154"><br id="yui_3_16_0_ym19_1_1498049847166_133155">factorA 3 954.6730970<br id="yui_3_16_0_ym19_1_1498049847166_133156">factorB 3 500.0771638<br id="yui_3_16_0_ym19_1_1498049847166_133157">factorA*factorB 1 68.7277880<br id="yui_3_16_0_ym19_1_1498049847166_133158"><br id="yui_3_16_0_ym19_1_1498049847166_133159">Percebam que neste exemplo as somas de quadrados tipo II e III são iguais, pois as "caselas" apresentam o mesmo número de repetições (duas).<br id="yui_3_16_0_ym19_1_1498049847166_133160"><br id="yui_3_16_0_ym19_1_1498049847166_133161">No R, tentei reproduzir este resultado seguindo os dois procedimentos citados acima:<br id="yui_3_16_0_ym19_1_1498049847166_133162"><br id="yui_3_16_0_ym19_1_1498049847166_133163">1) Utilizando a função drop1()<br id="yui_3_16_0_ym19_1_1498049847166_133164"><br id="yui_3_16_0_ym19_1_1498049847166_133165">> mod <- lm(y ~ factorA*factorB, <br id="yui_3_16_0_ym19_1_1498049847166_133166"> contrasts=list(factorA=contr.sum, factorB=contr.sum),<br id="yui_3_16_0_ym19_1_1498049847166_133167"> data=dados)<br id="yui_3_16_0_ym19_1_1498049847166_133168"><br id="yui_3_16_0_ym19_1_1498049847166_133169">> drop1(mod, ~.,test = "F")<br id="yui_3_16_0_ym19_1_1498049847166_133170">Single term deletions<br id="yui_3_16_0_ym19_1_1498049847166_133171"><br id="yui_3_16_0_ym19_1_1498049847166_133172">Model:<br id="yui_3_16_0_ym19_1_1498049847166_133173">y ~ factorA * factorB<br id="yui_3_16_0_ym19_1_1498049847166_133174"> Df Sum of Sq RSS AIC F value Pr(>F) <br id="yui_3_16_0_ym19_1_1498049847166_133175"><none> 70.841 42.661 <br id="yui_3_16_0_ym19_1_1498049847166_133176">factorA 0 0.000 70.841 42.661 <br id="yui_3_16_0_ym19_1_1498049847166_133177">factorB 0 0.000 70.841 42.661 <br id="yui_3_16_0_ym19_1_1498049847166_133178">factorA:factorB 1 68.728 139.569 52.867 8.7315 0.01609 *<br id="yui_3_16_0_ym19_1_1498049847166_133179">---<br id="yui_3_16_0_ym19_1_1498049847166_133180">Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1<br id="yui_3_16_0_ym19_1_1498049847166_133181"><br id="yui_3_16_0_ym19_1_1498049847166_133182">(apenas a soma de quadrados da interação foi calculada)<br id="yui_3_16_0_ym19_1_1498049847166_133183"><br id="yui_3_16_0_ym19_1_1498049847166_133184"><br id="yui_3_16_0_ym19_1_1498049847166_133185">2) Utilizando car::Anova()<br id="yui_3_16_0_ym19_1_1498049847166_133186"><br id="yui_3_16_0_ym19_1_1498049847166_133187">> mod <- lm(y ~ factorA*factorB, data=dados)<br id="yui_3_16_0_ym19_1_1498049847166_133188">> library(car)<br id="yui_3_16_0_ym19_1_1498049847166_133189">> Anova(mod,type = "II")<br id="yui_3_16_0_ym19_1_1498049847166_133190">Anova Table (Type II tests)<br id="yui_3_16_0_ym19_1_1498049847166_133191"><br id="yui_3_16_0_ym19_1_1498049847166_133192">Response: y<br id="yui_3_16_0_ym19_1_1498049847166_133193"> Sum Sq Df F value Pr(>F) <br id="yui_3_16_0_ym19_1_1498049847166_133194">factorA 1284.10 4 40.7845 8.995e-06 ***<br id="yui_3_16_0_ym19_1_1498049847166_133195">factorB 500.08 3 21.1774 0.0002047 ***<br id="yui_3_16_0_ym19_1_1498049847166_133196">factorA:factorB 68.73 1 8.7315 0.0160919 * <br id="yui_3_16_0_ym19_1_1498049847166_133197">Residuals 70.84 9 <br id="yui_3_16_0_ym19_1_1498049847166_133198">---<br id="yui_3_16_0_ym19_1_1498049847166_133199">Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1<br id="yui_3_16_0_ym19_1_1498049847166_133200">> Anova(mod,type = "III")<br id="yui_3_16_0_ym19_1_1498049847166_133201">Error in Anova.III.lm(mod, error, singular.ok = singular.ok, ...) : <br id="yui_3_16_0_ym19_1_1498049847166_133202"> there are aliased coefficients in the model</span></div><div dir="ltr" id="yui_3_16_0_ym19_1_1498049847166_133297"><br><span id="yui_3_16_0_ym19_1_1498049847166_133224"></span></div><div dir="ltr" id="yui_3_16_0_ym19_1_1498049847166_133351"><span id="yui_3_16_0_ym19_1_1498049847166_133224">(soma de quadrados tipo II calculada errada para o fator A, e tipo III não calculadas)<br></span></div><div dir="ltr"><span id="yui_3_16_0_ym19_1_1498049847166_133224"><br></span></div><div dir="ltr" id="yui_3_16_0_ym19_1_1498049847166_133353"><span id="yui_3_16_0_ym19_1_1498049847166_133224">Ou seja, não consegui reproduzir nem as somas de quadrados tipo III nem as do tipo II, por nenhum dos dois procedimentos sugeridos na rede.<br id="yui_3_16_0_ym19_1_1498049847166_133205"><br id="yui_3_16_0_ym19_1_1498049847166_133206">Estou utilizando:<br id="yui_3_16_0_ym19_1_1498049847166_133207">> sessionInfo()<br id="yui_3_16_0_ym19_1_1498049847166_133208">R version 3.4.0 (2017-04-21)<br id="yui_3_16_0_ym19_1_1498049847166_133209">Platform: x86_64-pc-linux-gnu (64-bit)<br id="yui_3_16_0_ym19_1_1498049847166_133210">Running under: Ubuntu 14.04.5 LTS<br id="yui_3_16_0_ym19_1_1498049847166_133211">(...)<br id="yui_3_16_0_ym19_1_1498049847166_133212">other attached packages:<br id="yui_3_16_0_ym19_1_1498049847166_133213">[1] car_2.1-4<br id="yui_3_16_0_ym19_1_1498049847166_133214"><br id="yui_3_16_0_ym19_1_1498049847166_133215"><br id="yui_3_16_0_ym19_1_1498049847166_133216"><br id="yui_3_16_0_ym19_1_1498049847166_133217">Eu estaria fazendo alguma coisa equivocada? Qualquer observação, sugestão, ou indicação de alguma maneira alternativa para cálculo das somas de quadrados tipo III no R será muito bem vinda.<br id="yui_3_16_0_ym19_1_1498049847166_133218"><br id="yui_3_16_0_ym19_1_1498049847166_133219">Abs,<br id="yui_3_16_0_ym19_1_1498049847166_133220"><br id="yui_3_16_0_ym19_1_1498049847166_133221">Eduardo Bearzoti<br id="yui_3_16_0_ym19_1_1498049847166_133222">(UFOP)</span></div><div id="yui_3_16_0_ym19_1_1498049847166_132877"> </div><div class="signature" id="yui_3_16_0_ym19_1_1498049847166_132878"><br></div></div></body></html>