Thiago,

Se no seu modelo você tiver que estimar efeitos da interação clone:local, um dos efeitos será não estimável por não possuir informação amostral para ele, no coef() do modelo vai haver um NA para esse termo. Por outro lado, se essa interação clone:local for desprezada (assumida ser zero, não fizer sentido, etc), o desbalanceamento não vai impedir você de estimar os efeitos principais. No primeiro caso, caso exista interação, você terá dificuldade para testar efeitos principais, embora não exista o mínimo de sentido testar os efeitos principais na presença de interação, no entanto alguns softwares usam algumas restrições e coisa e tal e fazem testes para os efeitos principais na presença de interação em delineamentos com perda completa de casela, um esforço um tanto desnecessário. Se a interação é não significativa você pode ajustar um modelo com apenas os efeitos principais e estima-los e testar hipóteses a respeito tranquilamente. Outra saída é considerar o efeito de local e suas interações como aleatório. Daí a coisa saí fácil porque a estimação vai importar informação das demais observações.

À disposição.
Walmes.

==========================================================================
Walmes Marques Zeviani
LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W)
Departamento de Estatística - Universidade Federal do Paraná
fone: (+55) 41 3361 3573
VoIP: (3361 3600) 1053 1173
e-mail: walmes@ufpr.br
twitter: @walmeszeviani
homepage: http://www.leg.ufpr.br/~walmes
linux user number: 531218
==========================================================================

De: Thiago De paula protásio <depaulaprotasio@yahoo.com.br>
Para: R_STAT@yahoogrupos.com.br
Enviadas: Quinta-feira, 31 de Março de 2011 19:20:24
Assunto: Re: Res: Res: [R_STAT] Dados não balanceados!

 

Pessoal;

Necessito da grande ajuda de vcs....
Tem um delineamento em esquema fatorial, mas os dados estão desbalaceados.
Nesse caso, um dos fatores não está completo....
Eu tenho 4 clones, 3 locais e 2 espaçamentos, mas para um dos clones eu não tenho todos os locais.

Como posso proceder com essa estatística no R?
O Walmes já me deu alguns toques sobre algo parecido a algum tempo....

Conto com vcs!
Muito obrigado!
--- Em sáb, 12/2/11, walmes zeviani <walmeszeviani@yahoo.com.br> escreveu:

De: walmes zeviani <walmeszeviani@yahoo.com.br>
Assunto: Res: Res: [R_STAT] Dados não balanceados!
Para: R_STAT@yahoogrupos.com.br
Data: Sábado, 12 de Fevereiro de 2011, 13:21

 
Thiago,

Como o Ivan disse, a coisa do teste dos termos do modelo ou anova, pode ser empregada a car::Anova(..., type="III"). Mas os cuidados com desbalanceamentos atravessam a fronteira da anova. Os testes de médias (ou demais inferências) não são mais baseados nas médias amostrais, uma vez que essas são viesadas devido a perda de ortogonalidade causada pelo desbalanceamento. O que deve ser obtido são as médias ajustadas que requerem manipulação matricial do vetor de solução do sistema linear, ou coef(modelo.lm). Antes de tudo isso, deve se saber se o seu desbalanceamento não comprometeu a estimação dos efeitos, pois existem duas "intensidades" de desbalanceamento:

* apenas perda de repetições: aqui toda combinação entre níveis dos fatores tem pelo menos uma repetição com observação, e.g. fator A (A1,A2,A3) e B (B1,B2) todas as 6 combinações de A com B possuem pelo menos uma observação. Aqui todos os efeitos podem ser estimados embora com erros padrões diferentes em função do desbalanceamento.
* perda de caselas: aqui pelo menos uma combinação dos níveis dos tratamentos não foi observada, e.g. fator A (A1,A2,A3) e B (B1,B2) alguma das 6 combinações foi completamente não observada (e.g. A1B1). Nesse caso não é possível estimar alguns efeitos justamente por não haver as observações experimentais correspondentes para estimá-los.

No caso de dois fatores sem interação entre eles tem um exemplo na página de Rídiculas do LEG que fiz ontem para outro fim. Quem sabe possamos fazer uma Rídicula com o seu problema.

http://www.leg.ufpr.br/doku.php/ridiculas

À disposição.
Walmes.
 
============================================================
Walmes Marques Zeviani
LEG (Laboratório de Estatística e Geoinformação)
Departamento de Estatística - Universidade Federal do Paraná
fone: (+55) 41 3361 3573
VoIP: (3361 3600) 1053 1173
e-mail: walmes@ufpr.br / @walmeszeviani
homepage: http://www.leg.ufpr.br/~walmes
============================================================




De: Ivan Bezerra Allaman <ivanalaman@yahoo.com.br>
Para: R_STAT@yahoogrupos.com.br
Enviadas: Sábado, 12 de Fevereiro de 2011 10:38:53
Assunto: Res: [R_STAT] Dados não balanceados!

 
Bom dia Thiago!!

Nestes casos é aconselhável vc utilizar a soma de quadrados do tipo III. Para obter resultados semelhantes a alguns softwares consagrados vc pode  utilizar a reparametrização do tipo soma zero. Para isso:

options(contrasts = c("contr.sum", "contr.helmert"))
library(car)

modelo <- lm( y ~ A*B)
Anova(modelo, type="III")

Abraço.

(S,f,P)
Allaman
 
M.Sc Ivan Bezerra Allaman
Zootecnista
Doutorando em Produção Animal/Aquicultura - UFLA
email e msn - ivanalaman@yahoo.com.br
Tel: (35)3826-6608/9925-6428



De: Thiago De paula protásio <depaulaprotasio@yahoo.com.br>
Para: R_STAT@yahoogrupos.com.br
Enviadas: Sábado, 12 de Fevereiro de 2011 10:20:28
Assunto: [R_STAT] Dados não balanceados!

 

Olá Pessoal;

Estou precisando de algumas orientações para rodar um um fatorial com dados desbalaceados.

Espero que alguém posso me ajudar com alguma função ou material.

Muito obrigado!
Bom final de semana a todos!!