[R-br] Res: Res: Res: [R_STAT] Dados não balanceados!

Walmes Zeviani walmeszeviani em gmail.com
Sexta Abril 1 13:36:21 BRT 2011


Thiago,

Se no seu modelo você tiver que estimar efeitos da interação clone:local, um
dos efeitos será não estimável por não possuir informação amostral para ele,
no coef() do modelo vai haver um NA para esse termo. Por outro lado, se essa
interação clone:local for desprezada (assumida ser zero, não fizer sentido,
etc), o desbalanceamento não vai impedir você de estimar os efeitos
principais. No primeiro caso, caso exista interação, você terá dificuldade
para testar efeitos principais, embora não exista o mínimo de sentido testar
os efeitos principais na presença de interação, no entanto alguns softwares
usam algumas restrições e coisa e tal e fazem testes para os efeitos
principais na presença de interação em delineamentos com perda completa de
casela, um esforço um tanto desnecessário. Se a interação é não
significativa você pode ajustar um modelo com apenas os efeitos principais e
estima-los e testar hipóteses a respeito tranquilamente. Outra saída é
considerar o efeito de local e suas interações como aleatório. Daí a coisa
saí fácil porque a estimação vai importar informação das demais observações.

À disposição.
Walmes.

==========================================================================
Walmes Marques Zeviani
LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W)
Departamento de Estatística - Universidade Federal do Paraná
fone: (+55) 41 3361 3573
VoIP: (3361 3600) 1053 1173
e-mail: walmes em ufpr.br
twitter: @walmeszeviani
homepage: http://www.leg.ufpr.br/~walmes
linux user number: 531218
==========================================================================

*De:* Thiago De paula protásio <depaulaprotasio em yahoo.com.br>
*Para:* R_STAT em yahoogrupos.com.br
*Enviadas:* Quinta-feira, 31 de Março de 2011 19:20:24
*Assunto:* Re: Res: Res: [R_STAT] Dados não balanceados!



Pessoal;

Necessito da grande ajuda de vcs....
Tem um delineamento em esquema fatorial, mas os dados estão desbalaceados.
Nesse caso, um dos fatores não está completo....
Eu tenho 4 clones, 3 locais e 2 espaçamentos, mas para um dos clones eu não
tenho todos os locais.

Como posso proceder com essa estatística no R?
O Walmes já me deu alguns toques sobre algo parecido a algum tempo....

Conto com vcs!
Muito obrigado!
--- Em *sáb, 12/2/11, walmes zeviani <walmeszeviani em yahoo.com.br>* escreveu:


De: walmes zeviani <walmeszeviani em yahoo.com.br>
Assunto: Res: Res: [R_STAT] Dados não balanceados!
Para: R_STAT em yahoogrupos.com.br
Data: Sábado, 12 de Fevereiro de 2011, 13:21


Thiago,

Como o Ivan disse, a coisa do teste dos termos do modelo ou anova, pode ser
empregada a car::Anova(..., type="III"). Mas os cuidados com
desbalanceamentos atravessam a fronteira da anova. Os testes de médias (ou
demais inferências) não são mais baseados nas médias amostrais, uma vez que
essas são viesadas devido a perda de ortogonalidade causada pelo
desbalanceamento. O que deve ser obtido são as médias ajustadas que requerem
manipulação matricial do vetor de solução do sistema linear, ou
coef(modelo.lm). Antes de tudo isso, deve se saber se o seu desbalanceamento
não comprometeu a estimação dos efeitos, pois existem duas "intensidades" de
desbalanceamento:

* apenas perda de repetições: aqui toda combinação entre níveis dos fatores
tem pelo menos uma repetição com observação, e.g. fator A (A1,A2,A3) e B
(B1,B2) todas as 6 combinações de A com B possuem pelo menos uma observação.
Aqui todos os efeitos podem ser estimados embora com erros padrões
diferentes em função do desbalanceamento.
* perda de caselas: aqui pelo menos uma combinação dos níveis dos
tratamentos não foi observada, e.g. fator A (A1,A2,A3) e B (B1,B2) alguma
das 6 combinações foi completamente não observada (e.g. A1B1). Nesse caso
não é possível estimar alguns efeitos justamente por não haver as
observações experimentais correspondentes para estimá-los.

No caso de dois fatores sem interação entre eles tem um exemplo na página de
Rídiculas do LEG que fiz ontem para outro fim. Quem sabe possamos fazer uma
Rídicula com o seu problema.

http://www.leg.ufpr.br/doku.php/ridiculas

À disposição.
Walmes.

============================================================
Walmes Marques Zeviani
LEG (Laboratório de Estatística e Geoinformação)
Departamento de Estatística - Universidade Federal do Paraná
fone: (+55) 41 3361 3573
VoIP: (3361 3600) 1053 1173
e-mail: walmes em ufpr.br / @walmeszeviani
homepage: http://www.leg.ufpr.br/~walmes
============================================================


------------------------------
*De:* Ivan Bezerra Allaman <ivanalaman em yahoo.com.br>
*Para:* R_STAT em yahoogrupos.com.br
*Enviadas:* Sábado, 12 de Fevereiro de 2011 10:38:53
*Assunto:* Res: [R_STAT] Dados não balanceados!


Bom dia Thiago!!

Nestes casos é aconselhável vc utilizar a soma de quadrados do tipo III.
Para obter resultados semelhantes a alguns softwares consagrados vc pode
utilizar a reparametrização do tipo soma zero. Para isso:

options(contrasts = c("contr.sum", "contr.helmert"))
library(car)

modelo <- lm( y ~ A*B)
Anova(modelo, type="III")

Abraço.

(S,f,P)
Allaman

*M.Sc Ivan Bezerra Allaman*
Zootecnista
Doutorando em Produção Animal/Aquicultura - UFLA
**email e msn - ivanalaman em yahoo.com.br
Tel: (35)3826-6608/9925-6428


------------------------------
*De:* Thiago De paula protásio <depaulaprotasio em yahoo.com.br>
*Para:* R_STAT em yahoogrupos.com.br
*Enviadas:* Sábado, 12 de Fevereiro de 2011 10:20:28
*Assunto:* [R_STAT] Dados não balanceados!



Olá Pessoal;

Estou precisando de algumas orientações para rodar um um fatorial com dados
desbalaceados.

Espero que alguém posso me ajudar com alguma função ou material.

Muito obrigado!
Bom final de semana a todos!!
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20110401/6dff17d1/attachment.html>


Mais detalhes sobre a lista de discussão R-br