Tanto lm() quanto aov() podem ser usadas com dados desbalanceados. Acontece que o usuário deve estar ciente das conseguências do desbalanceamento: (1) diferença na precisão dos efeitos e (2) não ortogonalidade entre as fontes de variação. Ou seja, não ortogonalidade implica que as somas de quadrado sequencial (padrão do R) mudam de acordo com a ordem dos termos no modelo e que as médias amostrais não são estimadores livres de efeitos (deve-se usar médias ajustadas) e a diferença de precisão implica que você não deve usar métodos baseados em diferença mínima significativa única, com LSD, HSD, etc para comparar tais médias. Nestes casos é recomendado fazer as comparações de interesse e corrigir o p-valor devido à multiplicidade adotando por exemplo a correção de Bonferroni ou similar. Muitas opções estão disponíveis no pacote multcomp. Para médias ajustadas pode-se usar a doBy::popMeans().

À disposição.
Walmes.

==========================================================================
Walmes Marques Zeviani
LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W)
Departamento de Estatística - Universidade Federal do Paraná
fone: (+55) 41 3361 3573
VoIP: (3361 3600) 1053 1173
e-mail: walmes@ufpr.br
skype: walmeszeviani
twitter: @walmeszeviani
homepage: http://www.leg.ufpr.br/~walmes
linux user number: 531218
==========================================================================