[R-br] dúvidas sobre tratamentos equidistantes
Walmes Zeviani
walmeszeviani em gmail.com
Segunda Abril 9 11:03:02 BRT 2012
Fernando,
Não há nessecidade de (evitar a palavra tratamento) de os níveis de um
fator métrico (contínuo) serem equidistantes para o ajuste de modelos de
regressão. Antigamente isso era preconizado pois induzia uma facilidade
computacional que era o emprego de polinômios ortogonais (PO), os livros
antigos de experimental possuem tabelas de polinômios ortogonais
nos apêndices. Então níveis regulares (equidistantes) permitiam o uso de
PO, que geravam uma matriz X'X diagonal (pois X é ortogonal), portanto,
simples de inverter, além do mais, a ortogonalidade em X fazia com que os
testes para os efeitos (linear, quadrático, etc) fossem fáceis de obter.
Hoje não precisamos disso para estimação/inferência, embora matrizes
de delineamentos ortogonais sejam sempre bem vindas do ponto de vista
computacional.
O mais importante na hora de planejar o experimento com fatores métricos é
distribuir de maneira adequada os níveis da regressora na região
experimental de interesse, e a forma mais ingenua e natural de fazer isso é
distribuir regularmente dentro da região. Distribuir regularmente pode nem
sempre ser a melhor opção, vai depender da forma da função (linear,
quadrática, exponencial, log, michaelis mentem, logistico, von bertalanffy,
etc). Como em geral não sabemos qual a função usar, novamente, distribuição
regular se torna a opção mais frequente.
O que se faz em geral nos experimentos agronômicos é usar 4 doses, o que do
meu ponto de vista é péssimo, pois a) pouco informa sobre a relação entre
as variáveis, pois com um número baixo de níveis muitos modelos terão
desempenho semelhante, b) o máximo que se pode é usar um polinômio cúbico
(classe que tento evitar). Em agronomia, o que se faz com muita frequência
é ainda comparar, via teste de médias, os níveis do fator métrico, o que na
minha opinião é péssimo pois a) é perfeitamente aceitável que existe uma
função que que relacione a resposta ao fator e essa relação em geral pode
ser descrita por um modelo que tenha menos parâmetros que médias a serem
estimadas (parcimônia), b) ao usar um modelo você pode predizer o valor
esperado na resposta para um nível não aplicado pois com o modelo ajustado
você vê a curva toda (interpolação/extrapolação), c) dependendo do modelo,
os parâmetros apresentam interpretação prática, o que é o caso em geral dos
modelos não lineares, d) não faz o mínimo de sentido comparar médias dos
níveis (ainda mais todos contra todos, pairwise) pois eles não são níveis
"independentes" como os nominais no sentido de que se tenho os níveis
métricos x1 < x2 < x3 e sei o desempenho em x1 e x3, espero que x2 tenha
desempenho intermediário (é natural), mas se tenho os níveis nominais A, B
e C, saber sobre A e C não ajuda em nada sobre B.
Minha recomendação seria: ao usar fatores métricos aplique mais níveis
(diminua o número de repetições por nível caso tenha custo), ou seja, evite
4 níveis com 4 repetições e faça 8 níveis com 2 repetições, por exemplo.
Deixe de lado a idéia de fazer testes de médias, mesmo porque, com o modelo
de regressão ajustado é possível testar os valores preditos em qualquer
ponto da curva (E(Y|x_i) vs E(Y_2|x_j)), seja entre pontos da mesma curva
(x_i e x_j), seja no mesmo ponto em curvas diferentes (f_1(x_i) e
f_2(x_i)), por exemplo, você pode testar a média no ponto de máximo de duas
curvas.
À disposição.
Walmes.
==========================================================================
Walmes Marques Zeviani
LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W)
Departamento de Estatística - Universidade Federal do Paraná
fone: (+55) 41 3361 3573
VoIP: (3361 3600) 1053 1173
e-mail: walmes em ufpr.br
twitter: @walmeszeviani
homepage: http://www.leg.ufpr.br/~walmes
linux user number: 531218
==========================================================================
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20120409/e6501ec2/attachment.html>
Mais detalhes sobre a lista de discussão R-br