[R-br] Funções kruskal e order.group do pacote agricolae
Jose Claudio Faria
joseclaudio.faria em gmail.com
Terça Outubro 7 11:20:06 BRT 2014
Olá pessoal,
Estou reenviando a mensagem devido a:
1- Erros grosseiros de linguagem detectados na primeira versão (era de
madrugada e estava com sono);
2- Ter detalhado melhor alguns pontos;
3- Pela relevância do assunto, que ele fique como registro de
possíveis opiniões.
Pacote insuficientemente documentado é um prato cheio para muitas
dúvidas e que acabam se refletem nas listas de discussão: basta ver o
histórico de discussão sobre kruskal em nosso grupo e no R-help.
Uso muito pouco estatística livre de distribuição, mas como trabalho
(também) com análise de dados, acabei caindo em um caso onde um teste
de comparação múltiplas (livre de distribuição) está sendo necessário.
Após estudar a teoria do teste Kruskal-Wallis pelo livro do Siegel
(final de semana chuvoso...), fui buscar (no R) pacotes que continham
sua implementação mais elaborada. Encontrei 2:
1- agricolae
2- pgirmess
pgirmess não instala (no debian) devido a ausência do pacote rgdal.
Até seria possível armengando, mas adicionalmente, agricolae é mais
conhecido (o que poderia ajudar em caso de dúvidas).
Então fui estudar a implementação do teste no pacote agricolae. A
primeira coisa que você observa é a insuficiência de documentação da
função kruskal.
Bom, então o jeito foi fazer um debug (ninguém merece) para ver suas
entranhas. Observei que ela calcula a média dos postos de cada grupo
(entre outras informações necessárias a posterior discriminação dos
grupos) e chama a função "order.group" para tal tarefa. "order.group"
é também insuficientemente documentada.
Fora a parte funcional da função "order.group", de útil se retira
apenas que é usada nos testes: HSD, LSD, Kruskal-Wallis, Friedman ou
Durbin.
A função "order.group" recebe o argumento "p.adj" da função kruskal. E
existem algumas opções: optei pela de bonferroni.
Não consegui (pelo debug) identificar qual teste a função
"order.group" usa. Vi uns posts antigos aqui na lista se referindo ao
teste paramétrico "t". Seria isto mesmo?
Bom, para socializar um pouco do que andei observando, o resultado do
teste não é fornecido na mesma escala da variável em questão, mas em
escala das médias dos postos de cada grupo.
Se aplico a correção de bonferroni os resultados (classificação dos
grupos) se assemelham bastante (em muitas situações idênticos) aos da
correlata paramétrica ANOVA seguido do teste de Tukey. Se não aplico a
correção se assemelham bastante (idem) aos do teste de Duncan. Fiz
isso apenas para ter uma noção do poder em termos comparativos.
Escrevi esta semana para o autor e mantenedor do pacote (Felipe de
Mendiburu) solicitando informações sobre qual teste a função
"order.group" usa mas ele ainda não respondeu.
Alguém conhece (com certeza) qual teste é usado na função "order.group"?
É realmente o teste "t" aplicado a média dos postos?
Acho estranho evocar um teste paramétrico numa metodologia não paramétrica.
Adicionalmente, achei que a função faz cálculos demasiados para ser o teste "t".
Não seria o de Mann-Whitney ou outro?
Ab,
///\\\///\\\///\\\///\\\///\\\///\\\///\\\///\\\
Jose Claudio Faria
Estatistica
UESC/DCET/Brasil
joseclaudio.faria at gmail.com
Telefones:
55(73)3680.5545 - UESC
55(73)9966.9100 - VIVO
55(73)9100.7351 - TIM
55(73)8817.6159 - OI
///\\\///\\\///\\\///\\\///\\\///\\\///\\\///\\\
Mais detalhes sobre a lista de discussão R-br