Encaro como preferência pessoal ou falta de especificação mais detalhada de critério de seleção.
1. Vou ficar com o modelo que der o menor AIC. É um critério de informação. Mesmo que hajam parâmetros não significativos, a remoção deles do modelo ou ajustar um modelo menor que seja encaixado, prejudica/viola outras coisas (interpretação, predição, etc).
2. Vou adotar a abordagem de ter o modelo mais parcimonioso, ajustando o modelo encaixado conforme indicado pelo teste de hipótese sobre os parâmetros.

Muitas vezes o teste aplicado é assintótico e a não rejeição da hipótese nula decorre que propriedades do teste em pequenas amostras. A gente percebe isso quando compara um teste de Wald contra o de razão de verossimilhanças. Os resultados podem ser bem diferentes para parâmetros da estrutura de covariância (como variância e correlações).

À disposição.
Walmes.