Professores,

Eu tenho uma base de dados com variáveis dummies e gostaria de fazer uma redução de dimensionalidade.
Inicialmente pensei em uma análise fatorial com correlação tetracórica.
Porém, a matriz de correlação tinha correlações unitárias fora da diagonal principal sem razão aparente (olhando o gráfico, havia pontos nos quatro quadrantes, mas mesmo assim a correlação dava 1!)

Como minhas variáveis não são discretizações de variáveis contínuas, não sei se o uso de correlação tetracórica é adequado.
Pensei em usar o phi de Pearson como medida de correlação, mas ele dá idêntico à correlação de Pearson.
Outra idéia foi fazer a extração usando análie por componentes principais para dados categóricos (CATPCA) mas, pelo que andei pesquisando, o resultado não dá muito diferente de uma análise fatorial convencional (com correlação de Pearson e extração por PCA)

Eu queria poder contar com uma opinião sobre o que fazer:

Usar correlação tetracórica (neste caso, como eu resolvo o fato da matriz de correlação não ser positiva semidefinida?)

Usar o phi de Pearson como medida de correlaçao

Usar a correlação de Pearson, pura se simplesmente

Extrair os fatores por CATPCA

ou outra alternativa, que é sempre bem-vinda.

Desde já agradeço a atenção e a colaboração,

Felipe Buchbinder