Oi Alexandre,
Tentei encaminhar o banco todo mas ficou parado no moderador devido ao tamanho. São variáveis do banco da PNAD 2008 e tem mais de 390.000 indivíduos.
Rodei a correlação de Spearman usando o parâmetro use="pairwise.complete.obs" e ficou melhor.
Queria tentar a tetracórica, pois a maior parte das 19 variáveis são continuas. Idade e rendomexcd são
contínuas e tmorador, nivinst, conssaude e qtnecref são categóricas. Porém, mesmo excluindo estas variáveis não consegui rodar a tetracórica.
Neste momento estou fazendo apenas uma exploração do banco e verificando quais destas variáveis estão correlacionadas entre si.
Atenciosamente,
Luciane Maria Pilotto
Mestre e Doutoranda em Saúde Bucal Coletiva - FO/UFRGS
De: Alexandre Serpa <serpa.alexandre@gmail.com>
Para: r-br@listas.c3sl.ufpr.br
Enviadas: Segunda-feira, 2 de Dezembro de 2013 22:17
Assunto: Re: [R-br] matriz correlação
Luciane,
Complementando a orientação do Daniel, caso você queira fazer a correlação ainda com estes dados, você deve mudar o parâmetro "use =" para "pairwise.complete.obs" ou "everything".
Com relação a rodar uma tetracórica, este teste não é o mais adequado já que suas variáveis não são dicotômicas - e nem politômicas para você rodar uma policórica. Você precisa ser mais específica quanto a quais variáveis você quer correlacionar e ter uma hipótese que justifique isso. Observando sua base de dados, você tem variáveis de diferentes tipos (nominais, de razão) e que teoricamente são distintas. Sem contar que você disse que derivou variáveis de outras já presentes é estranho já que ela tende a ser alta por ser componente do índice. A pergunta que resume minhas dúvida é:
Qual a hipótese que você deseja testar?
Abs