Oi Alexandre,

Tentei encaminhar o banco todo mas ficou parado no moderador devido ao tamanho. São variáveis do banco da PNAD 2008 e tem mais de 390.000 indivíduos.

Rodei a correlação de Spearman usando o parâmetro use="pairwise.complete.obs" e ficou melhor.

Queria tentar a tetracórica, pois a maior parte das 19 variáveis  são continuas. Idade e rendomexcd são contínuas e tmorador, nivinst, conssaude e qtnecref são categóricas. Porém, mesmo excluindo estas variáveis não consegui rodar a tetracórica. 

Neste momento estou fazendo apenas uma exploração do banco e verificando quais destas variáveis estão correlacionadas entre si.

Atenciosamente,
 
Luciane Maria Pilotto
Mestre e Doutoranda em Saúde Bucal Coletiva - FO/UFRGS


De: Alexandre Serpa <serpa.alexandre@gmail.com>
Para: r-br@listas.c3sl.ufpr.br
Enviadas: Segunda-feira, 2 de Dezembro de 2013 22:17
Assunto: Re: [R-br] matriz correlação

Luciane,

Complementando a orientação do Daniel, caso você queira fazer a correlação ainda com estes dados, você deve mudar o parâmetro "use =" para "pairwise.complete.obs" ou "everything".

Com relação a rodar uma tetracórica, este teste não é o mais adequado já que suas variáveis não são dicotômicas - e nem politômicas para você rodar uma policórica. Você precisa ser mais específica quanto a quais variáveis você quer correlacionar e ter uma hipótese que justifique isso. Observando sua base de dados, você tem variáveis de diferentes tipos (nominais, de razão) e que teoricamente são distintas. Sem contar que você disse que derivou variáveis de outras já presentes é estranho já que ela tende a ser alta por ser componente do índice. A pergunta que resume minhas dúvida é:

Qual a hipótese que você deseja testar?

Abs

Alexandre Serpa

Psicólogo
Especialista em Métodos Computacionais Estatísticos
Mestre em Educação
Doutorando em Psicologia
email:   serpa.alexandre@gmail.com


Em 2 de dezembro de 2013 19:01, Daniel Marcelino <dmarcelino@live.com> escreveu:
Luciane, com os dados que você enviou, a mensagem diz que você não tem dados completos. Ou seja, algumas variáveis (fumocat e excodo2 por exemplo) possuem NAs sufficientes para não permitir produzir pares de comparação.

R> matriz=matriz1

R> matriz$urbrurd <- as.numeric(as.character(matriz$urbrurd))
R> matriz$racacat <- as.numeric(as.character(matriz$racacat))
R> matriz$fumocat <- as.numeric(as.character(matriz$fumocat))
R> matriz$consdent12<- as.numeric(as.character(matriz$consdent12))
R> matriz$necref<- as.numeric(as.character(matriz$necref))
R> matriz$excodo2<- as.numeric(as.character(matriz$excodo2))
R> matriz$planocat<- as.numeric(as.character(matriz$planocat))
R> matriz$cobraat2<- as.numeric(as.character(matriz$cobraat2))

R> is.na(matriz)

R> cor(matriz, use="everything", method="spearman")

\begin{signature}
    Daniel Marcelino
☁ dm.silva@umontreal.ca 
☎ 1+(514) 343-6111 #3799
     Skype: d.marcelino 
✎ Canada Research Chair in Electoral Studies
    Université de Montréal
    C.P. 6128 succursale Centre-ville
    Montreal, QC, H3C 3J7
    Canada
\end{signature}

"Small steps towards a much better world"


2013/12/2 Luciane Maria Pilotto <lutipilotto@yahoo.com.br>
Olá grupo,

estou tentando fazer matriz de correlação de Spearman e tetracórica e não estou conseguindo.estou usando banco com algumas variáveis da PNAD e outras que foram criadas a partir destas. Em anexo, as primeiras observações do banco (matriz1.rda).

str(matriz)

#Transformando em numericas as variáveis que eram fator

matriz$urbrurd <- as.numeric(matriz$urbrurd)
matriz$racacat <- as.numeric(matriz$racacat)
matriz$fumocat <- as.numeric(matriz$fumocat)
matriz$consdent12<- as.numeric(matriz$consdent12)
matriz$necref<- as.numeric(matriz$necref)
matriz$excodo2<- as.numeric(matriz$excodo2)
matriz$planocat<- as.numeric(matriz$planocat)
matriz$cobraat2<- as.numeric(matriz$cobraat2)

cor(matriz, use="complete.obs", method="spearman")

# A matriz rodou, porém, não está lendo a variável planocat, alguém pode me ajudar?

E preciso rodar a matriz de correlação tetracórica das mesmas variáveis e não estou conseguindo. 

tetrachoric(matriz)
#Error in FUN(X[[1L]], ...) : 
  only defined on a data frame with all numeric variables

Tentei transformar as variáveis em fator (as.factor) e tb não deu certo
#Error in tetra.mat(x, y = y, correct = correct, smooth = smooth, global = global) : 
  Tetrachoric correlations require dictomous data

Att., 
Luciane Maria Pilotto
Mestre e Doutoranda em Saúde Bucal Coletiva - FO/UFRGS




_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.



_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.


_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.