[R-br] matriz correlação

Luciane Maria Pilotto lutipilotto em yahoo.com.br
Terça Dezembro 3 16:28:03 BRST 2013


Oi Alexandre,

Tentei encaminhar o banco todo mas ficou parado no moderador devido ao tamanho. São variáveis do banco da PNAD 2008 e tem mais de 390.000 indivíduos.

Rodei a correlação de Spearman usando o parâmetro use="pairwise.complete.obs" e ficou melhor.

Queria tentar a tetracórica, pois a maior parte das 19 variáveis  são continuas. Idade e rendomexcd são contínuas e tmorador, nivinst, conssaude e qtnecref são categóricas. Porém, mesmo excluindo estas variáveis não consegui rodar a tetracórica. 

Neste momento estou fazendo apenas uma exploração do banco e verificando quais destas variáveis estão correlacionadas entre si.

Atenciosamente,
 
Luciane Maria Pilotto
Mestre e Doutoranda em Saúde Bucal Coletiva - FO/UFRGS


________________________________
 De: Alexandre Serpa <serpa.alexandre em gmail.com>
Para: r-br em listas.c3sl.ufpr.br 
Enviadas: Segunda-feira, 2 de Dezembro de 2013 22:17
Assunto: Re: [R-br] matriz correlação
 


Luciane,

Complementando a orientação do Daniel, caso você queira fazer a correlação ainda com estes dados, você deve mudar o parâmetro "use =" para "pairwise.complete.obs" ou "everything".

Com relação a rodar uma tetracórica, este teste não é o mais adequado já que suas variáveis não são dicotômicas - e nem politômicas para você rodar uma policórica. Você precisa ser mais específica quanto a quais variáveis você quer correlacionar e ter uma hipótese que justifique isso. Observando sua base de dados, você tem variáveis de diferentes tipos (nominais, de razão) e que teoricamente são distintas. Sem contar que você disse que derivou variáveis de outras já presentes é estranho já que ela tende a ser alta por ser componente do índice. A pergunta que resume minhas dúvida é:

Qual a hipótese que você deseja testar?

Abs


Alexandre Serpa

Psicólogo
Especialista em Métodos Computacionais Estatísticos
Mestre em Educação
Doutorando em Psicologia
email:   serpa.alexandre em gmail.com


Em 2 de dezembro de 2013 19:01, Daniel Marcelino <dmarcelino em live.com> escreveu:

Luciane, com os dados que você enviou, a mensagem diz que você não tem dados completos. Ou seja, algumas variáveis (fumocat e excodo2 por exemplo) possuem NAs sufficientes para não permitir produzir pares de comparação.
>
>
>R> matriz=matriz1
>
>
>
>R> matriz$urbrurd <- as.numeric(as.character(matriz$urbrurd))
>R> matriz$racacat <- as.numeric(as.character(matriz$racacat))
>R> matriz$fumocat <- as.numeric(as.character(matriz$fumocat))
>R> matriz$consdent12<- as.numeric(as.character(matriz$consdent12))
>R> matriz$necref<- as.numeric(as.character(matriz$necref))
>R> matriz$excodo2<- as.numeric(as.character(matriz$excodo2))
>R> matriz$planocat<- as.numeric(as.character(matriz$planocat))
>R> matriz$cobraat2<- as.numeric(as.character(matriz$cobraat2))
>
>
>R> is.na(matriz)
>
>
>
>R> cor(matriz, use="everything", method="spearman")
>
>
>
>\begin{signature}
>    Daniel Marcelino
>☁ dm.silva em umontreal.ca 
>☎ 1+(514) 343-6111 #3799
>     Skype: d.marcelino 
>✎ Canada Research Chair in Electoral Studies
>    Université de Montréal
>    C.P. 6128 succursale Centre-ville
>    Montreal, QC, H3C 3J7
>    Canada
>\end{signature}
>
>
>"Small steps towards a much better world"
>
>
>2013/12/2 Luciane Maria Pilotto <lutipilotto em yahoo.com.br>
>
>Olá grupo,
>>
>>
>>
>>estou tentando fazer matriz de correlação de Spearman e tetracórica e não estou conseguindo.estou usando banco com algumas variáveis da PNAD e outras que foram criadas a partir destas. Em anexo, as primeiras observações do banco (matriz1.rda).
>>
>>
>>str(matriz)
>>
>>
>>#Transformando em numericas as variáveis que eram fator
>>
>>
>>matriz$urbrurd <- as.numeric(matriz$urbrurd)
>>matriz$racacat <- as.numeric(matriz$racacat)
>>matriz$fumocat <- as.numeric(matriz$fumocat)
>>matriz$consdent12<- as.numeric(matriz$consdent12)
>>matriz$necref<- as.numeric(matriz$necref)
>>matriz$excodo2<- as.numeric(matriz$excodo2)
>>matriz$planocat<- as.numeric(matriz$planocat)
>>matriz$cobraat2<- as.numeric(matriz$cobraat2)
>>
>>
>>cor(matriz, use="complete.obs", method="spearman")
>>
>>
>># A matriz rodou, porém, não está lendo a variável planocat, alguém pode me ajudar?
>>
>>
>>E preciso rodar a matriz de correlação tetracórica das mesmas variáveis e não estou conseguindo. 
>>
>>
>>tetrachoric(matriz)
>>#Error in FUN(X[[1L]], ...) : 
>>  only defined on a data frame with all numeric variables
>>
>>
>>Tentei transformar as variáveis em fator (as.factor) e tb não deu certo
>>#Error in tetra.mat(x, y = y, correct = correct, smooth = smooth, global = global) : 
>>  Tetrachoric correlations require dictomous data
>>
>>
>>Att., 
>>Luciane Maria Pilotto
>>Mestre e Doutoranda em Saúde Bucal Coletiva - FO/UFRGS
>>
>>
>>
>>
>>_______________________________________________
>>R-br mailing list
>>R-br em listas.c3sl.ufpr.br
>>https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
>>
>>
>
>
>
>_______________________________________________
>R-br mailing list
>R-br em listas.c3sl.ufpr.br
>https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
>


_______________________________________________
R-br mailing list
R-br em listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20131203/2a814ea9/attachment.html>


Mais detalhes sobre a lista de discussão R-br