[R-br] Emprego da PCA para seleção de variáveis mais correlacionadas no primeiro componente principal

Cesar Rabak cesar.rabak em gmail.com
Sexta Maio 4 18:36:34 -03 2018


Sim Alexandre.

Aliás, eu recomendo que você teste os resultados da pesquisa com os
comandos (para os dados e resultados da PCA do seu CMR):

> biplot(pca.object)

e

> biplot(pca.object, choice=2:3)

Nessa representação você pode ver como as variáveis estão correlacionadas
em relação às componentes da PCA *lembrando que a representação por ser
espacial pode ter uma distorção devido às outras dimensões*.

Por isso outros pacotes, como o FactoMiner (um dos meus favoritos junto com
o ade4) permitem que se faça um corte nas variáveis que aparecem nesses
gráficos levando em conta a assim chamada "qualidade da representação" em
cada plano.

Vou eludir discussão sobre um número muito reduzido de casos versus o
número de variáveis neste caso porque entendo que o CMR é só para discutir
a técnica.

HTH

2018-05-03 16:30 GMT-03:00 ASANTOS <alexandre.santos em cas.ifmt.edu.br>:

> Obrigado Cezar,
>
>      Então mudando names(load.rot[,2][order(abs(
> load.rot[,2]),decreasing=TRUE)][1:topN]) e names(load.rot[,3][order(abs(
> load.rot[,3]),decreasing=TRUE)][1:topN]), vou ter as cinco variáveis mais
> correlacionadas com a segunda e terceira componentes principais
> respectivamente?
>
> Novamente obrigado,
>
> Alexandre
>
> --
> ======================================================================
> Alexandre dos Santos
> Proteção Florestal
> IFMT - Instituto Federal de Educação, Ciência e Tecnologia de Mato Grosso
> Campus Cáceres
> Caixa Postal 244
> Avenida dos Ramires, s/n
> Bairro: Distrito Industrial
> Cáceres - MT                      CEP: 78.200-000
> Fone: (+55) 65 99686-6970 (VIVO) (+55) 65 3221-2674 (FIXO)e-mails:alexandresantosbr em yahoo.com.br
>         alexandre.santos em cas.ifmt.edu.br
> Lattes: http://lattes.cnpq.br/1360403201088680
> OrcID: orcid.org/0000-0001-8232-6722   -   ResearcherID: A-5790-2016
> Researchgate: www.researchgate.net/profile/Alexandre_Santos10
> LinkedIn: br.linkedin.com/in/alexandre-dos-santos-87961635Mendeley:www.mendeley.com/profiles/alexandre-dos-santos6/
> ======================================================================
>
> Em 02/05/2018 23:57, Cesar Rabak escreveu:
>
> ##Banco de dados
>
> set.seed(12345)
> mat <- matrix(rnorm(120,0,0.5),nrow=6,byrow=TRUE)
> rownames(mat) <- paste("s",1:6,sep="")
> colnames(mat) <- paste("g",1:20,sep="")
> head(mat)
>
> ## Espectros com maior correlação
> pca.object <- prcomp(mat,center=TRUE,scale.=FALSE)
> plot(pca.object)
>
> #Quero os cinco mais correlacionados
> topN <- 5
> load.rot <- scale(pca.object$rotation)
> names(load.rot[,1][order(abs(load.rot[,1]),decreasing=TRUE)][1:topN])
>
>
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20180504/d48bb059/attachment.html>


Mais detalhes sobre a lista de discussão R-br