[R-br] Emprego da PCA para seleção de variáveis mais correlacionadas no primeiro componente principal
ASANTOS
alexandre.santos em cas.ifmt.edu.br
Sábado Maio 5 09:47:52 -03 2018
Obrigado Cesar e Fernando pelas dicas estão ajudando muito a solidificar
os estudos que venho conduzindo,
Fernando obrigado pelo vídeo, tirando o inglês carregado no francês
que dificulta na compreensão ajudou muito e estou explorando muito a
ferramenta dimdesc().
Cesar, as figuras que me mandou representa bem o que eu quero, qual
a função que utilizou para gerar aquelas figuras de % de contribuição de
cada variável.
Obrigado a ajuda de todos,
--
======================================================================
Alexandre dos Santos
Proteção Florestal
IFMT - Instituto Federal de Educação, Ciência e Tecnologia de Mato Grosso
Campus Cáceres
Caixa Postal 244
Avenida dos Ramires, s/n
Bairro: Distrito Industrial
Cáceres - MT CEP: 78.200-000
Fone: (+55) 65 99686-6970 (VIVO) (+55) 65 3221-2674 (FIXO)
e-mails:alexandresantosbr em yahoo.com.br
alexandre.santos em cas.ifmt.edu.br
Lattes: http://lattes.cnpq.br/1360403201088680
OrcID: orcid.org/0000-0001-8232-6722 - ResearcherID: A-5790-2016
Researchgate: www.researchgate.net/profile/Alexandre_Santos10
LinkedIn: br.linkedin.com/in/alexandre-dos-santos-87961635
Mendeley:www.mendeley.com/profiles/alexandre-dos-santos6/
======================================================================
Em 04/05/2018 17:36, Cesar Rabak escreveu:
> Sim Alexandre.
>
> Aliás, eu recomendo que você teste os resultados da pesquisa com os
> comandos (para os dados e resultados da PCA do seu CMR):
>
> > biplot(pca.object)
>
> e
>
> > biplot(pca.object, choice=2:3)
>
> Nessa representação você pode ver como as variáveis estão
> correlacionadas em relação às componentes da PCA *lembrando que a
> representação por ser espacial pode ter uma distorção devido às outras
> dimensões*.
>
> Por isso outros pacotes, como o FactoMiner (um dos meus favoritos
> junto com o ade4) permitem que se faça um corte nas variáveis que
> aparecem nesses gráficos levando em conta a assim chamada "qualidade
> da representação" em cada plano.
>
> Vou eludir discussão sobre um número muito reduzido de casos versus o
> número de variáveis neste caso porque entendo que o CMR é só para
> discutir a técnica.
>
> HTH
>
> 2018-05-03 16:30 GMT-03:00 ASANTOS <alexandre.santos em cas.ifmt.edu.br
> <mailto:alexandre.santos em cas.ifmt.edu.br>>:
>
> Obrigado Cezar,
>
> Então mudando
> names(load.rot[,2][order(abs(load.rot[,2]),decreasing=TRUE)][1:topN])
> e
> names(load.rot[,3][order(abs(load.rot[,3]),decreasing=TRUE)][1:topN]),
> vou ter as cinco variáveis mais correlacionadas com a segunda e
> terceira componentes principais respectivamente?
>
> Novamente obrigado,
>
> Alexandre
>
> --
> ======================================================================
> Alexandre dos Santos
> Proteção Florestal
> IFMT - Instituto Federal de Educação, Ciência e Tecnologia de Mato Grosso
> Campus Cáceres
> Caixa Postal 244
> Avenida dos Ramires, s/n
> Bairro: Distrito Industrial
> Cáceres - MT CEP: 78.200-000
> Fone: (+55) 65 99686-6970 (VIVO) (+55) 65 3221-2674 (FIXO)
> e-mails:alexandresantosbr em yahoo.com.br
> <mailto:e-mails:alexandresantosbr em yahoo.com.br>
> alexandre.santos em cas.ifmt.edu.br
> <mailto:alexandre.santos em cas.ifmt.edu.br>
> Lattes:http://lattes.cnpq.br/1360403201088680
> <http://lattes.cnpq.br/1360403201088680>
> OrcID:orcid.org/0000-0001-8232-6722 <http://orcid.org/0000-0001-8232-6722> - ResearcherID: A-5790-2016
> Researchgate:www.researchgate.net/profile/Alexandre_Santos10
> <http://www.researchgate.net/profile/Alexandre_Santos10>
> LinkedIn:br.linkedin.com/in/alexandre-dos-santos-87961635
> <http://br.linkedin.com/in/alexandre-dos-santos-87961635>
> Mendeley:www.mendeley.com/profiles/alexandre-dos-santos6/
> ======================================================================
>
> Em 02/05/2018 23:57, Cesar Rabak escreveu:
>> ##Banco de dados
>>
>> set.seed(12345)
>> mat <- matrix(rnorm(120,0,0.5),nrow=6,byrow=TRUE)
>> rownames(mat) <- paste("s",1:6,sep="")
>> colnames(mat) <- paste("g",1:20,sep="")
>> head(mat)
>>
>> ## Espectros com maior correlação
>> pca.object <- prcomp(mat,center=TRUE,scale.=FALSE)
>> plot(pca.object)
>>
>> #Quero os cinco mais correlacionados
>> topN <- 5
>> load.rot <- scale(pca.object$rotation)
>> names(load.rot[,1][order(abs(load.rot[,1]),decreasing=TRUE)][1:topN])
>
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20180505/fee03fc0/attachment.html>
Mais detalhes sobre a lista de discussão R-br