[R-br] Fwd: Análise de componentes principais (PCA) - ajuda
Augusto Ribas
ribas.aca em gmail.com
Domingo Agosto 10 21:50:28 BRT 2014
Ola Bianca, uma possibilidade seria usar algum tipo de transformação para
os dados.
Por exemplo, o pacote vegan do R tem uma função chamada decostand que tem
um número de possibilidades comuns para essas transformações, usadas em
comumente em ordenações. Segue dois exemplos que "desembolam" um pouco o
seu gráfico.
dados<-read.csv2("./Downloads/15C.csv",h=T, row.names=1,stringsAsFactors =F)
dados<-apply(dados,2,as.numeric)
str(dados)
pca1<-princomp(dados)
biplot(pca1)
##############################
library(vegan)
pca2<-princomp(decostand(dados,"normalize",2))
biplot(pca2)
##################################
pca3<-princomp(decostand(dados,"max",2))
biplot(pca3)
Mas seria importante dar uma boa olhada na literatura sobre transformações
para ordenações, ja que elas tem muitas vezes um impacto sobre o que
estamos vendo, o que muitas vezes é o nosso interesse, ja que os pontos
ficarem aglomerados pode ser devido a escalas em que as medidas são feitas,
por exemplo. Bem talvez alguém ainda tenha sugestões melhores, mas essas
transformações podem ser uma boa possibilidade.
Em 10 de agosto de 2014 19:42, Bianca Schindler <bia.schindler em gmail.com>
escreveu:
> Olá pessoal!
>
> Meu nome é Bianca Schindler, sou mestranda em Engenharia Florestal pela
> UFSM.
> Estou tentando realizar uma PCA ou ACP (análise de componentes principais)
> com alguns dados da minha dissertação, porém no gráfico da ordenação os
> vetores que seriam os descritores estão muito aglomerados de forma que não
> é possível observá-los. Gostaria de expandir estes eixos para poder
> observar quais são os respectivos "descritores" dos "objetos". Neste caso,
> os dados que trabalho os descritores seriam constituintes químicos do óleo
> essencial e os objetos os órgãos vegetais de onde foram extraídos.
>
> O pacote utilizado é o "*stats*"
> O scrip utilizado segue abaixo:
>
> #Principal Components Analysis
> getwd()
> dir()
> dados=read.csv("dados.csv", h=T, row.names=1, sep=";")
> dados
> require(stats)
> prcomp(dados, scale = FALSE)
> plot(prcomp(dados))
> summary(prcomp(dados, scale = FALSE))
> biplot(prcomp(dados), col = c("black", "blue"), main="ACP - Análise de
> Componente Principais", xlab = "Componente 1(colocar a proporção da
> variância%)", ylab = "Componente 2 (colocar a proporção da variância%)")
>
> Em anexo segue a imagem da ordenação. Onde em azul são os vetores
> aglomerados (descritores), os quais quero expandir. As demais siglas são os
> objetos.
>
> Obs: Caso alguém precise dos dados, segue o link:
> http://www.datafilehost.com/d/29e3f3bc.
>
> Agradeço a atenção e qualquer ajuda.
>
> Atenciosamente,
>
> Bianca Schindler.
>
>
>
> --
> Bianca Schindler.
> Mestranda em Engenharia Florestal - UFSM.
> Laboratório de Extrativos Vegetais (LABEVE)
> Tel: (55) 9661-7429.
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
--
Grato
Augusto C. A. Ribas
Site Pessoal: http://recologia.com.br/ <http://augustoribas.heliohost.org>
Github: https://github.com/Squiercg
Lattes: http://lattes.cnpq.br/7355685961127056
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20140810/3e7b8fa3/attachment-0001.html>
Mais detalhes sobre a lista de discussão R-br