OK Nei!

A interpretação, obviamente não deveria ser diferente em função da linguagem e implementação da técnica, mas na prática... há uns óbices que precisam ser levados em conta:

1) O diagrama que indica as componentes principais pode ter os 'sinais trocados' nos eixos devido a forma como são calculados os autovetores e autovalores;
2) No caso dos biplots há três maneiras de representá-los, com as "flechas" neles tendo significado métrico levemente diferente na hora de interpretar;
3) Algumas implementações oferecem mais objetos de análise em adição às tabelas decorrentes dos cálculos das componentes principais.

Essas diferenças podem ser vistas no próprio R com as várias funções para produzir a análise (number crunching) e os gráficos em pacotes diversos.

OK quanto ao latim 🤓. Nos países de língua inglesa é muito usada porque nos contratos "padrão" de venda essa expressão advinda do jargão legal caiu no uso devido à repetição em contratos, avisos dos órgãos de proteção ao consumidor, etc. A própria palavra caveat sozinha às vezes é usada na conversa cotidiana.

Qtº a ficar mais chique,  existe um aforismo, em latim é claro sobre isso¹: QUIDQUID LATINE DICTUM SIT ALTUM VIDETUR!!

[]s
--
Cesar Rabak

[1] “O que é dito em latim soa profundo”.

On Mon, Dec 7, 2020 at 11:34 AM Nei por (R-br) <r-br@listas.c3sl.ufpr.br> wrote:

Oi Cesar,

Você tem razão, os links apontam para tutoriais sobre PCA que utilizam o Python como ferramenta computacional.

Mas eu compartilhei os links pois a pergunta se referia à interpretação dos resultados de PCA, e não ao uso da ferramenta R.

E nesses tutoriais eu procurei discutir alguns conceitos sobre a técnica estatística, independente da ferramenta computacional usada, e que poderiam ser úteis para o Fernando.

Obrigado pela expressão "caveat emptor". Aprendi mais uma.

Entendi como um sinônimo de "disclaimer".

Vou incluir no meu site pra ficar mais "chique". :-)

Um Abraço,

Markos


Em 07-12-2020 10:13, Cesar Rabak por (R-br) escreveu:
Só agora pude dar uma vista d'olhos nas referências indicadas.

Um senão (caveat emptor) precisa ser colocado: os exemplos usam Python e não R.

HTH

On Thu, Apr 23, 2020 at 11:10 PM Nei por (R-br) <r-br@listas.c3sl.ufpr.br> wrote:

http://www.c2o.pro.br/hackaguas/apx.html

http://www.c2o.pro.br/hackaguas/apxs02.html


Em 22-04-2020 18:25, Fernando Souza por (R-br) escreveu:
Olá pessoal tudo bem

Estou realizando uma análise de componentes principais, com o objetivo de selecionar as melhores variáveis para uma análise multivariada. 

Gostaria de uma orientação sobre a  interpretação. Eu interpretei de forma correta? Variáveis que possuem alta correlação com um CP também estão correlacionadas entre si. Isso significa que posso utilizar somente uma das principais variáveis do CP1 (por exemplo) para incluir no modelo multivariado? No caso a variável que apresentar significado para o trabalho.

Os círculos de correlação, screem plot e corrplot geradas pelo Pca estão disponíveis no link

A interpretação que fiz foi a seguinte:

Considerei as variáveis PC,IC e Prod leite (Azul no gráfico) como variável suplementar quantitativa.  Baseado no ScreenPlot selecionei somente 5 CP para avaliação que explicaram 67,80% da variancia total. Pela minha interpretação cheguei as seguintes conclusões

Principais variáveis para cada componente:

Consumos (CP1): CMS,CMO,CPB,CEE,CCNF,CFDNcp,CFDA,CNDT,CEB,CED,CEM,CEL

Energia (CP2) : EB,ED,EM,EL

Peso (CP3): PV,PCJ,PCVZ,PCVZ075

Composição do Leite(CP4) : Solido e DCNF

Variaveis sanguíneas (CP5): PT e ALBUMINA



Segue uma descrição do trabalho para compreensão. Aceito sugestões sobre a melhor forma trabalhar esses dados

O banco de dados é oriundo  dois estudos realizados pelo mesmo grupo de pesquisa nas mesmas condições experimentais (animais,instalação,dieta,manejo) e avaliaram 48 variáveis.
Os fatores experimentais foram:
Raça: Estudo 1 avaliou 12 animais (6 raça1 e 6 da raça 2). O estudo 2 avaliou 13 animais (6 raça 1 e 7 raça 2)
Plano nutricional:  O estudo 1 avaliou os níveis (0,15,30) o estudo 2 avaliou os níveis (0,5,10,20)
Dias em lactação-DEL (medidas repetidas no tempo):  Estudo 1, dias dispersos entre os períodos de 30 a 120 dias. No estudo 2 os DEL foram avaliados em dias entre 150 a 250 dias.


Eu realizei uma análise gráfica e não há indicações de haver diferenças entre estudos, o que era de certo modo esperado. Raça e DEL parecem ser os fatores que afetam as variáveis respostas.



--
=========================================
Fernando Souza
Zootecnista, DSc. Produção e Alimentação Animal
Celular: (31)99796-8781 (Vivo)
E-mail:nandodesouza@gmail.com
Lattes: http://lattes.cnpq.br/6519538815038307
Blog: https://producaoanimalcomr.wordpress.com/
==========================================


_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.


_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.