[R-br] Duvidas Análise de Componentes Principais

Cesar Rabak cesar.rabak em gmail.com
Seg Dez 7 17:08:04 -02 2020


OK Nei!

A interpretação, obviamente *não deveria* ser diferente em função da
linguagem e implementação da técnica, mas na prática... há uns óbices que
precisam ser levados em conta:

1) O diagrama que indica as componentes principais pode ter os 'sinais
trocados' nos eixos devido a forma como são calculados os autovetores e
autovalores;
2) No caso dos biplots há três maneiras de representá-los, com as "flechas"
neles tendo significado métrico levemente diferente na hora de interpretar;
3) Algumas implementações oferecem mais objetos de análise em adição às
tabelas decorrentes dos cálculos das componentes principais.

Essas diferenças podem ser vistas no próprio R com as várias funções para
produzir a análise (number crunching) e os gráficos em pacotes diversos.

OK quanto ao latim 🤓. Nos países de língua inglesa é muito usada porque
nos contratos "padrão" de venda essa expressão advinda do jargão legal caiu
no uso devido à repetição em contratos, avisos dos órgãos de proteção ao
consumidor, etc. A própria palavra *caveat *sozinha às vezes é usada na
conversa cotidiana.

Qtº a ficar mais chique,  existe um aforismo, em latim é claro sobre isso¹:
QUIDQUID LATINE DICTUM SIT ALTUM VIDETUR!!

[]s
--
Cesar Rabak

[1] “O que é dito em latim soa profundo”.

On Mon, Dec 7, 2020 at 11:34 AM Nei por (R-br) <r-br em listas.c3sl.ufpr.br>
wrote:

> Oi Cesar,
>
> Você tem razão, os links apontam para tutoriais sobre PCA que utilizam o
> Python como ferramenta computacional.
>
> Mas eu compartilhei os links pois a pergunta se referia à interpretação
> dos resultados de PCA, e não ao uso da ferramenta R.
>
> E nesses tutoriais eu procurei discutir alguns conceitos sobre a técnica
> estatística, independente da ferramenta computacional usada, e que poderiam
> ser úteis para o Fernando.
>
> Obrigado pela expressão "caveat emptor". Aprendi mais uma.
>
> Entendi como um sinônimo de "disclaimer".
>
> Vou incluir no meu site pra ficar mais "chique". :-)
>
> Um Abraço,
>
> Markos
>
> Em 07-12-2020 10:13, Cesar Rabak por (R-br) escreveu:
>
> Só agora pude dar uma vista d'olhos nas referências indicadas.
>
> Um senão (*caveat emptor*) precisa ser colocado: os exemplos usam Python
> e não R.
>
> HTH
>
> On Thu, Apr 23, 2020 at 11:10 PM Nei por (R-br) <r-br em listas.c3sl.ufpr.br>
> wrote:
>
>> http://www.c2o.pro.br/hackaguas/apx.html
>>
>> http://www.c2o.pro.br/hackaguas/apxs02.html
>>
>> Em 22-04-2020 18:25, Fernando Souza por (R-br) escreveu:
>>
>> Olá pessoal tudo bem
>>
>> Estou realizando uma análise de componentes principais, com o objetivo de
>> selecionar as melhores variáveis para uma análise multivariada.
>>
>> Gostaria de uma orientação sobre a  interpretação. Eu interpretei de
>> forma correta? Variáveis que possuem alta correlação com um CP também estão
>> correlacionadas entre si. Isso significa que posso utilizar somente uma das
>> principais variáveis do CP1 (por exemplo) para incluir no modelo
>> multivariado? No caso a variável que apresentar significado para o trabalho.
>>
>> Os círculos de correlação, screem plot e corrplot geradas pelo Pca estão
>> disponíveis no link
>> https://drive.google.com/open?id=1jS5tCX-2-qHo2Gbej00DkFQBpLztwXks
>>
>> A interpretação que fiz foi a seguinte:
>>
>> Considerei as variáveis PC,IC e Prod leite (Azul no gráfico) como
>> variável suplementar quantitativa.  Baseado no ScreenPlot selecionei
>> somente 5 CP para avaliação que explicaram 67,80% da variancia total. Pela
>> minha interpretação cheguei as seguintes conclusões
>>
>> Principais variáveis para cada componente:
>>
>> Consumos (CP1): CMS,CMO,CPB,CEE,CCNF,CFDNcp,CFDA,CNDT,CEB,CED,CEM,CEL
>>
>> Energia (CP2) : EB,ED,EM,EL
>>
>> Peso (CP3): PV,PCJ,PCVZ,PCVZ075
>>
>> Composição do Leite(CP4) : Solido e DCNF
>>
>> Variaveis sanguíneas (CP5): PT e ALBUMINA
>>
>>
>>
>> Segue uma descrição do trabalho para compreensão. Aceito sugestões sobre
>> a melhor forma trabalhar esses dados
>>
>> O banco de dados é oriundo  dois estudos realizados pelo mesmo grupo de
>> pesquisa nas mesmas condições experimentais
>> (animais,instalação,dieta,manejo) e avaliaram 48 variáveis.
>> Os fatores experimentais foram:
>> *Raça*: Estudo 1 avaliou 12 animais (6 raça1 e 6 da raça 2). O estudo 2
>> avaliou 13 animais (6 raça 1 e 7 raça 2)
>> *Plano nutricional:*  O estudo 1 avaliou os níveis (0,15,30) o estudo 2
>> avaliou os níveis (0,5,10,20)
>> *Dias em lactação-DEL* (medidas repetidas no tempo):  Estudo 1, dias
>> dispersos entre os períodos de 30 a 120 dias. No estudo 2 os DEL foram
>> avaliados em dias entre 150 a 250 dias.
>>
>>
>> Eu realizei uma análise gráfica e não há indicações de haver diferenças
>> entre estudos, o que era de certo modo esperado. Raça e DEL parecem ser os
>> fatores que afetam as variáveis respostas.
>>
>>
>>
>> --
>> =========================================
>> Fernando Souza
>> Zootecnista, DSc. Produção e Alimentação Animal
>> Celular: (31)99796-8781 (Vivo)
>> E-mail:nandodesouza em gmail.com <e-mail%3Anandodesouza em gmail.com>
>> Lattes: http://lattes.cnpq.br/6519538815038307
>> Blog: https://producaoanimalcomr.wordpress.com/
>> ==========================================
>>
>>
>> _______________________________________________
>> R-br mailing listR-br em listas.c3sl.ufpr.brhttps://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
>>
>>
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>>
>
>
> _______________________________________________
> R-br mailing listR-br em listas.c3sl.ufpr.brhttps://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20201207/6d7fd6ae/attachment.html>


Mais detalhes sobre a lista de discussão R-br