[R-br] Duvidas Análise de Componentes Principais

Nei c2o.pro.br em gmail.com
Qua Dez 9 14:38:50 -02 2020


Bom Dia Cesar,

Obrigado pelas dicas sobre PCA.

Eu já tinha percebido a questão dos "sinais trocados" quando se usa 
Matlab ou Python.

E obrigado por mais uma expressão latina para a minha coleção. :-)

Um Abraço,

Markos


Em 07-12-2020 16:08, Cesar Rabak escreveu:
> OK Nei!
>
> A interpretação, obviamente /não deveria/ ser diferente em função da 
> linguagem e implementação da técnica, mas na prática... há uns óbices 
> que precisam ser levados em conta:
>
> 1) O diagrama que indica as componentes principais pode ter os 'sinais 
> trocados' nos eixos devido a forma como são calculados os autovetores 
> e autovalores;
> 2) No caso dos biplots há três maneiras de representá-los, com as 
> "flechas" neles tendo significado métrico levemente diferente na hora 
> de interpretar;
> 3) Algumas implementações oferecem mais objetos de análise em adição 
> às tabelas decorrentes dos cálculos das componentes principais.
>
> Essas diferenças podem ser vistas no próprio R com as várias funções 
> para produzir a análise (number crunching) e os gráficos em pacotes 
> diversos.
>
> OK quanto ao latim 🤓. Nos países de língua inglesa é muito usada 
> porque nos contratos "padrão" de venda essa expressão advinda do 
> jargão legal caiu no uso devido à repetição em contratos, avisos dos 
> órgãos de proteção ao consumidor, etc. A própria palavra /caveat 
> /sozinha às vezes é usada na conversa cotidiana.
>
> Qtº a ficar mais chique,  existe um aforismo, em latim é claro sobre 
> isso¹: QUIDQUID LATINE DICTUM SIT ALTUM VIDETUR!!
>
> []s
> --
> Cesar Rabak
>
> [1] “O que é dito em latim soa profundo”.
>
> On Mon, Dec 7, 2020 at 11:34 AM Nei por (R-br) 
> <r-br em listas.c3sl.ufpr.br <mailto:r-br em listas.c3sl.ufpr.br>> wrote:
>
>     Oi Cesar,
>
>     Você tem razão, os links apontam para tutoriais sobre PCA que
>     utilizam o Python como ferramenta computacional.
>
>     Mas eu compartilhei os links pois a pergunta se referia à
>     interpretação dos resultados de PCA, e não ao uso da ferramenta R.
>
>     E nesses tutoriais eu procurei discutir alguns conceitos sobre a
>     técnica estatística, independente da ferramenta computacional
>     usada, e que poderiam ser úteis para o Fernando.
>
>     Obrigado pela expressão "caveat emptor". Aprendi mais uma.
>
>     Entendi como um sinônimo de "disclaimer".
>
>     Vou incluir no meu site pra ficar mais "chique". :-)
>
>     Um Abraço,
>
>     Markos
>
>
>     Em 07-12-2020 10:13, Cesar Rabak por (R-br) escreveu:
>>     Só agora pude dar uma vista d'olhos nas referências indicadas.
>>
>>     Um senão (/caveat emptor/) precisa ser colocado: os exemplos usam
>>     Python e não R.
>>
>>     HTH
>>
>>     On Thu, Apr 23, 2020 at 11:10 PM Nei por (R-br)
>>     <r-br em listas.c3sl.ufpr.br <mailto:r-br em listas.c3sl.ufpr.br>> wrote:
>>
>>         http://www.c2o.pro.br/hackaguas/apx.html
>>
>>         http://www.c2o.pro.br/hackaguas/apxs02.html
>>
>>
>>         Em 22-04-2020 18:25, Fernando Souza por (R-br) escreveu:
>>>         Olá pessoal tudo bem
>>>
>>>         Estou realizando uma análise de componentes principais, com
>>>         o objetivo de selecionar as melhores variáveis para uma
>>>         análise multivariada.
>>>
>>>         Gostaria de uma orientação sobre a interpretação. Eu
>>>         interpretei de forma correta? Variáveis que possuem alta
>>>         correlação com um CP também estão correlacionadas entre si.
>>>         Isso significa que posso utilizar somente uma das principais
>>>         variáveis do CP1 (por exemplo) para incluir no modelo
>>>         multivariado? No caso a variável que apresentar significado
>>>         para o trabalho.
>>>
>>>         Os círculos de correlação, screem plot e corrplot geradas
>>>         pelo Pca estão disponíveis no link
>>>         https://drive.google.com/open?id=1jS5tCX-2-qHo2Gbej00DkFQBpLztwXks
>>>
>>>         A interpretação que fiz foi a seguinte:
>>>
>>>         Considerei as variáveis PC,IC e Prod leite (Azul no gráfico)
>>>         como variável suplementar quantitativa.  Baseado no
>>>         ScreenPlot selecionei somente 5 CP para avaliação que
>>>         explicaram 67,80% da variancia total. Pela minha
>>>         interpretação cheguei as seguintes conclusões
>>>
>>>         Principais variáveis para cada componente:
>>>
>>>         Consumos (CP1):
>>>         CMS,CMO,CPB,CEE,CCNF,CFDNcp,CFDA,CNDT,CEB,CED,CEM,CEL
>>>
>>>         Energia (CP2) : EB,ED,EM,EL
>>>
>>>         Peso (CP3): PV,PCJ,PCVZ,PCVZ075
>>>
>>>         Composição do Leite(CP4) : Solido e DCNF
>>>
>>>         Variaveis sanguíneas (CP5): PT e ALBUMINA
>>>
>>>
>>>
>>>         Segue uma descrição do trabalho para compreensão. Aceito
>>>         sugestões sobre a melhor forma trabalhar esses dados
>>>
>>>         O banco de dados é oriundo  dois estudos realizados pelo
>>>         mesmo grupo de pesquisa nas mesmas condições experimentais
>>>         (animais,instalação,dieta,manejo) e avaliaram 48 variáveis.
>>>         Os fatores experimentais foram:
>>>         *Raça*: Estudo 1 avaliou 12 animais (6 raça1 e 6 da raça 2).
>>>         O estudo 2 avaliou 13 animais (6 raça 1 e 7 raça 2)
>>>         *Plano nutricional:*  O estudo 1 avaliou os níveis (0,15,30)
>>>         o estudo 2 avaliou os níveis (0,5,10,20)
>>>         *Dias em lactação-DEL* (medidas repetidas no tempo):  Estudo
>>>         1, dias dispersos entre os períodos de 30 a 120 dias. No
>>>         estudo 2 os DEL foram avaliados em dias entre 150 a 250 dias.
>>>
>>>
>>>         Eu realizei uma análise gráfica e não há indicações de haver
>>>         diferenças entre estudos, o que era de certo modo esperado.
>>>         Raça e DEL parecem ser os fatores que afetam as variáveis
>>>         respostas.
>>>
>>>
>>>
>>>         -- 
>>>         =========================================
>>>         Fernando Souza
>>>         Zootecnista, DSc. Produção e Alimentação Animal
>>>         Celular: (31)99796-8781 (Vivo)
>>>         E-mail:nandodesouza em gmail.com
>>>         <mailto:e-mail%3Anandodesouza em gmail.com>
>>>         Lattes: http://lattes.cnpq.br/6519538815038307
>>>         Blog: https://producaoanimalcomr.wordpress.com/
>>>         ==========================================
>>>
>>>
>>>         _______________________________________________
>>>         R-br mailing list
>>>         R-br em listas.c3sl.ufpr.br <mailto:R-br em listas.c3sl.ufpr.br>
>>>         https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>         Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
>>
>>         _______________________________________________
>>         R-br mailing list
>>         R-br em listas.c3sl.ufpr.br <mailto:R-br em listas.c3sl.ufpr.br>
>>         https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>         Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e
>>         forneça código mínimo reproduzível.
>>
>>
>>
>>     _______________________________________________
>>     R-br mailing list
>>     R-br em listas.c3sl.ufpr.br <mailto:R-br em listas.c3sl.ufpr.br>
>>     https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>     Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
>
>     _______________________________________________
>     R-br mailing list
>     R-br em listas.c3sl.ufpr.br <mailto:R-br em listas.c3sl.ufpr.br>
>     https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>     Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e
>     forneça código mínimo reproduzível.
>

-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20201209/03a1f5f3/attachment.html>


Mais detalhes sobre a lista de discussão R-br