[R-br] Duvidas Análise de Componentes Principais

Cesar Rabak cesar.rabak em gmail.com
Qui Abr 23 21:10:18 -03 2020


Os mapas de indivíduos para as duas primeiras dimensões mostram que há uma
melhor representatividade dos valores extremos (v. Plano.png) onde o cos² é
maior.

Para as três variáveis categóricas que você usou (raças, planos e vol.
conc) as elipses de confiança (que presumo sejam 95%) indicam que para essa
amostra os dados não indicam diferenças com significância estatística
dentro dos limiares usuais.

Minhas referências de estudo para esse assunto :

Foucart, T. L’analyse des données, mode d’emploi : méthodes et études de cas.
Rennes.] Presses Univ. de Rennes, 1997.
Escofier, B.; Pagès, J. Analyses factorielles simples et multiples:
Objectifs, méthodes et interprétation. Paris. Dunod, 2008.

A última trabalha bem a questão da interpretação com casos mais recentes,
embora a primeira seja bem equilibrada entre teoria e exemplos práticos.

Há material na Internet, mas não posso opinar sobre eles, inclusive vídeos.

HTH
--
Cesar Rabak


On Thu, Apr 23, 2020 at 4:57 PM Fernando Souza por (R-br) <
r-br em listas.c3sl.ufpr.br> wrote:

> Olá Cesar
>
> Obrigado pelo retorno!
>
> Eu montei os gráficos (mapa de indivíduos) conforme sugerido e adicionei
> no link. Você poderia me orientar sobre a interpretação. Eu fiz uma aqui
> mas não estou seguro e gostaria de ouvir a opinião de alguém mais
> experiente para comparar com as que fiz. Você poderia me dizer o que pode
> concluir dos gráficos?
>
> https://drive.google.com/open?id=1jS5tCX-2-qHo2Gbej00DkFQBpLztwXks
>
> Aproveito para pedir dicas de boas referencias para estudo, principalmente
> como tirar as conclusões do PCA para o modelo.
>
> Atenciosamente
>
>
>
>
>
> Em qua., 22 de abr. de 2020 às 22:03, Cesar Rabak por (R-br) <
> r-br em listas.c3sl.ufpr.br> escreveu:
>
>> Fernando,
>>
>> Há dois aspectos a ser vistos na sua ACP.
>>
>> O número de variáveis que você tem antes da ACP e número de casos para
>> você fazer uma análise multivariada (nos dois casos).
>>
>> Um gráfico muito interessante para auxiliá-lo a decidir sobre seus
>> resultados é o "mapa de indivíduos" que plota cada caso no plano das CP,
>> sendo as primeiras componentes as mais "interessantes" posto que "espalham"
>> mais os dados por terem sido resultado de uma operação matemática que
>> maximiza a variâncias nesses dados.
>>
>> Nesses mapas de indivíduos você pode rotular com cores ou símbolos
>> aspectos da sua investigação.
>>
>> O uso das primeiras CP usando o diagrama *scree* ajuda, *mas* a
>> interpretação da multivariada que você venha a fazer precisará de mais
>> trabalho, porém você escapa do problema de ter mais variáveis que casos,
>> que exigiria uso de técnicas de validação cruzada, etc.
>>
>> HTH
>> --
>> Cesar Rabak
>>
>>
>> On Wed, Apr 22, 2020 at 6:26 PM Fernando Souza por (R-br) <
>> r-br em listas.c3sl.ufpr.br> wrote:
>>
>>> Olá pessoal tudo bem
>>>
>>> Estou realizando uma análise de componentes principais, com o objetivo
>>> de selecionar as melhores variáveis para uma análise multivariada.
>>>
>>> Gostaria de uma orientação sobre a  interpretação. Eu interpretei de
>>> forma correta? Variáveis que possuem alta correlação com um CP também estão
>>> correlacionadas entre si. Isso significa que posso utilizar somente uma das
>>> principais variáveis do CP1 (por exemplo) para incluir no modelo
>>> multivariado? No caso a variável que apresentar significado para o trabalho.
>>>
>>> Os círculos de correlação, screem plot e corrplot geradas pelo Pca estão
>>> disponíveis no link
>>> https://drive.google.com/open?id=1jS5tCX-2-qHo2Gbej00DkFQBpLztwXks
>>>
>>> A interpretação que fiz foi a seguinte:
>>>
>>> Considerei as variáveis PC,IC e Prod leite (Azul no gráfico) como
>>> variável suplementar quantitativa.  Baseado no ScreenPlot selecionei
>>> somente 5 CP para avaliação que explicaram 67,80% da variancia total. Pela
>>> minha interpretação cheguei as seguintes conclusões
>>>
>>> Principais variáveis para cada componente:
>>>
>>> Consumos (CP1): CMS,CMO,CPB,CEE,CCNF,CFDNcp,CFDA,CNDT,CEB,CED,CEM,CEL
>>>
>>> Energia (CP2) : EB,ED,EM,EL
>>>
>>> Peso (CP3): PV,PCJ,PCVZ,PCVZ075
>>>
>>> Composição do Leite(CP4) : Solido e DCNF
>>>
>>> Variaveis sanguíneas (CP5): PT e ALBUMINA
>>>
>>>
>>>
>>> Segue uma descrição do trabalho para compreensão. Aceito sugestões sobre
>>> a melhor forma trabalhar esses dados
>>>
>>> O banco de dados é oriundo  dois estudos realizados pelo mesmo grupo de
>>> pesquisa nas mesmas condições experimentais
>>> (animais,instalação,dieta,manejo) e avaliaram 48 variáveis.
>>> Os fatores experimentais foram:
>>> *Raça*: Estudo 1 avaliou 12 animais (6 raça1 e 6 da raça 2). O estudo 2
>>> avaliou 13 animais (6 raça 1 e 7 raça 2)
>>> *Plano nutricional:*  O estudo 1 avaliou os níveis (0,15,30) o estudo 2
>>> avaliou os níveis (0,5,10,20)
>>> *Dias em lactação-DEL* (medidas repetidas no tempo):  Estudo 1, dias
>>> dispersos entre os períodos de 30 a 120 dias. No estudo 2 os DEL foram
>>> avaliados em dias entre 150 a 250 dias.
>>>
>>>
>>> Eu realizei uma análise gráfica e não há indicações de haver diferenças
>>> entre estudos, o que era de certo modo esperado. Raça e DEL parecem ser os
>>> fatores que afetam as variáveis respostas.
>>>
>>>
>>>
>>> --
>>> =========================================
>>> Fernando Souza
>>> Zootecnista, DSc. Produção e Alimentação Animal
>>> Celular: (31)99796-8781 (Vivo)
>>> E-mail:nandodesouza em gmail.com <e-mail%3Anandodesouza em gmail.com>
>>> Lattes: http://lattes.cnpq.br/6519538815038307
>>> Blog: https://producaoanimalcomr.wordpress.com/
>>> ==========================================
>>> _______________________________________________
>>> R-br mailing list
>>> R-br em listas.c3sl.ufpr.br
>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>> código mínimo reproduzível.
>>>
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>>
>
>
> --
> =========================================
> Fernando Souza
> Zootecnista, DSc. Produção e Alimentação Animal
> Celular: (31)99796-8781 (Vivo)
> E-mail:nandodesouza em gmail.com <e-mail%3Anandodesouza em gmail.com>
> Lattes: http://lattes.cnpq.br/6519538815038307
> Blog: https://producaoanimalcomr.wordpress.com/
> ==========================================
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20200423/175a7dec/attachment.html>


Mais detalhes sobre a lista de discussão R-br