Duvidas Análise de Componentes Principais

Olá pessoal tudo bem Estou realizando uma análise de componentes principais, com o objetivo de selecionar as melhores variáveis para uma análise multivariada. Gostaria de uma orientação sobre a interpretação. Eu interpretei de forma correta? Variáveis que possuem alta correlação com um CP também estão correlacionadas entre si. Isso significa que posso utilizar somente uma das principais variáveis do CP1 (por exemplo) para incluir no modelo multivariado? No caso a variável que apresentar significado para o trabalho. Os círculos de correlação, screem plot e corrplot geradas pelo Pca estão disponíveis no link https://drive.google.com/open?id=1jS5tCX-2-qHo2Gbej00DkFQBpLztwXks A interpretação que fiz foi a seguinte: Considerei as variáveis PC,IC e Prod leite (Azul no gráfico) como variável suplementar quantitativa. Baseado no ScreenPlot selecionei somente 5 CP para avaliação que explicaram 67,80% da variancia total. Pela minha interpretação cheguei as seguintes conclusões Principais variáveis para cada componente: Consumos (CP1): CMS,CMO,CPB,CEE,CCNF,CFDNcp,CFDA,CNDT,CEB,CED,CEM,CEL Energia (CP2) : EB,ED,EM,EL Peso (CP3): PV,PCJ,PCVZ,PCVZ075 Composição do Leite(CP4) : Solido e DCNF Variaveis sanguíneas (CP5): PT e ALBUMINA Segue uma descrição do trabalho para compreensão. Aceito sugestões sobre a melhor forma trabalhar esses dados O banco de dados é oriundo dois estudos realizados pelo mesmo grupo de pesquisa nas mesmas condições experimentais (animais,instalação,dieta,manejo) e avaliaram 48 variáveis. Os fatores experimentais foram: *Raça*: Estudo 1 avaliou 12 animais (6 raça1 e 6 da raça 2). O estudo 2 avaliou 13 animais (6 raça 1 e 7 raça 2) *Plano nutricional:* O estudo 1 avaliou os níveis (0,15,30) o estudo 2 avaliou os níveis (0,5,10,20) *Dias em lactação-DEL* (medidas repetidas no tempo): Estudo 1, dias dispersos entre os períodos de 30 a 120 dias. No estudo 2 os DEL foram avaliados em dias entre 150 a 250 dias. Eu realizei uma análise gráfica e não há indicações de haver diferenças entre estudos, o que era de certo modo esperado. Raça e DEL parecem ser os fatores que afetam as variáveis respostas. -- ========================================= Fernando Souza Zootecnista, DSc. Produção e Alimentação Animal Celular: (31)99796-8781 (Vivo) E-mail:nandodesouza@gmail.com <e-mail%3Anandodesouza@gmail.com> Lattes: http://lattes.cnpq.br/6519538815038307 Blog: https://producaoanimalcomr.wordpress.com/ ==========================================

Fernando, Há dois aspectos a ser vistos na sua ACP. O número de variáveis que você tem antes da ACP e número de casos para você fazer uma análise multivariada (nos dois casos). Um gráfico muito interessante para auxiliá-lo a decidir sobre seus resultados é o "mapa de indivíduos" que plota cada caso no plano das CP, sendo as primeiras componentes as mais "interessantes" posto que "espalham" mais os dados por terem sido resultado de uma operação matemática que maximiza a variâncias nesses dados. Nesses mapas de indivíduos você pode rotular com cores ou símbolos aspectos da sua investigação. O uso das primeiras CP usando o diagrama *scree* ajuda, *mas* a interpretação da multivariada que você venha a fazer precisará de mais trabalho, porém você escapa do problema de ter mais variáveis que casos, que exigiria uso de técnicas de validação cruzada, etc. HTH -- Cesar Rabak On Wed, Apr 22, 2020 at 6:26 PM Fernando Souza por (R-br) < r-br@listas.c3sl.ufpr.br> wrote:
Olá pessoal tudo bem
Estou realizando uma análise de componentes principais, com o objetivo de selecionar as melhores variáveis para uma análise multivariada.
Gostaria de uma orientação sobre a interpretação. Eu interpretei de forma correta? Variáveis que possuem alta correlação com um CP também estão correlacionadas entre si. Isso significa que posso utilizar somente uma das principais variáveis do CP1 (por exemplo) para incluir no modelo multivariado? No caso a variável que apresentar significado para o trabalho.
Os círculos de correlação, screem plot e corrplot geradas pelo Pca estão disponíveis no link https://drive.google.com/open?id=1jS5tCX-2-qHo2Gbej00DkFQBpLztwXks
A interpretação que fiz foi a seguinte:
Considerei as variáveis PC,IC e Prod leite (Azul no gráfico) como variável suplementar quantitativa. Baseado no ScreenPlot selecionei somente 5 CP para avaliação que explicaram 67,80% da variancia total. Pela minha interpretação cheguei as seguintes conclusões
Principais variáveis para cada componente:
Consumos (CP1): CMS,CMO,CPB,CEE,CCNF,CFDNcp,CFDA,CNDT,CEB,CED,CEM,CEL
Energia (CP2) : EB,ED,EM,EL
Peso (CP3): PV,PCJ,PCVZ,PCVZ075
Composição do Leite(CP4) : Solido e DCNF
Variaveis sanguíneas (CP5): PT e ALBUMINA
Segue uma descrição do trabalho para compreensão. Aceito sugestões sobre a melhor forma trabalhar esses dados
O banco de dados é oriundo dois estudos realizados pelo mesmo grupo de pesquisa nas mesmas condições experimentais (animais,instalação,dieta,manejo) e avaliaram 48 variáveis. Os fatores experimentais foram: *Raça*: Estudo 1 avaliou 12 animais (6 raça1 e 6 da raça 2). O estudo 2 avaliou 13 animais (6 raça 1 e 7 raça 2) *Plano nutricional:* O estudo 1 avaliou os níveis (0,15,30) o estudo 2 avaliou os níveis (0,5,10,20) *Dias em lactação-DEL* (medidas repetidas no tempo): Estudo 1, dias dispersos entre os períodos de 30 a 120 dias. No estudo 2 os DEL foram avaliados em dias entre 150 a 250 dias.
Eu realizei uma análise gráfica e não há indicações de haver diferenças entre estudos, o que era de certo modo esperado. Raça e DEL parecem ser os fatores que afetam as variáveis respostas.
-- ========================================= Fernando Souza Zootecnista, DSc. Produção e Alimentação Animal Celular: (31)99796-8781 (Vivo) E-mail:nandodesouza@gmail.com <e-mail%3Anandodesouza@gmail.com> Lattes: http://lattes.cnpq.br/6519538815038307 Blog: https://producaoanimalcomr.wordpress.com/ ========================================== _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Olá Cesar Obrigado pelo retorno! Eu montei os gráficos (mapa de indivíduos) conforme sugerido e adicionei no link. Você poderia me orientar sobre a interpretação. Eu fiz uma aqui mas não estou seguro e gostaria de ouvir a opinião de alguém mais experiente para comparar com as que fiz. Você poderia me dizer o que pode concluir dos gráficos? https://drive.google.com/open?id=1jS5tCX-2-qHo2Gbej00DkFQBpLztwXks Aproveito para pedir dicas de boas referencias para estudo, principalmente como tirar as conclusões do PCA para o modelo. Atenciosamente Em qua., 22 de abr. de 2020 às 22:03, Cesar Rabak por (R-br) < r-br@listas.c3sl.ufpr.br> escreveu:
Fernando,
Há dois aspectos a ser vistos na sua ACP.
O número de variáveis que você tem antes da ACP e número de casos para você fazer uma análise multivariada (nos dois casos).
Um gráfico muito interessante para auxiliá-lo a decidir sobre seus resultados é o "mapa de indivíduos" que plota cada caso no plano das CP, sendo as primeiras componentes as mais "interessantes" posto que "espalham" mais os dados por terem sido resultado de uma operação matemática que maximiza a variâncias nesses dados.
Nesses mapas de indivíduos você pode rotular com cores ou símbolos aspectos da sua investigação.
O uso das primeiras CP usando o diagrama *scree* ajuda, *mas* a interpretação da multivariada que você venha a fazer precisará de mais trabalho, porém você escapa do problema de ter mais variáveis que casos, que exigiria uso de técnicas de validação cruzada, etc.
HTH -- Cesar Rabak
On Wed, Apr 22, 2020 at 6:26 PM Fernando Souza por (R-br) < r-br@listas.c3sl.ufpr.br> wrote:
Olá pessoal tudo bem
Estou realizando uma análise de componentes principais, com o objetivo de selecionar as melhores variáveis para uma análise multivariada.
Gostaria de uma orientação sobre a interpretação. Eu interpretei de forma correta? Variáveis que possuem alta correlação com um CP também estão correlacionadas entre si. Isso significa que posso utilizar somente uma das principais variáveis do CP1 (por exemplo) para incluir no modelo multivariado? No caso a variável que apresentar significado para o trabalho.
Os círculos de correlação, screem plot e corrplot geradas pelo Pca estão disponíveis no link https://drive.google.com/open?id=1jS5tCX-2-qHo2Gbej00DkFQBpLztwXks
A interpretação que fiz foi a seguinte:
Considerei as variáveis PC,IC e Prod leite (Azul no gráfico) como variável suplementar quantitativa. Baseado no ScreenPlot selecionei somente 5 CP para avaliação que explicaram 67,80% da variancia total. Pela minha interpretação cheguei as seguintes conclusões
Principais variáveis para cada componente:
Consumos (CP1): CMS,CMO,CPB,CEE,CCNF,CFDNcp,CFDA,CNDT,CEB,CED,CEM,CEL
Energia (CP2) : EB,ED,EM,EL
Peso (CP3): PV,PCJ,PCVZ,PCVZ075
Composição do Leite(CP4) : Solido e DCNF
Variaveis sanguíneas (CP5): PT e ALBUMINA
Segue uma descrição do trabalho para compreensão. Aceito sugestões sobre a melhor forma trabalhar esses dados
O banco de dados é oriundo dois estudos realizados pelo mesmo grupo de pesquisa nas mesmas condições experimentais (animais,instalação,dieta,manejo) e avaliaram 48 variáveis. Os fatores experimentais foram: *Raça*: Estudo 1 avaliou 12 animais (6 raça1 e 6 da raça 2). O estudo 2 avaliou 13 animais (6 raça 1 e 7 raça 2) *Plano nutricional:* O estudo 1 avaliou os níveis (0,15,30) o estudo 2 avaliou os níveis (0,5,10,20) *Dias em lactação-DEL* (medidas repetidas no tempo): Estudo 1, dias dispersos entre os períodos de 30 a 120 dias. No estudo 2 os DEL foram avaliados em dias entre 150 a 250 dias.
Eu realizei uma análise gráfica e não há indicações de haver diferenças entre estudos, o que era de certo modo esperado. Raça e DEL parecem ser os fatores que afetam as variáveis respostas.
-- ========================================= Fernando Souza Zootecnista, DSc. Produção e Alimentação Animal Celular: (31)99796-8781 (Vivo) E-mail:nandodesouza@gmail.com <e-mail%3Anandodesouza@gmail.com> Lattes: http://lattes.cnpq.br/6519538815038307 Blog: https://producaoanimalcomr.wordpress.com/ ========================================== _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- ========================================= Fernando Souza Zootecnista, DSc. Produção e Alimentação Animal Celular: (31)99796-8781 (Vivo) E-mail:nandodesouza@gmail.com <e-mail%3Anandodesouza@gmail.com> Lattes: http://lattes.cnpq.br/6519538815038307 Blog: https://producaoanimalcomr.wordpress.com/ ==========================================

Os mapas de indivíduos para as duas primeiras dimensões mostram que há uma melhor representatividade dos valores extremos (v. Plano.png) onde o cos² é maior. Para as três variáveis categóricas que você usou (raças, planos e vol. conc) as elipses de confiança (que presumo sejam 95%) indicam que para essa amostra os dados não indicam diferenças com significância estatística dentro dos limiares usuais. Minhas referências de estudo para esse assunto : Foucart, T. L’analyse des données, mode d’emploi : méthodes et études de cas. Rennes.] Presses Univ. de Rennes, 1997. Escofier, B.; Pagès, J. Analyses factorielles simples et multiples: Objectifs, méthodes et interprétation. Paris. Dunod, 2008. A última trabalha bem a questão da interpretação com casos mais recentes, embora a primeira seja bem equilibrada entre teoria e exemplos práticos. Há material na Internet, mas não posso opinar sobre eles, inclusive vídeos. HTH -- Cesar Rabak On Thu, Apr 23, 2020 at 4:57 PM Fernando Souza por (R-br) < r-br@listas.c3sl.ufpr.br> wrote:
Olá Cesar
Obrigado pelo retorno!
Eu montei os gráficos (mapa de indivíduos) conforme sugerido e adicionei no link. Você poderia me orientar sobre a interpretação. Eu fiz uma aqui mas não estou seguro e gostaria de ouvir a opinião de alguém mais experiente para comparar com as que fiz. Você poderia me dizer o que pode concluir dos gráficos?
https://drive.google.com/open?id=1jS5tCX-2-qHo2Gbej00DkFQBpLztwXks
Aproveito para pedir dicas de boas referencias para estudo, principalmente como tirar as conclusões do PCA para o modelo.
Atenciosamente
Em qua., 22 de abr. de 2020 às 22:03, Cesar Rabak por (R-br) < r-br@listas.c3sl.ufpr.br> escreveu:
Fernando,
Há dois aspectos a ser vistos na sua ACP.
O número de variáveis que você tem antes da ACP e número de casos para você fazer uma análise multivariada (nos dois casos).
Um gráfico muito interessante para auxiliá-lo a decidir sobre seus resultados é o "mapa de indivíduos" que plota cada caso no plano das CP, sendo as primeiras componentes as mais "interessantes" posto que "espalham" mais os dados por terem sido resultado de uma operação matemática que maximiza a variâncias nesses dados.
Nesses mapas de indivíduos você pode rotular com cores ou símbolos aspectos da sua investigação.
O uso das primeiras CP usando o diagrama *scree* ajuda, *mas* a interpretação da multivariada que você venha a fazer precisará de mais trabalho, porém você escapa do problema de ter mais variáveis que casos, que exigiria uso de técnicas de validação cruzada, etc.
HTH -- Cesar Rabak
On Wed, Apr 22, 2020 at 6:26 PM Fernando Souza por (R-br) < r-br@listas.c3sl.ufpr.br> wrote:
Olá pessoal tudo bem
Estou realizando uma análise de componentes principais, com o objetivo de selecionar as melhores variáveis para uma análise multivariada.
Gostaria de uma orientação sobre a interpretação. Eu interpretei de forma correta? Variáveis que possuem alta correlação com um CP também estão correlacionadas entre si. Isso significa que posso utilizar somente uma das principais variáveis do CP1 (por exemplo) para incluir no modelo multivariado? No caso a variável que apresentar significado para o trabalho.
Os círculos de correlação, screem plot e corrplot geradas pelo Pca estão disponíveis no link https://drive.google.com/open?id=1jS5tCX-2-qHo2Gbej00DkFQBpLztwXks
A interpretação que fiz foi a seguinte:
Considerei as variáveis PC,IC e Prod leite (Azul no gráfico) como variável suplementar quantitativa. Baseado no ScreenPlot selecionei somente 5 CP para avaliação que explicaram 67,80% da variancia total. Pela minha interpretação cheguei as seguintes conclusões
Principais variáveis para cada componente:
Consumos (CP1): CMS,CMO,CPB,CEE,CCNF,CFDNcp,CFDA,CNDT,CEB,CED,CEM,CEL
Energia (CP2) : EB,ED,EM,EL
Peso (CP3): PV,PCJ,PCVZ,PCVZ075
Composição do Leite(CP4) : Solido e DCNF
Variaveis sanguíneas (CP5): PT e ALBUMINA
Segue uma descrição do trabalho para compreensão. Aceito sugestões sobre a melhor forma trabalhar esses dados
O banco de dados é oriundo dois estudos realizados pelo mesmo grupo de pesquisa nas mesmas condições experimentais (animais,instalação,dieta,manejo) e avaliaram 48 variáveis. Os fatores experimentais foram: *Raça*: Estudo 1 avaliou 12 animais (6 raça1 e 6 da raça 2). O estudo 2 avaliou 13 animais (6 raça 1 e 7 raça 2) *Plano nutricional:* O estudo 1 avaliou os níveis (0,15,30) o estudo 2 avaliou os níveis (0,5,10,20) *Dias em lactação-DEL* (medidas repetidas no tempo): Estudo 1, dias dispersos entre os períodos de 30 a 120 dias. No estudo 2 os DEL foram avaliados em dias entre 150 a 250 dias.
Eu realizei uma análise gráfica e não há indicações de haver diferenças entre estudos, o que era de certo modo esperado. Raça e DEL parecem ser os fatores que afetam as variáveis respostas.
-- ========================================= Fernando Souza Zootecnista, DSc. Produção e Alimentação Animal Celular: (31)99796-8781 (Vivo) E-mail:nandodesouza@gmail.com <e-mail%3Anandodesouza@gmail.com> Lattes: http://lattes.cnpq.br/6519538815038307 Blog: https://producaoanimalcomr.wordpress.com/ ========================================== _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- ========================================= Fernando Souza Zootecnista, DSc. Produção e Alimentação Animal Celular: (31)99796-8781 (Vivo) E-mail:nandodesouza@gmail.com <e-mail%3Anandodesouza@gmail.com> Lattes: http://lattes.cnpq.br/6519538815038307 Blog: https://producaoanimalcomr.wordpress.com/ ========================================== _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Cesar, Muito obrigado pela atenção! Você me ajudou muito. Eu também havia concluído que os fatores que utilizei (raças, planos e vol. conc), não aparentavam diferenças significativas, mas não estava muito seguro. Quanto ao número de componentes utilizar minha dúvida é a seguinte: 2 componentes: Eu explico somente 40% da variação 5 componentes: Eu explico 78% da variação Existe uma variação explicada mínima a ser considerada na escolha do número de componentes? Obrigado! On Apr 23 2020, at 9:10 pm, Cesar Rabak por (R-br) <r-br@listas.c3sl.ufpr.br> wrote:
Os mapas de indivíduos para as duas primeiras dimensões mostram que há uma melhor representatividade dos valores extremos (v. Plano.png) onde o cos² é maior.
Para as três variáveis categóricas que você usou (raças, planos e vol. conc) as elipses de confiança (que presumo sejam 95%) indicam que para essa amostra os dados não indicam diferenças com significância estatística dentro dos limiares usuais.
Minhas referências de estudo para esse assunto :
Foucart, T. L’analyse des données, mode d’emploi : méthodes et études de cas. Rennes.] Presses Univ. de Rennes, 1997. Escofier, B.; Pagès, J. Analyses factorielles simples et multiples: Objectifs, méthodes et interprétation. Paris. Dunod, 2008.
A última trabalha bem a questão da interpretação com casos mais recentes, embora a primeira seja bem equilibrada entre teoria e exemplos práticos.
Há material na Internet, mas não posso opinar sobre eles, inclusive vídeos.
HTH -- Cesar Rabak
On Thu, Apr 23, 2020 at 4:57 PM Fernando Souza por (R-br) <r-br@listas.c3sl.ufpr.br (mailto:r-br@listas.c3sl.ufpr.br)> wrote:
Olá Cesar
Obrigado pelo retorno!
Eu montei os gráficos (mapa de indivíduos) conforme sugerido e adicionei no link. Você poderia me orientar sobre a interpretação. Eu fiz uma aqui mas não estou seguro e gostaria de ouvir a opinião de alguém mais experiente para comparar com as que fiz. Você poderia me dizer o que pode concluir dos gráficos?
https://drive.google.com/open?id=1jS5tCX-2-qHo2Gbej00DkFQBpLztwXks
Aproveito para pedir dicas de boas referencias para estudo, principalmente como tirar as conclusões do PCA para o modelo.
Atenciosamente
Em qua., 22 de abr. de 2020 às 22:03, Cesar Rabak por (R-br) <r-br@listas.c3sl.ufpr.br (mailto:r-br@listas.c3sl.ufpr.br)> escreveu:
Fernando,
Há dois aspectos a ser vistos na sua ACP.
O número de variáveis que você tem antes da ACP e número de casos para você fazer uma análise multivariada (nos dois casos).
Um gráfico muito interessante para auxiliá-lo a decidir sobre seus resultados é o "mapa de indivíduos" que plota cada caso no plano das CP, sendo as primeiras componentes as mais "interessantes" posto que "espalham" mais os dados por terem sido resultado de uma operação matemática que maximiza a variâncias nesses dados.
Nesses mapas de indivíduos você pode rotular com cores ou símbolos aspectos da sua investigação.
O uso das primeiras CP usando o diagrama scree ajuda, mas a interpretação da multivariada que você venha a fazer precisará de mais trabalho, porém você escapa do problema de ter mais variáveis que casos, que exigiria uso de técnicas de validação cruzada, etc.
HTH -- Cesar Rabak
On Wed, Apr 22, 2020 at 6:26 PM Fernando Souza por (R-br) <r-br@listas.c3sl.ufpr.br (mailto:r-br@listas.c3sl.ufpr.br)> wrote:
Olá pessoal tudo bem
Estou realizando uma análise de componentes principais, com o objetivo de selecionar as melhores variáveis para uma análise multivariada. Gostaria de uma orientação sobre a interpretação. Eu interpretei de forma correta? Variáveis que possuem alta correlação com um CP também estão correlacionadas entre si. Isso significa que posso utilizar somente uma das principais variáveis do CP1 (por exemplo) para incluir no modelo multivariado? No caso a variável que apresentar significado para o trabalho.
Os círculos de correlação, screem plot e corrplot geradas pelo Pca estão disponíveis no link https://drive.google.com/open?id=1jS5tCX-2-qHo2Gbej00DkFQBpLztwXks
A interpretação que fiz foi a seguinte:
Considerei as variáveis PC,IC e Prod leite (Azul no gráfico) como variável suplementar quantitativa. Baseado no ScreenPlot selecionei somente 5 CP para avaliação que explicaram 67,80% da variancia total. Pela minha interpretação cheguei as seguintes conclusões Principais variáveis para cada componente: Consumos (CP1): CMS,CMO,CPB,CEE,CCNF,CFDNcp,CFDA,CNDT,CEB,CED,CEM,CEL Energia (CP2) : EB,ED,EM,EL Peso (CP3): PV,PCJ,PCVZ,PCVZ075 Composição do Leite(CP4) : Solido e DCNF Variaveis sanguíneas (CP5): PT e ALBUMINA
Segue uma descrição do trabalho para compreensão. Aceito sugestões sobre a melhor forma trabalhar esses dados O banco de dados é oriundo dois estudos realizados pelo mesmo grupo de pesquisa nas mesmas condições experimentais (animais,instalação,dieta,manejo) e avaliaram 48 variáveis. Os fatores experimentais foram: Raça: Estudo 1 avaliou 12 animais (6 raça1 e 6 da raça 2). O estudo 2 avaliou 13 animais (6 raça 1 e 7 raça 2) Plano nutricional: O estudo 1 avaliou os níveis (0,15,30) o estudo 2 avaliou os níveis (0,5,10,20) Dias em lactação-DEL (medidas repetidas no tempo): Estudo 1, dias dispersos entre os períodos de 30 a 120 dias. No estudo 2 os DEL foram avaliados em dias entre 150 a 250 dias.
Eu realizei uma análise gráfica e não há indicações de haver diferenças entre estudos, o que era de certo modo esperado. Raça e DEL parecem ser os fatores que afetam as variáveis respostas.
-- ========================================= Fernando Souza Zootecnista, DSc. Produção e Alimentação Animal Celular: (31)99796-8781 (Vivo) E-mail:nandodesouza@gmail.com (mailto:e-mail%3Anandodesouza@gmail.com) Lattes: http://lattes.cnpq.br/6519538815038307 Blog: https://producaoanimalcomr.wordpress.com/ ==========================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br (mailto:R-br@listas.c3sl.ufpr.br) https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br (mailto:R-br@listas.c3sl.ufpr.br) https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- ========================================= Fernando Souza Zootecnista, DSc. Produção e Alimentação Animal Celular: (31)99796-8781 (Vivo) E-mail:nandodesouza@gmail.com (mailto:e-mail%3Anandodesouza@gmail.com) Lattes: http://lattes.cnpq.br/6519538815038307 Blog: https://producaoanimalcomr.wordpress.com/ ==========================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br (mailto:R-br@listas.c3sl.ufpr.br) https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Como você já tem uma (excelente, diga-se de passagem) recomendação, considerando o conhecimento do domínio do problema, do Mauro, acrescento apenas a partir da "teoria" dessa técnica *em geral*. Essa decisão de quantas CP reter pode ser auxiliada pelo diagrama de *scree* que os defensores dessa técnica propõe examinar o diagrama e ver quando a "ingrimidade" do diagrama, muda, ou pegar CPs antes do "cotovelo" que o diagrama indica. A outra técnica é o que você já descreveu parcialmente acima, e ver quantos % de variação explicada você precisa reter para entender o seu problema. Analisar o diagrama de variáveis (cujos gráficos você denominou correlacao{,34,45}.png lhe permitem entender no *quê* os casos se diferenciam, e talvez possa servir de subsídio para suas análises. HTH -- Cesar Rabak PS.: é necessário ter em mente o tempo todo para qual finalidade a ACP está sendo realizada: se uma Análise Exploratória dos Dados ou passo anterior a uma outra análise como parece ser seu caso na busca de uma multivariada. On Thu, Apr 23, 2020 at 9:59 PM Fernando Souza <nandodesouza@gmail.com> wrote:
Cesar,
Muito obrigado pela atenção! Você me ajudou muito. Eu também havia concluído que os fatores que utilizei (raças, planos e vol. conc), não aparentavam diferenças significativas, mas não estava muito seguro.
Quanto ao número de componentes utilizar minha dúvida é a seguinte:
2 componentes: Eu explico somente 40% da variação 5 componentes: Eu explico 78% da variação
Existe uma variação explicada mínima a ser considerada na escolha do número de componentes?
Obrigado!
On Apr 23 2020, at 9:10 pm, Cesar Rabak por (R-br) < r-br@listas.c3sl.ufpr.br> wrote:
Os mapas de indivíduos para as duas primeiras dimensões mostram que há uma melhor representatividade dos valores extremos (v. Plano.png) onde o cos² é maior.
Para as três variáveis categóricas que você usou (raças, planos e vol. conc) as elipses de confiança (que presumo sejam 95%) indicam que para essa amostra os dados não indicam diferenças com significância estatística dentro dos limiares usuais.
Minhas referências de estudo para esse assunto :
Foucart, T. L’analyse des données, mode d’emploi : méthodes et études de cas. Rennes.] Presses Univ. de Rennes, 1997. Escofier, B.; Pagès, J. Analyses factorielles simples et multiples: Objectifs, méthodes et interprétation. Paris. Dunod, 2008.
A última trabalha bem a questão da interpretação com casos mais recentes, embora a primeira seja bem equilibrada entre teoria e exemplos práticos.
Há material na Internet, mas não posso opinar sobre eles, inclusive vídeos.
HTH -- Cesar Rabak
On Thu, Apr 23, 2020 at 4:57 PM Fernando Souza por (R-br) < r-br@listas.c3sl.ufpr.br> wrote:
Olá Cesar
Obrigado pelo retorno!
Eu montei os gráficos (mapa de indivíduos) conforme sugerido e adicionei no link. Você poderia me orientar sobre a interpretação. Eu fiz uma aqui mas não estou seguro e gostaria de ouvir a opinião de alguém mais experiente para comparar com as que fiz. Você poderia me dizer o que pode concluir dos gráficos?
https://drive.google.com/open?id=1jS5tCX-2-qHo2Gbej00DkFQBpLztwXks
Aproveito para pedir dicas de boas referencias para estudo, principalmente como tirar as conclusões do PCA para o modelo.
Atenciosamente
Em qua., 22 de abr. de 2020 às 22:03, Cesar Rabak por (R-br) < r-br@listas.c3sl.ufpr.br> escreveu:
Fernando,
Há dois aspectos a ser vistos na sua ACP.
O número de variáveis que você tem antes da ACP e número de casos para você fazer uma análise multivariada (nos dois casos).
Um gráfico muito interessante para auxiliá-lo a decidir sobre seus resultados é o "mapa de indivíduos" que plota cada caso no plano das CP, sendo as primeiras componentes as mais "interessantes" posto que "espalham" mais os dados por terem sido resultado de uma operação matemática que maximiza a variâncias nesses dados.
Nesses mapas de indivíduos você pode rotular com cores ou símbolos aspectos da sua investigação.
O uso das primeiras CP usando o diagrama *scree* ajuda, *mas* a interpretação da multivariada que você venha a fazer precisará de mais trabalho, porém você escapa do problema de ter mais variáveis que casos, que exigiria uso de técnicas de validação cruzada, etc.
HTH -- Cesar Rabak
On Wed, Apr 22, 2020 at 6:26 PM Fernando Souza por (R-br) < r-br@listas.c3sl.ufpr.br> wrote:
Olá pessoal tudo bem
Estou realizando uma análise de componentes principais, com o objetivo de selecionar as melhores variáveis para uma análise multivariada.
Gostaria de uma orientação sobre a interpretação. Eu interpretei de forma correta? Variáveis que possuem alta correlação com um CP também estão correlacionadas entre si. Isso significa que posso utilizar somente uma das principais variáveis do CP1 (por exemplo) para incluir no modelo multivariado? No caso a variável que apresentar significado para o trabalho.
Os círculos de correlação, screem plot e corrplot geradas pelo Pca estão disponíveis no link https://drive.google.com/open?id=1jS5tCX-2-qHo2Gbej00DkFQBpLztwXks
A interpretação que fiz foi a seguinte:
Considerei as variáveis PC,IC e Prod leite (Azul no gráfico) como variável suplementar quantitativa. Baseado no ScreenPlot selecionei somente 5 CP para avaliação que explicaram 67,80% da variancia total. Pela minha interpretação cheguei as seguintes conclusões
Principais variáveis para cada componente:
Consumos (CP1): CMS,CMO,CPB,CEE,CCNF,CFDNcp,CFDA,CNDT,CEB,CED,CEM,CEL
Energia (CP2) : EB,ED,EM,EL
Peso (CP3): PV,PCJ,PCVZ,PCVZ075
Composição do Leite(CP4) : Solido e DCNF
Variaveis sanguíneas (CP5): PT e ALBUMINA
Segue uma descrição do trabalho para compreensão. Aceito sugestões sobre a melhor forma trabalhar esses dados
O banco de dados é oriundo dois estudos realizados pelo mesmo grupo de pesquisa nas mesmas condições experimentais (animais,instalação,dieta,manejo) e avaliaram 48 variáveis. Os fatores experimentais foram: *Raça*: Estudo 1 avaliou 12 animais (6 raça1 e 6 da raça 2). O estudo 2 avaliou 13 animais (6 raça 1 e 7 raça 2) *Plano nutricional:* O estudo 1 avaliou os níveis (0,15,30) o estudo 2 avaliou os níveis (0,5,10,20) *Dias em lactação-DEL* (medidas repetidas no tempo): Estudo 1, dias dispersos entre os períodos de 30 a 120 dias. No estudo 2 os DEL foram avaliados em dias entre 150 a 250 dias.
Eu realizei uma análise gráfica e não há indicações de haver diferenças entre estudos, o que era de certo modo esperado. Raça e DEL parecem ser os fatores que afetam as variáveis respostas.
-- ========================================= Fernando Souza Zootecnista, DSc. Produção e Alimentação Animal Celular: (31)99796-8781 (Vivo) E-mail:nandodesouza@gmail.com <e-mail%3Anandodesouza@gmail.com> Lattes: http://lattes.cnpq.br/6519538815038307 Blog: https://producaoanimalcomr.wordpress.com/ ========================================== _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- ========================================= Fernando Souza Zootecnista, DSc. Produção e Alimentação Animal Celular: (31)99796-8781 (Vivo) E-mail:nandodesouza@gmail.com <e-mail%3Anandodesouza@gmail.com> Lattes: http://lattes.cnpq.br/6519538815038307 Blog: https://producaoanimalcomr.wordpress.com/ ========================================== _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

http://www.c2o.pro.br/hackaguas/apx.html http://www.c2o.pro.br/hackaguas/apxs02.html Em 22-04-2020 18:25, Fernando Souza por (R-br) escreveu:
Olá pessoal tudo bem
Estou realizando uma análise de componentes principais, com o objetivo de selecionar as melhores variáveis para uma análise multivariada.
Gostaria de uma orientação sobre a interpretação. Eu interpretei de forma correta? Variáveis que possuem alta correlação com um CP também estão correlacionadas entre si. Isso significa que posso utilizar somente uma das principais variáveis do CP1 (por exemplo) para incluir no modelo multivariado? No caso a variável que apresentar significado para o trabalho.
Os círculos de correlação, screem plot e corrplot geradas pelo Pca estão disponíveis no link https://drive.google.com/open?id=1jS5tCX-2-qHo2Gbej00DkFQBpLztwXks
A interpretação que fiz foi a seguinte:
Considerei as variáveis PC,IC e Prod leite (Azul no gráfico) como variável suplementar quantitativa. Baseado no ScreenPlot selecionei somente 5 CP para avaliação que explicaram 67,80% da variancia total. Pela minha interpretação cheguei as seguintes conclusões
Principais variáveis para cada componente:
Consumos (CP1): CMS,CMO,CPB,CEE,CCNF,CFDNcp,CFDA,CNDT,CEB,CED,CEM,CEL
Energia (CP2) : EB,ED,EM,EL
Peso (CP3): PV,PCJ,PCVZ,PCVZ075
Composição do Leite(CP4) : Solido e DCNF
Variaveis sanguíneas (CP5): PT e ALBUMINA
Segue uma descrição do trabalho para compreensão. Aceito sugestões sobre a melhor forma trabalhar esses dados
O banco de dados é oriundo dois estudos realizados pelo mesmo grupo de pesquisa nas mesmas condições experimentais (animais,instalação,dieta,manejo) e avaliaram 48 variáveis. Os fatores experimentais foram: *Raça*: Estudo 1 avaliou 12 animais (6 raça1 e 6 da raça 2). O estudo 2 avaliou 13 animais (6 raça 1 e 7 raça 2) *Plano nutricional:* O estudo 1 avaliou os níveis (0,15,30) o estudo 2 avaliou os níveis (0,5,10,20) *Dias em lactação-DEL* (medidas repetidas no tempo): Estudo 1, dias dispersos entre os períodos de 30 a 120 dias. No estudo 2 os DEL foram avaliados em dias entre 150 a 250 dias.
Eu realizei uma análise gráfica e não há indicações de haver diferenças entre estudos, o que era de certo modo esperado. Raça e DEL parecem ser os fatores que afetam as variáveis respostas.
-- ========================================= Fernando Souza Zootecnista, DSc. Produção e Alimentação Animal Celular: (31)99796-8781 (Vivo) E-mail:nandodesouza@gmail.com <mailto:e-mail%3Anandodesouza@gmail.com> Lattes: http://lattes.cnpq.br/6519538815038307 Blog: https://producaoanimalcomr.wordpress.com/ ==========================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Só agora pude dar uma vista d'olhos nas referências indicadas. Um senão (*caveat emptor*) precisa ser colocado: os exemplos usam Python e não R. HTH On Thu, Apr 23, 2020 at 11:10 PM Nei por (R-br) <r-br@listas.c3sl.ufpr.br> wrote:
http://www.c2o.pro.br/hackaguas/apx.html
http://www.c2o.pro.br/hackaguas/apxs02.html
Em 22-04-2020 18:25, Fernando Souza por (R-br) escreveu:
Olá pessoal tudo bem
Estou realizando uma análise de componentes principais, com o objetivo de selecionar as melhores variáveis para uma análise multivariada.
Gostaria de uma orientação sobre a interpretação. Eu interpretei de forma correta? Variáveis que possuem alta correlação com um CP também estão correlacionadas entre si. Isso significa que posso utilizar somente uma das principais variáveis do CP1 (por exemplo) para incluir no modelo multivariado? No caso a variável que apresentar significado para o trabalho.
Os círculos de correlação, screem plot e corrplot geradas pelo Pca estão disponíveis no link https://drive.google.com/open?id=1jS5tCX-2-qHo2Gbej00DkFQBpLztwXks
A interpretação que fiz foi a seguinte:
Considerei as variáveis PC,IC e Prod leite (Azul no gráfico) como variável suplementar quantitativa. Baseado no ScreenPlot selecionei somente 5 CP para avaliação que explicaram 67,80% da variancia total. Pela minha interpretação cheguei as seguintes conclusões
Principais variáveis para cada componente:
Consumos (CP1): CMS,CMO,CPB,CEE,CCNF,CFDNcp,CFDA,CNDT,CEB,CED,CEM,CEL
Energia (CP2) : EB,ED,EM,EL
Peso (CP3): PV,PCJ,PCVZ,PCVZ075
Composição do Leite(CP4) : Solido e DCNF
Variaveis sanguíneas (CP5): PT e ALBUMINA
Segue uma descrição do trabalho para compreensão. Aceito sugestões sobre a melhor forma trabalhar esses dados
O banco de dados é oriundo dois estudos realizados pelo mesmo grupo de pesquisa nas mesmas condições experimentais (animais,instalação,dieta,manejo) e avaliaram 48 variáveis. Os fatores experimentais foram: *Raça*: Estudo 1 avaliou 12 animais (6 raça1 e 6 da raça 2). O estudo 2 avaliou 13 animais (6 raça 1 e 7 raça 2) *Plano nutricional:* O estudo 1 avaliou os níveis (0,15,30) o estudo 2 avaliou os níveis (0,5,10,20) *Dias em lactação-DEL* (medidas repetidas no tempo): Estudo 1, dias dispersos entre os períodos de 30 a 120 dias. No estudo 2 os DEL foram avaliados em dias entre 150 a 250 dias.
Eu realizei uma análise gráfica e não há indicações de haver diferenças entre estudos, o que era de certo modo esperado. Raça e DEL parecem ser os fatores que afetam as variáveis respostas.
-- ========================================= Fernando Souza Zootecnista, DSc. Produção e Alimentação Animal Celular: (31)99796-8781 (Vivo) E-mail:nandodesouza@gmail.com <e-mail%3Anandodesouza@gmail.com> Lattes: http://lattes.cnpq.br/6519538815038307 Blog: https://producaoanimalcomr.wordpress.com/ ==========================================
_______________________________________________ R-br mailing listR-br@listas.c3sl.ufpr.brhttps://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Oi Cesar, Você tem razão, os links apontam para tutoriais sobre PCA que utilizam o Python como ferramenta computacional. Mas eu compartilhei os links pois a pergunta se referia à interpretação dos resultados de PCA, e não ao uso da ferramenta R. E nesses tutoriais eu procurei discutir alguns conceitos sobre a técnica estatística, independente da ferramenta computacional usada, e que poderiam ser úteis para o Fernando. Obrigado pela expressão "caveat emptor". Aprendi mais uma. Entendi como um sinônimo de "disclaimer". Vou incluir no meu site pra ficar mais "chique". :-) Um Abraço, Markos Em 07-12-2020 10:13, Cesar Rabak por (R-br) escreveu:
Só agora pude dar uma vista d'olhos nas referências indicadas.
Um senão (/caveat emptor/) precisa ser colocado: os exemplos usam Python e não R.
HTH
On Thu, Apr 23, 2020 at 11:10 PM Nei por (R-br) <r-br@listas.c3sl.ufpr.br <mailto:r-br@listas.c3sl.ufpr.br>> wrote:
http://www.c2o.pro.br/hackaguas/apx.html
http://www.c2o.pro.br/hackaguas/apxs02.html
Em 22-04-2020 18:25, Fernando Souza por (R-br) escreveu:
Olá pessoal tudo bem
Estou realizando uma análise de componentes principais, com o objetivo de selecionar as melhores variáveis para uma análise multivariada.
Gostaria de uma orientação sobre a interpretação. Eu interpretei de forma correta? Variáveis que possuem alta correlação com um CP também estão correlacionadas entre si. Isso significa que posso utilizar somente uma das principais variáveis do CP1 (por exemplo) para incluir no modelo multivariado? No caso a variável que apresentar significado para o trabalho.
Os círculos de correlação, screem plot e corrplot geradas pelo Pca estão disponíveis no link https://drive.google.com/open?id=1jS5tCX-2-qHo2Gbej00DkFQBpLztwXks
A interpretação que fiz foi a seguinte:
Considerei as variáveis PC,IC e Prod leite (Azul no gráfico) como variável suplementar quantitativa. Baseado no ScreenPlot selecionei somente 5 CP para avaliação que explicaram 67,80% da variancia total. Pela minha interpretação cheguei as seguintes conclusões
Principais variáveis para cada componente:
Consumos (CP1): CMS,CMO,CPB,CEE,CCNF,CFDNcp,CFDA,CNDT,CEB,CED,CEM,CEL
Energia (CP2) : EB,ED,EM,EL
Peso (CP3): PV,PCJ,PCVZ,PCVZ075
Composição do Leite(CP4) : Solido e DCNF
Variaveis sanguíneas (CP5): PT e ALBUMINA
Segue uma descrição do trabalho para compreensão. Aceito sugestões sobre a melhor forma trabalhar esses dados
O banco de dados é oriundo dois estudos realizados pelo mesmo grupo de pesquisa nas mesmas condições experimentais (animais,instalação,dieta,manejo) e avaliaram 48 variáveis. Os fatores experimentais foram: *Raça*: Estudo 1 avaliou 12 animais (6 raça1 e 6 da raça 2). O estudo 2 avaliou 13 animais (6 raça 1 e 7 raça 2) *Plano nutricional:* O estudo 1 avaliou os níveis (0,15,30) o estudo 2 avaliou os níveis (0,5,10,20) *Dias em lactação-DEL* (medidas repetidas no tempo): Estudo 1, dias dispersos entre os períodos de 30 a 120 dias. No estudo 2 os DEL foram avaliados em dias entre 150 a 250 dias.
Eu realizei uma análise gráfica e não há indicações de haver diferenças entre estudos, o que era de certo modo esperado. Raça e DEL parecem ser os fatores que afetam as variáveis respostas.
-- ========================================= Fernando Souza Zootecnista, DSc. Produção e Alimentação Animal Celular: (31)99796-8781 (Vivo) E-mail:nandodesouza@gmail.com <mailto:e-mail%3Anandodesouza@gmail.com> Lattes: http://lattes.cnpq.br/6519538815038307 Blog: https://producaoanimalcomr.wordpress.com/ ==========================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br <mailto:R-br@listas.c3sl.ufpr.br> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br <mailto:R-br@listas.c3sl.ufpr.br> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

OK Nei! A interpretação, obviamente *não deveria* ser diferente em função da linguagem e implementação da técnica, mas na prática... há uns óbices que precisam ser levados em conta: 1) O diagrama que indica as componentes principais pode ter os 'sinais trocados' nos eixos devido a forma como são calculados os autovetores e autovalores; 2) No caso dos biplots há três maneiras de representá-los, com as "flechas" neles tendo significado métrico levemente diferente na hora de interpretar; 3) Algumas implementações oferecem mais objetos de análise em adição às tabelas decorrentes dos cálculos das componentes principais. Essas diferenças podem ser vistas no próprio R com as várias funções para produzir a análise (number crunching) e os gráficos em pacotes diversos. OK quanto ao latim 🤓. Nos países de língua inglesa é muito usada porque nos contratos "padrão" de venda essa expressão advinda do jargão legal caiu no uso devido à repetição em contratos, avisos dos órgãos de proteção ao consumidor, etc. A própria palavra *caveat *sozinha às vezes é usada na conversa cotidiana. Qtº a ficar mais chique, existe um aforismo, em latim é claro sobre isso¹: QUIDQUID LATINE DICTUM SIT ALTUM VIDETUR!! []s -- Cesar Rabak [1] “O que é dito em latim soa profundo”. On Mon, Dec 7, 2020 at 11:34 AM Nei por (R-br) <r-br@listas.c3sl.ufpr.br> wrote:
Oi Cesar,
Você tem razão, os links apontam para tutoriais sobre PCA que utilizam o Python como ferramenta computacional.
Mas eu compartilhei os links pois a pergunta se referia à interpretação dos resultados de PCA, e não ao uso da ferramenta R.
E nesses tutoriais eu procurei discutir alguns conceitos sobre a técnica estatística, independente da ferramenta computacional usada, e que poderiam ser úteis para o Fernando.
Obrigado pela expressão "caveat emptor". Aprendi mais uma.
Entendi como um sinônimo de "disclaimer".
Vou incluir no meu site pra ficar mais "chique". :-)
Um Abraço,
Markos
Em 07-12-2020 10:13, Cesar Rabak por (R-br) escreveu:
Só agora pude dar uma vista d'olhos nas referências indicadas.
Um senão (*caveat emptor*) precisa ser colocado: os exemplos usam Python e não R.
HTH
On Thu, Apr 23, 2020 at 11:10 PM Nei por (R-br) <r-br@listas.c3sl.ufpr.br> wrote:
http://www.c2o.pro.br/hackaguas/apx.html
http://www.c2o.pro.br/hackaguas/apxs02.html
Em 22-04-2020 18:25, Fernando Souza por (R-br) escreveu:
Olá pessoal tudo bem
Estou realizando uma análise de componentes principais, com o objetivo de selecionar as melhores variáveis para uma análise multivariada.
Gostaria de uma orientação sobre a interpretação. Eu interpretei de forma correta? Variáveis que possuem alta correlação com um CP também estão correlacionadas entre si. Isso significa que posso utilizar somente uma das principais variáveis do CP1 (por exemplo) para incluir no modelo multivariado? No caso a variável que apresentar significado para o trabalho.
Os círculos de correlação, screem plot e corrplot geradas pelo Pca estão disponíveis no link https://drive.google.com/open?id=1jS5tCX-2-qHo2Gbej00DkFQBpLztwXks
A interpretação que fiz foi a seguinte:
Considerei as variáveis PC,IC e Prod leite (Azul no gráfico) como variável suplementar quantitativa. Baseado no ScreenPlot selecionei somente 5 CP para avaliação que explicaram 67,80% da variancia total. Pela minha interpretação cheguei as seguintes conclusões
Principais variáveis para cada componente:
Consumos (CP1): CMS,CMO,CPB,CEE,CCNF,CFDNcp,CFDA,CNDT,CEB,CED,CEM,CEL
Energia (CP2) : EB,ED,EM,EL
Peso (CP3): PV,PCJ,PCVZ,PCVZ075
Composição do Leite(CP4) : Solido e DCNF
Variaveis sanguíneas (CP5): PT e ALBUMINA
Segue uma descrição do trabalho para compreensão. Aceito sugestões sobre a melhor forma trabalhar esses dados
O banco de dados é oriundo dois estudos realizados pelo mesmo grupo de pesquisa nas mesmas condições experimentais (animais,instalação,dieta,manejo) e avaliaram 48 variáveis. Os fatores experimentais foram: *Raça*: Estudo 1 avaliou 12 animais (6 raça1 e 6 da raça 2). O estudo 2 avaliou 13 animais (6 raça 1 e 7 raça 2) *Plano nutricional:* O estudo 1 avaliou os níveis (0,15,30) o estudo 2 avaliou os níveis (0,5,10,20) *Dias em lactação-DEL* (medidas repetidas no tempo): Estudo 1, dias dispersos entre os períodos de 30 a 120 dias. No estudo 2 os DEL foram avaliados em dias entre 150 a 250 dias.
Eu realizei uma análise gráfica e não há indicações de haver diferenças entre estudos, o que era de certo modo esperado. Raça e DEL parecem ser os fatores que afetam as variáveis respostas.
-- ========================================= Fernando Souza Zootecnista, DSc. Produção e Alimentação Animal Celular: (31)99796-8781 (Vivo) E-mail:nandodesouza@gmail.com <e-mail%3Anandodesouza@gmail.com> Lattes: http://lattes.cnpq.br/6519538815038307 Blog: https://producaoanimalcomr.wordpress.com/ ==========================================
_______________________________________________ R-br mailing listR-br@listas.c3sl.ufpr.brhttps://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing listR-br@listas.c3sl.ufpr.brhttps://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Bom Dia Cesar, Obrigado pelas dicas sobre PCA. Eu já tinha percebido a questão dos "sinais trocados" quando se usa Matlab ou Python. E obrigado por mais uma expressão latina para a minha coleção. :-) Um Abraço, Markos Em 07-12-2020 16:08, Cesar Rabak escreveu:
OK Nei!
A interpretação, obviamente /não deveria/ ser diferente em função da linguagem e implementação da técnica, mas na prática... há uns óbices que precisam ser levados em conta:
1) O diagrama que indica as componentes principais pode ter os 'sinais trocados' nos eixos devido a forma como são calculados os autovetores e autovalores; 2) No caso dos biplots há três maneiras de representá-los, com as "flechas" neles tendo significado métrico levemente diferente na hora de interpretar; 3) Algumas implementações oferecem mais objetos de análise em adição às tabelas decorrentes dos cálculos das componentes principais.
Essas diferenças podem ser vistas no próprio R com as várias funções para produzir a análise (number crunching) e os gráficos em pacotes diversos.
OK quanto ao latim 🤓. Nos países de língua inglesa é muito usada porque nos contratos "padrão" de venda essa expressão advinda do jargão legal caiu no uso devido à repetição em contratos, avisos dos órgãos de proteção ao consumidor, etc. A própria palavra /caveat /sozinha às vezes é usada na conversa cotidiana.
Qtº a ficar mais chique, existe um aforismo, em latim é claro sobre isso¹: QUIDQUID LATINE DICTUM SIT ALTUM VIDETUR!!
[]s -- Cesar Rabak
[1] “O que é dito em latim soa profundo”.
On Mon, Dec 7, 2020 at 11:34 AM Nei por (R-br) <r-br@listas.c3sl.ufpr.br <mailto:r-br@listas.c3sl.ufpr.br>> wrote:
Oi Cesar,
Você tem razão, os links apontam para tutoriais sobre PCA que utilizam o Python como ferramenta computacional.
Mas eu compartilhei os links pois a pergunta se referia à interpretação dos resultados de PCA, e não ao uso da ferramenta R.
E nesses tutoriais eu procurei discutir alguns conceitos sobre a técnica estatística, independente da ferramenta computacional usada, e que poderiam ser úteis para o Fernando.
Obrigado pela expressão "caveat emptor". Aprendi mais uma.
Entendi como um sinônimo de "disclaimer".
Vou incluir no meu site pra ficar mais "chique". :-)
Um Abraço,
Markos
Em 07-12-2020 10:13, Cesar Rabak por (R-br) escreveu:
Só agora pude dar uma vista d'olhos nas referências indicadas.
Um senão (/caveat emptor/) precisa ser colocado: os exemplos usam Python e não R.
HTH
On Thu, Apr 23, 2020 at 11:10 PM Nei por (R-br) <r-br@listas.c3sl.ufpr.br <mailto:r-br@listas.c3sl.ufpr.br>> wrote:
http://www.c2o.pro.br/hackaguas/apx.html
http://www.c2o.pro.br/hackaguas/apxs02.html
Em 22-04-2020 18:25, Fernando Souza por (R-br) escreveu:
Olá pessoal tudo bem
Estou realizando uma análise de componentes principais, com o objetivo de selecionar as melhores variáveis para uma análise multivariada.
Gostaria de uma orientação sobre a interpretação. Eu interpretei de forma correta? Variáveis que possuem alta correlação com um CP também estão correlacionadas entre si. Isso significa que posso utilizar somente uma das principais variáveis do CP1 (por exemplo) para incluir no modelo multivariado? No caso a variável que apresentar significado para o trabalho.
Os círculos de correlação, screem plot e corrplot geradas pelo Pca estão disponíveis no link https://drive.google.com/open?id=1jS5tCX-2-qHo2Gbej00DkFQBpLztwXks
A interpretação que fiz foi a seguinte:
Considerei as variáveis PC,IC e Prod leite (Azul no gráfico) como variável suplementar quantitativa. Baseado no ScreenPlot selecionei somente 5 CP para avaliação que explicaram 67,80% da variancia total. Pela minha interpretação cheguei as seguintes conclusões
Principais variáveis para cada componente:
Consumos (CP1): CMS,CMO,CPB,CEE,CCNF,CFDNcp,CFDA,CNDT,CEB,CED,CEM,CEL
Energia (CP2) : EB,ED,EM,EL
Peso (CP3): PV,PCJ,PCVZ,PCVZ075
Composição do Leite(CP4) : Solido e DCNF
Variaveis sanguíneas (CP5): PT e ALBUMINA
Segue uma descrição do trabalho para compreensão. Aceito sugestões sobre a melhor forma trabalhar esses dados
O banco de dados é oriundo dois estudos realizados pelo mesmo grupo de pesquisa nas mesmas condições experimentais (animais,instalação,dieta,manejo) e avaliaram 48 variáveis. Os fatores experimentais foram: *Raça*: Estudo 1 avaliou 12 animais (6 raça1 e 6 da raça 2). O estudo 2 avaliou 13 animais (6 raça 1 e 7 raça 2) *Plano nutricional:* O estudo 1 avaliou os níveis (0,15,30) o estudo 2 avaliou os níveis (0,5,10,20) *Dias em lactação-DEL* (medidas repetidas no tempo): Estudo 1, dias dispersos entre os períodos de 30 a 120 dias. No estudo 2 os DEL foram avaliados em dias entre 150 a 250 dias.
Eu realizei uma análise gráfica e não há indicações de haver diferenças entre estudos, o que era de certo modo esperado. Raça e DEL parecem ser os fatores que afetam as variáveis respostas.
-- ========================================= Fernando Souza Zootecnista, DSc. Produção e Alimentação Animal Celular: (31)99796-8781 (Vivo) E-mail:nandodesouza@gmail.com <mailto:e-mail%3Anandodesouza@gmail.com> Lattes: http://lattes.cnpq.br/6519538815038307 Blog: https://producaoanimalcomr.wordpress.com/ ==========================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br <mailto:R-br@listas.c3sl.ufpr.br> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br <mailto:R-br@listas.c3sl.ufpr.br> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br <mailto:R-br@listas.c3sl.ufpr.br> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br <mailto:R-br@listas.c3sl.ufpr.br> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

OK Nei! Veja que mesmo no *próprio* R, dependendo do "pacote" (*library*) a análise pode vir com sinais trocados, por exemplo princomp, prcomp, dão resultados diferentes das da ADE, FactoMiner, etc. [] On Wed, Dec 9, 2020 at 1:39 PM Nei por (R-br) <r-br@listas.c3sl.ufpr.br> wrote:
Bom Dia Cesar,
Obrigado pelas dicas sobre PCA.
Eu já tinha percebido a questão dos "sinais trocados" quando se usa Matlab ou Python.
E obrigado por mais uma expressão latina para a minha coleção. :-)
Um Abraço,
Markos
Em 07-12-2020 16:08, Cesar Rabak escreveu:
OK Nei!
A interpretação, obviamente *não deveria* ser diferente em função da linguagem e implementação da técnica, mas na prática... há uns óbices que precisam ser levados em conta:
1) O diagrama que indica as componentes principais pode ter os 'sinais trocados' nos eixos devido a forma como são calculados os autovetores e autovalores; 2) No caso dos biplots há três maneiras de representá-los, com as "flechas" neles tendo significado métrico levemente diferente na hora de interpretar; 3) Algumas implementações oferecem mais objetos de análise em adição às tabelas decorrentes dos cálculos das componentes principais.
Essas diferenças podem ser vistas no próprio R com as várias funções para produzir a análise (number crunching) e os gráficos em pacotes diversos.
OK quanto ao latim 🤓. Nos países de língua inglesa é muito usada porque nos contratos "padrão" de venda essa expressão advinda do jargão legal caiu no uso devido à repetição em contratos, avisos dos órgãos de proteção ao consumidor, etc. A própria palavra *caveat *sozinha às vezes é usada na conversa cotidiana.
Qtº a ficar mais chique, existe um aforismo, em latim é claro sobre isso¹: QUIDQUID LATINE DICTUM SIT ALTUM VIDETUR!!
[]s -- Cesar Rabak
[1] “O que é dito em latim soa profundo”.
On Mon, Dec 7, 2020 at 11:34 AM Nei por (R-br) <r-br@listas.c3sl.ufpr.br> wrote:
Oi Cesar,
Você tem razão, os links apontam para tutoriais sobre PCA que utilizam o Python como ferramenta computacional.
Mas eu compartilhei os links pois a pergunta se referia à interpretação dos resultados de PCA, e não ao uso da ferramenta R.
E nesses tutoriais eu procurei discutir alguns conceitos sobre a técnica estatística, independente da ferramenta computacional usada, e que poderiam ser úteis para o Fernando.
Obrigado pela expressão "caveat emptor". Aprendi mais uma.
Entendi como um sinônimo de "disclaimer".
Vou incluir no meu site pra ficar mais "chique". :-)
Um Abraço,
Markos
Em 07-12-2020 10:13, Cesar Rabak por (R-br) escreveu:
Só agora pude dar uma vista d'olhos nas referências indicadas.
Um senão (*caveat emptor*) precisa ser colocado: os exemplos usam Python e não R.
HTH
On Thu, Apr 23, 2020 at 11:10 PM Nei por (R-br) <r-br@listas.c3sl.ufpr.br> wrote:
http://www.c2o.pro.br/hackaguas/apx.html
http://www.c2o.pro.br/hackaguas/apxs02.html
Em 22-04-2020 18:25, Fernando Souza por (R-br) escreveu:
Olá pessoal tudo bem
Estou realizando uma análise de componentes principais, com o objetivo de selecionar as melhores variáveis para uma análise multivariada.
Gostaria de uma orientação sobre a interpretação. Eu interpretei de forma correta? Variáveis que possuem alta correlação com um CP também estão correlacionadas entre si. Isso significa que posso utilizar somente uma das principais variáveis do CP1 (por exemplo) para incluir no modelo multivariado? No caso a variável que apresentar significado para o trabalho.
Os círculos de correlação, screem plot e corrplot geradas pelo Pca estão disponíveis no link https://drive.google.com/open?id=1jS5tCX-2-qHo2Gbej00DkFQBpLztwXks
A interpretação que fiz foi a seguinte:
Considerei as variáveis PC,IC e Prod leite (Azul no gráfico) como variável suplementar quantitativa. Baseado no ScreenPlot selecionei somente 5 CP para avaliação que explicaram 67,80% da variancia total. Pela minha interpretação cheguei as seguintes conclusões
Principais variáveis para cada componente:
Consumos (CP1): CMS,CMO,CPB,CEE,CCNF,CFDNcp,CFDA,CNDT,CEB,CED,CEM,CEL
Energia (CP2) : EB,ED,EM,EL
Peso (CP3): PV,PCJ,PCVZ,PCVZ075
Composição do Leite(CP4) : Solido e DCNF
Variaveis sanguíneas (CP5): PT e ALBUMINA
Segue uma descrição do trabalho para compreensão. Aceito sugestões sobre a melhor forma trabalhar esses dados
O banco de dados é oriundo dois estudos realizados pelo mesmo grupo de pesquisa nas mesmas condições experimentais (animais,instalação,dieta,manejo) e avaliaram 48 variáveis. Os fatores experimentais foram: *Raça*: Estudo 1 avaliou 12 animais (6 raça1 e 6 da raça 2). O estudo 2 avaliou 13 animais (6 raça 1 e 7 raça 2) *Plano nutricional:* O estudo 1 avaliou os níveis (0,15,30) o estudo 2 avaliou os níveis (0,5,10,20) *Dias em lactação-DEL* (medidas repetidas no tempo): Estudo 1, dias dispersos entre os períodos de 30 a 120 dias. No estudo 2 os DEL foram avaliados em dias entre 150 a 250 dias.
Eu realizei uma análise gráfica e não há indicações de haver diferenças entre estudos, o que era de certo modo esperado. Raça e DEL parecem ser os fatores que afetam as variáveis respostas.
-- ========================================= Fernando Souza Zootecnista, DSc. Produção e Alimentação Animal Celular: (31)99796-8781 (Vivo) E-mail:nandodesouza@gmail.com <e-mail%3Anandodesouza@gmail.com> Lattes: http://lattes.cnpq.br/6519538815038307 Blog: https://producaoanimalcomr.wordpress.com/ ==========================================
_______________________________________________ R-br mailing listR-br@listas.c3sl.ufpr.brhttps://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing listR-br@listas.c3sl.ufpr.brhttps://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Turma D ou A Daniel
On 22 Apr 2020, at 18:25, Fernando Souza por (R-br) <r-br@listas.c3sl.ufpr.br> wrote:
Olá pessoal tudo bem
Estou realizando uma análise de componentes principais, com o objetivo de selecionar as melhores variáveis para uma análise multivariada.
Gostaria de uma orientação sobre a interpretação. Eu interpretei de forma correta? Variáveis que possuem alta correlação com um CP também estão correlacionadas entre si. Isso significa que posso utilizar somente uma das principais variáveis do CP1 (por exemplo) para incluir no modelo multivariado? No caso a variável que apresentar significado para o trabalho.
Os círculos de correlação, screem plot e corrplot geradas pelo Pca estão disponíveis no link https://drive.google.com/open?id=1jS5tCX-2-qHo2Gbej00DkFQBpLztwXks <https://drive.google.com/open?id=1jS5tCX-2-qHo2Gbej00DkFQBpLztwXks>
A interpretação que fiz foi a seguinte:
Considerei as variáveis PC,IC e Prod leite (Azul no gráfico) como variável suplementar quantitativa. Baseado no ScreenPlot selecionei somente 5 CP para avaliação que explicaram 67,80% da variancia total. Pela minha interpretação cheguei as seguintes conclusões
Principais variáveis para cada componente:
Consumos (CP1): CMS,CMO,CPB,CEE,CCNF,CFDNcp,CFDA,CNDT,CEB,CED,CEM,CEL
Energia (CP2) : EB,ED,EM,EL
Peso (CP3): PV,PCJ,PCVZ,PCVZ075
Composição do Leite(CP4) : Solido e DCNF
Variaveis sanguíneas (CP5): PT e ALBUMINA
Segue uma descrição do trabalho para compreensão. Aceito sugestões sobre a melhor forma trabalhar esses dados
O banco de dados é oriundo dois estudos realizados pelo mesmo grupo de pesquisa nas mesmas condições experimentais (animais,instalação,dieta,manejo) e avaliaram 48 variáveis. Os fatores experimentais foram: Raça: Estudo 1 avaliou 12 animais (6 raça1 e 6 da raça 2). O estudo 2 avaliou 13 animais (6 raça 1 e 7 raça 2) Plano nutricional: O estudo 1 avaliou os níveis (0,15,30) o estudo 2 avaliou os níveis (0,5,10,20) Dias em lactação-DEL (medidas repetidas no tempo): Estudo 1, dias dispersos entre os períodos de 30 a 120 dias. No estudo 2 os DEL foram avaliados em dias entre 150 a 250 dias.
Eu realizei uma análise gráfica e não há indicações de haver diferenças entre estudos, o que era de certo modo esperado. Raça e DEL parecem ser os fatores que afetam as variáveis respostas.
-- ========================================= Fernando Souza Zootecnista, DSc. Produção e Alimentação Animal Celular: (31)99796-8781 (Vivo) E-mail:nandodesouza@gmail.com <mailto:e-mail%3Anandodesouza@gmail.com> Lattes: http://lattes.cnpq.br/6519538815038307 <http://lattes.cnpq.br/6519538815038307> Blog: https://producaoanimalcomr.wordpress.com/ <https://producaoanimalcomr.wordpress.com/> ========================================== _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Olá Daniel pode compartilhar o Scrip dos gráficos que você fez? Da PCA. Coloque qual a pergunta que a PCA está respondendo para poder ajudar melhor. *Eucilene Alves Santana* *Doutora em Ciências* *Pesquisadora Colaboradora* *Pós Graduação em Geografia* *Universidade de Brasília - UnBCampus Universitário Darcy RibeiroICC Norte|CEP 70910-900|Brasília-DFSite: http://lagas.unb.br <http://lagas.unb.br/>Telefone: +55 (61) 3107-7594 ou 3107-7251* *https://www.researchgate.net/profile/Eucilene_Alves_Santana <https://www.researchgate.net/profile/Eucilene_Alves_Santana>* *https://www.facebook.com/Eucilenealves2012?ref=tn_tnmn <https://www.facebook.com/Eucilenealves2012?ref=tn_tnmn>* *http://www.linkedin.com/profile/public-profile-settings <http://www.linkedin.com/profile/public-profile-settings>* Em sex., 4 de dez. de 2020 às 11:07, Daniel Guimarães Tiezzi por (R-br) < r-br@listas.c3sl.ufpr.br> escreveu:
Turma D ou A
Daniel
On 22 Apr 2020, at 18:25, Fernando Souza por (R-br) < r-br@listas.c3sl.ufpr.br> wrote:
Olá pessoal tudo bem
Estou realizando uma análise de componentes principais, com o objetivo de selecionar as melhores variáveis para uma análise multivariada.
Gostaria de uma orientação sobre a interpretação. Eu interpretei de forma correta? Variáveis que possuem alta correlação com um CP também estão correlacionadas entre si. Isso significa que posso utilizar somente uma das principais variáveis do CP1 (por exemplo) para incluir no modelo multivariado? No caso a variável que apresentar significado para o trabalho.
Os círculos de correlação, screem plot e corrplot geradas pelo Pca estão disponíveis no link https://drive.google.com/open?id=1jS5tCX-2-qHo2Gbej00DkFQBpLztwXks
A interpretação que fiz foi a seguinte:
Considerei as variáveis PC,IC e Prod leite (Azul no gráfico) como variável suplementar quantitativa. Baseado no ScreenPlot selecionei somente 5 CP para avaliação que explicaram 67,80% da variancia total. Pela minha interpretação cheguei as seguintes conclusões
Principais variáveis para cada componente:
Consumos (CP1): CMS,CMO,CPB,CEE,CCNF,CFDNcp,CFDA,CNDT,CEB,CED,CEM,CEL
Energia (CP2) : EB,ED,EM,EL
Peso (CP3): PV,PCJ,PCVZ,PCVZ075
Composição do Leite(CP4) : Solido e DCNF
Variaveis sanguíneas (CP5): PT e ALBUMINA
Segue uma descrição do trabalho para compreensão. Aceito sugestões sobre a melhor forma trabalhar esses dados
O banco de dados é oriundo dois estudos realizados pelo mesmo grupo de pesquisa nas mesmas condições experimentais (animais,instalação,dieta,manejo) e avaliaram 48 variáveis. Os fatores experimentais foram: *Raça*: Estudo 1 avaliou 12 animais (6 raça1 e 6 da raça 2). O estudo 2 avaliou 13 animais (6 raça 1 e 7 raça 2) *Plano nutricional:* O estudo 1 avaliou os níveis (0,15,30) o estudo 2 avaliou os níveis (0,5,10,20) *Dias em lactação-DEL* (medidas repetidas no tempo): Estudo 1, dias dispersos entre os períodos de 30 a 120 dias. No estudo 2 os DEL foram avaliados em dias entre 150 a 250 dias.
Eu realizei uma análise gráfica e não há indicações de haver diferenças entre estudos, o que era de certo modo esperado. Raça e DEL parecem ser os fatores que afetam as variáveis respostas.
-- ========================================= Fernando Souza Zootecnista, DSc. Produção e Alimentação Animal Celular: (31)99796-8781 (Vivo) E-mail:nandodesouza@gmail.com <e-mail%3Anandodesouza@gmail.com> Lattes: http://lattes.cnpq.br/6519538815038307 Blog: https://producaoanimalcomr.wordpress.com/ ========================================== _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
participantes (6)
-
Cesar Rabak
-
Daniel Guimarães Tiezzi
-
Eucilene Alves Santana
-
Fernando Souza
-
Nei
-
sznelwar@uol.com.br