Amigos da lista,<br><br>Estou praticando análise de componentes principais para reduzir o número de variáveis para uma análise de cluster.<br>Encontrei um exercício e algumas apostilas do R para análise multivariada.<br> <br>
Seguem os dados do exercício, que pede para usar 2 componentes principais:<br><br>> Lista1MB213<br>           city bread hamburger butter apples tomatoes<br>1     Anchorage  70.9     135.6  155.0   63.9    100.1<br>2       Atlanta  36.4     111.5  144.3   53.9     95.9<br>
3     Baltimore  28.9     108.8  151.0   47.5    104.5<br>4        Boston  43.2     119.3  142.0   41.1     96.5<br>5       Buffalo  34.5     109.9  124.8   35.6     75.9<br>6       Chicago  37.1     107.5  145.4   65.1     94.2<br>
7    Cincinnati  37.1     118.1  149.6   45.6     90.8<br>8     Cleveland  38.5     107.7  142.7   50.3     93.2<br>9        Dallas  35.5     116.8  142.5   62.4     90.7<br>10      Detroit  40.8     108.8  140.1   39.7     96.1<br>
11     Honolulu  50.9     131.7  154.4   65.0     93.9<br>12      Houston  35.1     102.3  150.3   59.3     84.5<br>13   KansasCity  35.1      99.8  162.3   42.6     87.9<br>14   LosAngeles  36.9      96.2  140.4   54.7     79.3<br>
15    Milwaukee  33.3     109.1  123.2   57.7     87.7<br>16  Minneapolis  32.5     116.7  135.1   48.0     89.1<br>17      NewYork  42.7     130.8  148.7   47.6     92.1<br>18 Philadelphia  42.9     126.9  153.8   51.9    101.5<br>
19   Pittsburgh  36.9     115.4  138.9   43.8     91.9<br>20      StLouis  36.9     109.8  140.0   46.7     79.0<br>21     SanDiego  32.5      84.5  145.9   48.5     82.3<br>22 SanFrancisco  40.0     104.6  139.1   59.2     81.9<br>
23      Seattle  32.2     105.4  136.8   54.0     88.6<br>24   Washington  31.8     116.7  154.8   57.6     86.6<br><br>dados <- Lista1MB213[,2:6]<br><br>standardise <- as.data.frame(scale(dados))<br><br>lanche.pca <- prcomp(standardise)<br>
<br>> summary(lanche.pca)<br>Importance of components:<br>                                   PC1    PC2    PC3    PC4     PC5<br>Standard deviation     1.5591 0.9654 0.9134 0.7252 0.52613<br>Proportion of Variance 0.4862 0.1864 0.1669 0.1052 0.05536<br>
Cumulative Proportion  0.4862 0.6726 0.8394 0.9446 1.00000<br clear="all"><br>A minha dúvida é como distribuir as cinco variáveis no dois componentes PC1 e PC2 que juntos explicam 67,26% da<br>variância. Como seria a equação de combinação linear?<br>
Há muito tempo li em um tutorial do SPSS a solução, mas não lembro onde encontrá-lo.<br>Agradeço antecipadamente qualquer ajuda.<br><br><br>-- <br>Atenciosamente,<br><br>Prof. Carlos A. S. de Andrade<br>LAPEA - Laboratório de Pesquisa em Economia Aplicada e Engenharia de Produção<br>
<div>Universidade Federal de Campina Grande.<br></div><div> Centro de Humanidades 
 </div><div>Unidade Acadêmica de Economia</div>