Cesar Rabak,
obrigado pela
resposta. Esta é a questão como organizar os três bancos de
dados levando em conta a variável ano, pois, pelo que tenho
olhado as funções hclust() e prcomp() não extrai os
PCAs e nem o dendograma replicando ano. Todos os exemplos do R
trabalham com dados de um ano apenas. O objetivo é agrupar as
cidades e os bancos de dados USArrests2007,
USArrests2009 e USArrests2010 são fictícios e estão ai
apenas para ilustrar que tenho 3 bancos com mesma estrutura
do USArrests.
Dado que tenho
apenas o USArrests, tudo pode
ser resolvido com o CMR com pequenas variações de escala e
padronização das variáveis se desejar.
hc=hclust(dist(USArrests))
plot(hc)
summary(prcomp(USArrests))
Obrigado
André Oliveira Souza.
Graduação em Matemática, mestrado em estatística
aplicada.Instituto Federal de Educação, Ciência e Tecnologia
do Espirito Santo. IFES
Embora você cite os procedimentos de
PCA e plotar dendrograma e "análise dos fatores",
você não dá muita informação de porque você
precisa fazer essa análise e a que conclusões
deseja chegar ou quais hipóteses avaliar.
Não sei onde estão os dataframes
USArrests2007, USArrests2009 e USArrests2010,
tendo nos meus defaults apenas o USArrests.
Considerando este último, vê-se que a estrutura
dele é 50 linhas com cada uma um estado
americano por quatro variáveis (três crimes e
uma com a população), se você for anexar bancos
com estatísticas de diferentes anos você terá
que considerar como colocar a variável ano em
jogo e como analisar os estados americanos para
manter apenas as cinquenta linhas...
A análise de componentes principais já faz
todos os cálculos necessários, assim calcular as
médias em separado só faria sentido para alguma
análise descritiva (incidentalmente você pode
[dependendo do pacote que use para fazer a PCA]
escolher se a análise será centrada na média de
cada variável ou não).
Quanto aos comandos R que você colocou,
eles não formam um CMR e por isso não dá para
comentar a respeito.
HTH
--
Cesar Rabak