[R-br] Análise de Fatores PCA e Dendograma

Cesar Rabak cesar.rabak em gmail.com
Domingo Abril 12 18:14:48 BRT 2015


Embora você cite os procedimentos de PCA e plotar dendrograma e "análise
dos fatores", você não dá muita informação de porque você precisa fazer
essa análise e a que conclusões deseja chegar ou quais hipóteses avaliar.

Não sei onde estão os dataframes USArrests2007, USArrests2009 e
USArrests2010, tendo nos meus defaults apenas o USArrests. Considerando
este último, vê-se que a estrutura dele é 50 linhas com cada uma um estado
americano por quatro variáveis (três crimes e uma com a população), se você
 for anexar bancos com estatísticas de diferentes anos você terá que
considerar como colocar a variável ano em jogo e como analisar os estados
americanos para manter apenas as cinquenta linhas...

A análise de componentes principais já faz todos os cálculos necessários,
assim calcular as médias em separado só faria sentido para alguma análise
descritiva (incidentalmente você pode [dependendo do pacote que use para
fazer a PCA] escolher se a análise será centrada na média de cada variável
ou não).

Quanto aos comandos R que você colocou, eles não formam um CMR e por isso
não dá para comentar a respeito.

HTH
--
Cesar Rabak

2015-04-10 16:39 GMT-03:00 Andre Oliveira <andreolsouza em yahoo.com.br>:

> Pessoal boa tarde,
> estou com dois bancos de dados com a estrutura do  USArrests que vem no R
> só que repetido no tempo.  USArrests2007,  USArrests2009,  USArrests2010.
> Gostaria de orientação de como anexar estes dados para em um banco de dados
> único e rodar PCA, Plotar,  dendograma e a análise de fatores.  Pelo que
> percebi em meus devo  fazer o seguinte.  Montar um banco de dados com os
> três bancos e tirar a soma ou média. Não sei se fere princípios da análise.
>
> dados= data.frame(USArrests2007,  USArrests2009,  USArrests2010)   # Não
> sei se é data.frame aqui mesmo!
>
> V1=tapply(V1,grupos,mean)
> .
> .
> .
> .
> .
> Vn=tapply(Vn,grupos,mean)
>
> dadosmedio=cbind(V1, ........................,Vn)
> hclust(dist(dadosmedio)
> prcomp(dadosmédio)
>
> Ou usar a estrutura com  Vn=tapply(Vn,grupos,sum) em vez de Vn=tapply(Vn,grupos,mean).
> Ou usar o próprio banco formado por  USArrests2007,  USArrests2009,
> USArrests2010.
>
> Caso falei besteira, desconsidere. Ficarei agradecido por sugestões.
>
>
> obrigado pela atenção
>
>
>
>
>
>
>
>
> André Oliveira Souza.
> Graduação em Matemática, mestrado em estatística aplicada.Instituto
> Federal de Educação, Ciência e Tecnologia do Espirito Santo.  IFES
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20150412/34f28f15/attachment.html>


Mais detalhes sobre a lista de discussão R-br