[R-br] análise multivariada em grandes dados

Edimeire Alexandra Pinto economatistica em yahoo.com.br
Quarta Julho 13 18:24:03 BRT 2016


OI gente!!!Obrigada pelas ajudas.
Pois é, o problema ocorria na hora de manipular os dados, por exemplo, construir gráficos, e analisar pressupostos, por exemplo, multicolinearidade, outliers, etc. Em alguns casos precisa verificar a normalidade multivariada e não dava, às vezes até para achar ponto de corte das populações acusava problema. Muitas vezes chegava até a achar a equação de discriminação, mas na hora de manipular os dados ficava muito lento..., 
Estou tentando filtro mais os dados, trabalhar com o pacote dplyr e reduzir mais a base de dados. Estava usando muito tapply, apply, e realmente isso pesa o processamento. 
Mas com ajuda de vcs já contornei 90% dos problemas.
Gente, valeu 

    Em Quarta-feira, 13 de Julho de 2016 6:34, Elias Teixeira Krainski via R-br <r-br em listas.c3sl.ufpr.br> escreveu:
 

 On 12/07/16 21:33, Edimeire Alexandra Pinto via R-br wrote:
> análise discriminante e fatorial

Curiosidade: como você está fazendo essas duas análises? Ambas essas 
análises só dependem da matriz de covariância e do número de 
observações, não das observações propriamente. Se você tem, digamos, 100 
variáveis, tanto faz ter 1mil ou 1bilhão de dados pois a matriz de 
covariância tem a mesma dimensão.

Elias

_______________________________________________
R-br mailing list
R-br em listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e fornea cdigo mnimo reproduzvel.

  
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20160713/dbbdc4a7/attachment.html>


Mais detalhes sobre a lista de discussão R-br