[R-br] cluster 5MM

Elias Teixeira Krainski eliaskrainski em yahoo.com.br
Quarta Fevereiro 20 19:26:51 BRT 2013


Num note bem 'pobre' (Intel 2 core, 4Gb RAM) o exemplo abaixo funcionou
sem problema

n <- 5e6 
### simula 20 grupos em 5 variaveis
d <- cbind(runif(n)+1:10, rnorm(n,-2:2,0.3), 
  rbinom(n,5,c(2,1,3,2,5)/7), runif(n)+1:0, runif(n)+20:1)

require(cluster)
cl <- clara(d, 20)
table(cl$clustering, rep(1:20, n/20))

Att.
Elias.

On Wed, 2013-02-20 at 19:08 -0300, Vinicius Brito Rocha wrote:
> Pessoal,
> 
> 
> tenho uma base com 5 milhoes de registros e 20 variáveis.
> 
> 
> preciso clusteriza-la.
> 
> 
> alguém pode me ajudar. 
> 
> 
> Sera que o clara do pacote cluster resolve?
> 
> 
> dentre os pacotes bigmemory e biganalytics tem funçoes de cluster?
> 
> 
> 
> 
> 
> 
> 
> 
> Abs
> 
> 
> -- 
> Vinicius Brito Rocha.
> Estatístico e Atuário (IM / UFRJ)
> Mestre em Pesquisa Operacional (COPPE / UFRJ)
> 
> www.aplicademic.blogspot.com
> http://twitter.com/viniciusbritor
> 
> "Não se preocupe muito com as suas dificuldades em Matemática, posso
> assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.
> 
> 
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.




Mais detalhes sobre a lista de discussão R-br