[R-br] cluster 5MM
Elias Teixeira Krainski
eliaskrainski em yahoo.com.br
Quarta Fevereiro 20 19:26:51 BRT 2013
Num note bem 'pobre' (Intel 2 core, 4Gb RAM) o exemplo abaixo funcionou
sem problema
n <- 5e6
### simula 20 grupos em 5 variaveis
d <- cbind(runif(n)+1:10, rnorm(n,-2:2,0.3),
rbinom(n,5,c(2,1,3,2,5)/7), runif(n)+1:0, runif(n)+20:1)
require(cluster)
cl <- clara(d, 20)
table(cl$clustering, rep(1:20, n/20))
Att.
Elias.
On Wed, 2013-02-20 at 19:08 -0300, Vinicius Brito Rocha wrote:
> Pessoal,
>
>
> tenho uma base com 5 milhoes de registros e 20 variáveis.
>
>
> preciso clusteriza-la.
>
>
> alguém pode me ajudar.
>
>
> Sera que o clara do pacote cluster resolve?
>
>
> dentre os pacotes bigmemory e biganalytics tem funçoes de cluster?
>
>
>
>
>
>
>
>
> Abs
>
>
> --
> Vinicius Brito Rocha.
> Estatístico e Atuário (IM / UFRJ)
> Mestre em Pesquisa Operacional (COPPE / UFRJ)
>
> www.aplicademic.blogspot.com
> http://twitter.com/viniciusbritor
>
> "Não se preocupe muito com as suas dificuldades em Matemática, posso
> assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
Mais detalhes sobre a lista de discussão R-br