[R-br] cluster 5MM

Vinicius Brito Rocha viniciusbritor em gmail.com
Quinta Fevereiro 21 23:54:50 BRT 2013


Elias,
obrigado.

tenho mais uma pergunta.
Vc conhece alguma função de cluster, pode ser hierarquica ou nao que
trabalhe com dados numericos e categoricos (fators) ao mesmo tempo?

na verdade a pergunta correta  seria tem alguma função de distancia que
faça isso?

abs

Vinicius

Em 20 de fevereiro de 2013 19:26, Elias Teixeira Krainski <
eliaskrainski em yahoo.com.br> escreveu:

> Num note bem 'pobre' (Intel 2 core, 4Gb RAM) o exemplo abaixo funcionou
> sem problema
>
> n <- 5e6
> ### simula 20 grupos em 5 variaveis
> d <- cbind(runif(n)+1:10, rnorm(n,-2:2,0.3),
>   rbinom(n,5,c(2,1,3,2,5)/7), runif(n)+1:0, runif(n)+20:1)
>
> require(cluster)
> cl <- clara(d, 20)
> table(cl$clustering, rep(1:20, n/20))
>
> Att.
> Elias.
>
> On Wed, 2013-02-20 at 19:08 -0300, Vinicius Brito Rocha wrote:
> > Pessoal,
> >
> >
> > tenho uma base com 5 milhoes de registros e 20 variáveis.
> >
> >
> > preciso clusteriza-la.
> >
> >
> > alguém pode me ajudar.
> >
> >
> > Sera que o clara do pacote cluster resolve?
> >
> >
> > dentre os pacotes bigmemory e biganalytics tem funçoes de cluster?
> >
> >
> >
> >
> >
> >
> >
> >
> > Abs
> >
> >
> > --
> > Vinicius Brito Rocha.
> > Estatístico e Atuário (IM / UFRJ)
> > Mestre em Pesquisa Operacional (COPPE / UFRJ)
> >
> > www.aplicademic.blogspot.com
> > http://twitter.com/viniciusbritor
> >
> > "Não se preocupe muito com as suas dificuldades em Matemática, posso
> > assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.
> >
> >
> > _______________________________________________
> > R-br mailing list
> > R-br em listas.c3sl.ufpr.br
> > https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> > Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>



-- 
*Vinicius Brito Rocha.*
*Estatístico e Atuário (IM / UFRJ)**
Mestre em Pesquisa Operacional (COPPE / UFRJ)*

www.aplicademic.blogspot.com
http://twitter.com/viniciusbritor

"Não se preocupe muito com as suas dificuldades em Matemática, posso
assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20130221/82cf119f/attachment.html>


Mais detalhes sobre a lista de discussão R-br