[R-br] RES: Cluster + ANOVA

Eder David Borges da Silva eder em leg.ufpr.br
Sexta Julho 29 21:38:04 BRT 2011


Pessoal,
Venho acompanhando o tópico e me gerou algumas duvidas, por exemplo:
### Exemplo do Kmeans
set.seed(123)
x <- rbind(matrix(rnorm(100, sd = 0.3), ncol = 4),
           matrix(rnorm(100, mean = 1, sd = 0.3), ncol = 4))
colnames(x) <- letters[1:4]
head(x)
cl <- kmeans(x, 3)
plot(x, col = cl$cluster)
points(cl$centers, col = 1:2, pch = 8, cex=2)
m1 <- manova(x~as.factor(cl$cluster))
summary(m1)

### Hierarchical Clustering
hc <- hclust(dist(USArrests)^2, "cen")
memb <- cutree(hc, k = 10)
m2 <- manova(as.matrix(USArrests)~as.factor(memb))
summary(m2)

Nestes dois exemplos a MANOVA verificada sob H0 que os centroides dos grupos
são iguais, certo?
 isso poderia ser um meio de validação que realmente os grupos são
diferentes entre si. Meu conhecimento vai até ai, Agora quanto a resposta do
Fernando não consegui entender como a ANOVA poderia ser utilizada. No livro
de multivariada do Furtado ele cita a MANOVA como validação dos grupos, pena
que não faz um exemplo para esclarecer melhor.
Outra duvida que surgiu foi a seguinte: A MANOVA quando tenho dois grupos
OK, mas quando são n grupos como poderemos por exemplo de 9 grupos formados
se 8 forem iguais e apenas um for diferente a MANOVA será significativa, as
entre os 8 grupos não é.

O tópico é bem interessante...
Att



Em 29 de julho de 2011 19:09, Fernando Henrique Toledo <
fernandohtoledo em gmail.com> escreveu:

> Vinicius, boa noite!
>
> Estou acompanhando aqui esse tópico!
>
> Uma vez fiz uma coisa um pouco parecida com o que você viu. O que fiz foi a
> partir de duas formas de agrupar (clusterizar) um conjunto de tratamentos
> realizei um ANOVA one-way.
>
> Essa abordagem foi proposta por mei orientador (que é da old school). A
> princípio achei um pouco simples "demais". Mas depois fui compreendendo a
> idéia...
>
> A SQ do erro da ANOVA one-way é a média das variâncias dentro de cada
> tratamento. Nesse caso os tratamentos eram os tratamentos, propriamente
> ditos, dentro dos clusteres. O resultado dessa ANOVA permitiu ver qual era o
> método de agrupamento que "melhor" agrupava os tratamentos... gerando a
> menor SQ. Permitiu ver tb, Parametrizando como Efeitos de grupo e tratamento
> dentro de grupo, os grupos com maiores variâncias dentro (indicativo de um
> agrupamento "fraco").
>
> Não sou teórico o suficiente p/ me delongar, nem sei se o que falei ou fiz
> esta de todo certo ou foi pura masturbação de dados ou ainda se existe uma
> forma "melhor" de se fazer isso! Mas EU não vejo porque isso possa estar
> errado... Fiquem a vontade p/ me corrigir.
>
> att,
> FH
>
>
> 2011/7/29 Vinicius Brito Rocha <viniciusbritor em gmail.com>
>
>> Senhores,
>>
>> vejão bem, eu sei o que cada técnica siginifica. O que perguntei foi:
>>
>> Alguém já utilizou avaliação de clusters via ANOVA.
>>
>>
>> Guilherme não é MANOVA. é ANOVA utilizando as somas de quadrados, de
>> resíduos e totais.
>>
>> Abs
>>
>>
>>
>>
>> Em 29 de julho de 2011 15:03, Hugo Zeni <hzeni82 em gmail.com> escreveu:
>>
>>   Vinicius,****
>>>
>>> ** **
>>>
>>> Pelo o que eu sei você realiza um agrupamento (seja hierárquico ou não)
>>> pelas medidas de similaridade ou dissimilaridade.****
>>>
>>> ** **
>>>
>>> O fato de usar uma MANOVA como o Guilherme citou acredito que seja para
>>> validação desse agrupamento.****
>>>
>>> ** **
>>>
>>> Caso esteja falando muita besteira me corrijam, pois também fiquei na
>>> dúvida, se não acredito que seja por aí!****
>>>
>>> ** **
>>>
>>> Abraços****
>>>
>>> Zeni****
>>>
>>> ** **
>>>
>>> *De:* r-br-bounces em listas.c3sl.ufpr.br [mailto:
>>> r-br-bounces em listas.c3sl.ufpr.br] *Em nome de *Vinicius Brito Rocha
>>> *Enviada em:* Friday, July 29, 2011 2:25 PM
>>> *Para:* r-br em listas.c3sl.ufpr.br
>>> *Assunto:* Re: [R-br] Cluster + ANOVA****
>>>
>>> ** **
>>>
>>> Bom, no livro esta ANOVA.****
>>>
>>> De qualquer forma se vc tiver um material de como fazer via MANOVA estou
>>> aceitando.****
>>>
>>>  ****
>>>
>>> Att.****
>>>
>>> Em 29 de julho de 2011 14:10, Guilherme Moraes Ferraudo <
>>> guiferraudo em gmail.com> escreveu:****
>>>
>>> Vinicius não seria via MANOVA???
>>>
>>> Em 29 de julho de 2011 11:48, Vinicius Brito Rocha
>>> <viniciusbritor em gmail.com> escreveu:****
>>>
>>> > Srs.
>>> >
>>> > Estou lendo um livro de multivariada onde existe uma avaliação dos
>>> cluster
>>> > produzidos pelo K-means através de ANOVA.
>>> >
>>> > Não entendi muito bem o que estava sendo feito. Num primeito momento me
>>> > pareceu que para cada variável realizava-se uma ANOVA, e amarzenava-se
>>> as
>>> > somas de quadrados individualmente.
>>> >
>>> > Alguém já viu isso? Ou melhor. Alguem já avaliou cluster via ANOVA?
>>> >
>>> > Att.
>>> >
>>> > --
>>> > Vinicius Brito Rocha.
>>> > Estatístico e Atuário,
>>> > Mestre em Pesquisa Operacional
>>> >
>>> > www.aplicademic.blogspot.com
>>> > http://twitter.com/viniciusbritor
>>> >
>>> > "Não se preocupe muito com as suas dificuldades em Matemática, posso
>>> > assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.
>>> >
>>> >
>>> >****
>>>
>>> > _______________________________________________
>>> > R-br mailing list
>>> > R-br em listas.c3sl.ufpr.br
>>> > https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>> > Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>> código
>>> > mínimo reproduzível.
>>> >
>>>
>>>
>>>
>>> --
>>> Guilherme Moraes Ferraudo
>>> Jaboticabal/Campinas - SP
>>> http://lattes.cnpq.br/2096118558794430
>>> _______________________________________________
>>> R-br mailing list
>>> R-br em listas.c3sl.ufpr.br
>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>> código mínimo reproduzível.****
>>>
>>>
>>>
>>>
>>> --
>>> Vinicius Brito Rocha.
>>> Estatístico e Atuário,
>>> Mestre em Pesquisa Operacional
>>>
>>> www.aplicademic.blogspot.com
>>> http://twitter.com/viniciusbritor
>>>
>>> "Não se preocupe muito com as suas dificuldades em Matemática, posso
>>> assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.
>>>
>>> ****
>>>
>>> _______________________________________________
>>> R-br mailing list
>>> R-br em listas.c3sl.ufpr.br
>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>> código mínimo reproduzível.
>>>
>>
>>
>>
>> --
>> Vinicius Brito Rocha.
>> Estatístico e Atuário,
>> Mestre em Pesquisa Operacional
>>
>> www.aplicademic.blogspot.com
>> http://twitter.com/viniciusbritor
>>
>> "Não se preocupe muito com as suas dificuldades em Matemática, posso
>> assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.
>>
>>
>>
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20110729/c7156249/attachment.html>


Mais detalhes sobre a lista de discussão R-br