
Srs. Estou lendo um livro de multivariada onde existe uma avaliação dos cluster produzidos pelo K-means através de ANOVA. Não entendi muito bem o que estava sendo feito. Num primeito momento me pareceu que para cada variável realizava-se uma ANOVA, e amarzenava-se as somas de quadrados individualmente. Alguém já viu isso? Ou melhor. Alguem já avaliou cluster via ANOVA? Att. -- Vinicius Brito Rocha. Estatístico e Atuário, Mestre em Pesquisa Operacional www.aplicademic.blogspot.com http://twitter.com/viniciusbritor "Não se preocupe muito com as suas dificuldades em Matemática, posso assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.

Vinicius não seria via MANOVA??? Em 29 de julho de 2011 11:48, Vinicius Brito Rocha <viniciusbritor@gmail.com> escreveu:
Srs.
Estou lendo um livro de multivariada onde existe uma avaliação dos cluster produzidos pelo K-means através de ANOVA.
Não entendi muito bem o que estava sendo feito. Num primeito momento me pareceu que para cada variável realizava-se uma ANOVA, e amarzenava-se as somas de quadrados individualmente.
Alguém já viu isso? Ou melhor. Alguem já avaliou cluster via ANOVA?
Att.
-- Vinicius Brito Rocha. Estatístico e Atuário, Mestre em Pesquisa Operacional
www.aplicademic.blogspot.com http://twitter.com/viniciusbritor
"Não se preocupe muito com as suas dificuldades em Matemática, posso assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Guilherme Moraes Ferraudo Jaboticabal/Campinas - SP http://lattes.cnpq.br/2096118558794430

Bom, no livro esta ANOVA. De qualquer forma se vc tiver um material de como fazer via MANOVA estou aceitando. Att. Em 29 de julho de 2011 14:10, Guilherme Moraes Ferraudo < guiferraudo@gmail.com> escreveu:
Vinicius não seria via MANOVA???
Em 29 de julho de 2011 11:48, Vinicius Brito Rocha <viniciusbritor@gmail.com> escreveu:
Srs.
Estou lendo um livro de multivariada onde existe uma avaliação dos cluster produzidos pelo K-means através de ANOVA.
Não entendi muito bem o que estava sendo feito. Num primeito momento me pareceu que para cada variável realizava-se uma ANOVA, e amarzenava-se as somas de quadrados individualmente.
Alguém já viu isso? Ou melhor. Alguem já avaliou cluster via ANOVA?
Att.
-- Vinicius Brito Rocha. Estatístico e Atuário, Mestre em Pesquisa Operacional
www.aplicademic.blogspot.com http://twitter.com/viniciusbritor
"Não se preocupe muito com as suas dificuldades em Matemática, posso assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Guilherme Moraes Ferraudo Jaboticabal/Campinas - SP http://lattes.cnpq.br/2096118558794430 _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Vinicius Brito Rocha. Estatístico e Atuário, Mestre em Pesquisa Operacional www.aplicademic.blogspot.com http://twitter.com/viniciusbritor "Não se preocupe muito com as suas dificuldades em Matemática, posso assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.

Vinicius segue o código. Lembrando que no meu código o objeto "dados" é um data.frame E MANOVA significa "Multivariate Analysis of Variance" já que vc tem mais que uma variável resposta. #### Código R #### paises_kmeans7 = kmeans(dados, centers = 7, nstart = 1111) # nstart: semente aleatória dados_kmeans7_final = data.frame(dados,cluster = as.factor(paises_kmeans7$cluster)) ##Ajustando o modelo multivariado considerando os grupos formados pelo método K-means mod_manova = manova(as.matrix(dados) ~ dados_kmeans7_final$cluster) E = mod_manova$res #matriz de resíduos (erros) #por default já é o Pillai summary(mod_manova) #ou summary(mod_manova, test = "Pillai") summary(mod_manova, test = "Wilks") summary(mod_manova, test = "Hotelling") summary(mod_manova, test = "Roy") ## Se surgir mais dúvidas vai falando. Abs -- Guilherme Moraes Ferraudo Jaboticabal/Campinas - SP http://lattes.cnpq.br/2096118558794430

Vinicius, Pelo o que eu sei você realiza um agrupamento (seja hierárquico ou não) pelas medidas de similaridade ou dissimilaridade. O fato de usar uma MANOVA como o Guilherme citou acredito que seja para validação desse agrupamento. Caso esteja falando muita besteira me corrijam, pois também fiquei na dúvida, se não acredito que seja por aí! Abraços Zeni De: r-br-bounces@listas.c3sl.ufpr.br [mailto:r-br-bounces@listas.c3sl.ufpr.br] Em nome de Vinicius Brito Rocha Enviada em: Friday, July 29, 2011 2:25 PM Para: r-br@listas.c3sl.ufpr.br Assunto: Re: [R-br] Cluster + ANOVA Bom, no livro esta ANOVA. De qualquer forma se vc tiver um material de como fazer via MANOVA estou aceitando. Att. Em 29 de julho de 2011 14:10, Guilherme Moraes Ferraudo <guiferraudo@gmail.com> escreveu: Vinicius não seria via MANOVA??? Em 29 de julho de 2011 11:48, Vinicius Brito Rocha <viniciusbritor@gmail.com> escreveu:
Srs.
Estou lendo um livro de multivariada onde existe uma avaliação dos cluster produzidos pelo K-means através de ANOVA.
Não entendi muito bem o que estava sendo feito. Num primeito momento me pareceu que para cada variável realizava-se uma ANOVA, e amarzenava-se as somas de quadrados individualmente.
Alguém já viu isso? Ou melhor. Alguem já avaliou cluster via ANOVA?
Att.
-- Vinicius Brito Rocha. Estatístico e Atuário, Mestre em Pesquisa Operacional
www.aplicademic.blogspot.com <http://www.aplicademic.blogspot.com/> http://twitter.com/viniciusbritor
"Não se preocupe muito com as suas dificuldades em Matemática, posso assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Guilherme Moraes Ferraudo Jaboticabal/Campinas - SP http://lattes.cnpq.br/2096118558794430 _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível. -- Vinicius Brito Rocha. Estatístico e Atuário, Mestre em Pesquisa Operacional www.aplicademic.blogspot.com <http://www.aplicademic.blogspot.com/> http://twitter.com/viniciusbritor "Não se preocupe muito com as suas dificuldades em Matemática, posso assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.

Senhores, vejão bem, eu sei o que cada técnica siginifica. O que perguntei foi: Alguém já utilizou avaliação de clusters via ANOVA. Guilherme não é MANOVA. é ANOVA utilizando as somas de quadrados, de resíduos e totais. Abs Em 29 de julho de 2011 15:03, Hugo Zeni <hzeni82@gmail.com> escreveu:
Vinicius,****
** **
Pelo o que eu sei você realiza um agrupamento (seja hierárquico ou não) pelas medidas de similaridade ou dissimilaridade.****
** **
O fato de usar uma MANOVA como o Guilherme citou acredito que seja para validação desse agrupamento.****
** **
Caso esteja falando muita besteira me corrijam, pois também fiquei na dúvida, se não acredito que seja por aí!****
** **
Abraços****
Zeni****
** **
*De:* r-br-bounces@listas.c3sl.ufpr.br [mailto: r-br-bounces@listas.c3sl.ufpr.br] *Em nome de *Vinicius Brito Rocha *Enviada em:* Friday, July 29, 2011 2:25 PM *Para:* r-br@listas.c3sl.ufpr.br *Assunto:* Re: [R-br] Cluster + ANOVA****
** **
Bom, no livro esta ANOVA.****
De qualquer forma se vc tiver um material de como fazer via MANOVA estou aceitando.****
****
Att.****
Em 29 de julho de 2011 14:10, Guilherme Moraes Ferraudo < guiferraudo@gmail.com> escreveu:****
Vinicius não seria via MANOVA???
Em 29 de julho de 2011 11:48, Vinicius Brito Rocha <viniciusbritor@gmail.com> escreveu:****
Srs.
Estou lendo um livro de multivariada onde existe uma avaliação dos cluster produzidos pelo K-means através de ANOVA.
Não entendi muito bem o que estava sendo feito. Num primeito momento me pareceu que para cada variável realizava-se uma ANOVA, e amarzenava-se as somas de quadrados individualmente.
Alguém já viu isso? Ou melhor. Alguem já avaliou cluster via ANOVA?
Att.
-- Vinicius Brito Rocha. Estatístico e Atuário, Mestre em Pesquisa Operacional
www.aplicademic.blogspot.com http://twitter.com/viniciusbritor
"Não se preocupe muito com as suas dificuldades em Matemática, posso assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.
****
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Guilherme Moraes Ferraudo Jaboticabal/Campinas - SP http://lattes.cnpq.br/2096118558794430 _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.****
-- Vinicius Brito Rocha. Estatístico e Atuário, Mestre em Pesquisa Operacional
www.aplicademic.blogspot.com http://twitter.com/viniciusbritor
"Não se preocupe muito com as suas dificuldades em Matemática, posso assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.
****
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Vinicius Brito Rocha. Estatístico e Atuário, Mestre em Pesquisa Operacional www.aplicademic.blogspot.com http://twitter.com/viniciusbritor "Não se preocupe muito com as suas dificuldades em Matemática, posso assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.

Vinicius, boa noite! Estou acompanhando aqui esse tópico! Uma vez fiz uma coisa um pouco parecida com o que você viu. O que fiz foi a partir de duas formas de agrupar (clusterizar) um conjunto de tratamentos realizei um ANOVA one-way. Essa abordagem foi proposta por mei orientador (que é da old school). A princípio achei um pouco simples "demais". Mas depois fui compreendendo a idéia... A SQ do erro da ANOVA one-way é a média das variâncias dentro de cada tratamento. Nesse caso os tratamentos eram os tratamentos, propriamente ditos, dentro dos clusteres. O resultado dessa ANOVA permitiu ver qual era o método de agrupamento que "melhor" agrupava os tratamentos... gerando a menor SQ. Permitiu ver tb, Parametrizando como Efeitos de grupo e tratamento dentro de grupo, os grupos com maiores variâncias dentro (indicativo de um agrupamento "fraco"). Não sou teórico o suficiente p/ me delongar, nem sei se o que falei ou fiz esta de todo certo ou foi pura masturbação de dados ou ainda se existe uma forma "melhor" de se fazer isso! Mas EU não vejo porque isso possa estar errado... Fiquem a vontade p/ me corrigir. att, FH 2011/7/29 Vinicius Brito Rocha <viniciusbritor@gmail.com>
Senhores,
vejão bem, eu sei o que cada técnica siginifica. O que perguntei foi:
Alguém já utilizou avaliação de clusters via ANOVA.
Guilherme não é MANOVA. é ANOVA utilizando as somas de quadrados, de resíduos e totais.
Abs
Em 29 de julho de 2011 15:03, Hugo Zeni <hzeni82@gmail.com> escreveu:
Vinicius,****
** **
Pelo o que eu sei você realiza um agrupamento (seja hierárquico ou não) pelas medidas de similaridade ou dissimilaridade.****
** **
O fato de usar uma MANOVA como o Guilherme citou acredito que seja para validação desse agrupamento.****
** **
Caso esteja falando muita besteira me corrijam, pois também fiquei na dúvida, se não acredito que seja por aí!****
** **
Abraços****
Zeni****
** **
*De:* r-br-bounces@listas.c3sl.ufpr.br [mailto: r-br-bounces@listas.c3sl.ufpr.br] *Em nome de *Vinicius Brito Rocha *Enviada em:* Friday, July 29, 2011 2:25 PM *Para:* r-br@listas.c3sl.ufpr.br *Assunto:* Re: [R-br] Cluster + ANOVA****
** **
Bom, no livro esta ANOVA.****
De qualquer forma se vc tiver um material de como fazer via MANOVA estou aceitando.****
****
Att.****
Em 29 de julho de 2011 14:10, Guilherme Moraes Ferraudo < guiferraudo@gmail.com> escreveu:****
Vinicius não seria via MANOVA???
Em 29 de julho de 2011 11:48, Vinicius Brito Rocha <viniciusbritor@gmail.com> escreveu:****
Srs.
Estou lendo um livro de multivariada onde existe uma avaliação dos cluster produzidos pelo K-means através de ANOVA.
Não entendi muito bem o que estava sendo feito. Num primeito momento me pareceu que para cada variável realizava-se uma ANOVA, e amarzenava-se as somas de quadrados individualmente.
Alguém já viu isso? Ou melhor. Alguem já avaliou cluster via ANOVA?
Att.
-- Vinicius Brito Rocha. Estatístico e Atuário, Mestre em Pesquisa Operacional
www.aplicademic.blogspot.com http://twitter.com/viniciusbritor
"Não se preocupe muito com as suas dificuldades em Matemática, posso assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.
****
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Guilherme Moraes Ferraudo Jaboticabal/Campinas - SP http://lattes.cnpq.br/2096118558794430 _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.****
-- Vinicius Brito Rocha. Estatístico e Atuário, Mestre em Pesquisa Operacional
www.aplicademic.blogspot.com http://twitter.com/viniciusbritor
"Não se preocupe muito com as suas dificuldades em Matemática, posso assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.
****
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Vinicius Brito Rocha. Estatístico e Atuário, Mestre em Pesquisa Operacional
www.aplicademic.blogspot.com http://twitter.com/viniciusbritor
"Não se preocupe muito com as suas dificuldades em Matemática, posso assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Pessoal, Venho acompanhando o tópico e me gerou algumas duvidas, por exemplo: ### Exemplo do Kmeans set.seed(123) x <- rbind(matrix(rnorm(100, sd = 0.3), ncol = 4), matrix(rnorm(100, mean = 1, sd = 0.3), ncol = 4)) colnames(x) <- letters[1:4] head(x) cl <- kmeans(x, 3) plot(x, col = cl$cluster) points(cl$centers, col = 1:2, pch = 8, cex=2) m1 <- manova(x~as.factor(cl$cluster)) summary(m1) ### Hierarchical Clustering hc <- hclust(dist(USArrests)^2, "cen") memb <- cutree(hc, k = 10) m2 <- manova(as.matrix(USArrests)~as.factor(memb)) summary(m2) Nestes dois exemplos a MANOVA verificada sob H0 que os centroides dos grupos são iguais, certo? isso poderia ser um meio de validação que realmente os grupos são diferentes entre si. Meu conhecimento vai até ai, Agora quanto a resposta do Fernando não consegui entender como a ANOVA poderia ser utilizada. No livro de multivariada do Furtado ele cita a MANOVA como validação dos grupos, pena que não faz um exemplo para esclarecer melhor. Outra duvida que surgiu foi a seguinte: A MANOVA quando tenho dois grupos OK, mas quando são n grupos como poderemos por exemplo de 9 grupos formados se 8 forem iguais e apenas um for diferente a MANOVA será significativa, as entre os 8 grupos não é. O tópico é bem interessante... Att Em 29 de julho de 2011 19:09, Fernando Henrique Toledo < fernandohtoledo@gmail.com> escreveu:
Vinicius, boa noite!
Estou acompanhando aqui esse tópico!
Uma vez fiz uma coisa um pouco parecida com o que você viu. O que fiz foi a partir de duas formas de agrupar (clusterizar) um conjunto de tratamentos realizei um ANOVA one-way.
Essa abordagem foi proposta por mei orientador (que é da old school). A princípio achei um pouco simples "demais". Mas depois fui compreendendo a idéia...
A SQ do erro da ANOVA one-way é a média das variâncias dentro de cada tratamento. Nesse caso os tratamentos eram os tratamentos, propriamente ditos, dentro dos clusteres. O resultado dessa ANOVA permitiu ver qual era o método de agrupamento que "melhor" agrupava os tratamentos... gerando a menor SQ. Permitiu ver tb, Parametrizando como Efeitos de grupo e tratamento dentro de grupo, os grupos com maiores variâncias dentro (indicativo de um agrupamento "fraco").
Não sou teórico o suficiente p/ me delongar, nem sei se o que falei ou fiz esta de todo certo ou foi pura masturbação de dados ou ainda se existe uma forma "melhor" de se fazer isso! Mas EU não vejo porque isso possa estar errado... Fiquem a vontade p/ me corrigir.
att, FH
2011/7/29 Vinicius Brito Rocha <viniciusbritor@gmail.com>
Senhores,
vejão bem, eu sei o que cada técnica siginifica. O que perguntei foi:
Alguém já utilizou avaliação de clusters via ANOVA.
Guilherme não é MANOVA. é ANOVA utilizando as somas de quadrados, de resíduos e totais.
Abs
Em 29 de julho de 2011 15:03, Hugo Zeni <hzeni82@gmail.com> escreveu:
Vinicius,****
** **
Pelo o que eu sei você realiza um agrupamento (seja hierárquico ou não) pelas medidas de similaridade ou dissimilaridade.****
** **
O fato de usar uma MANOVA como o Guilherme citou acredito que seja para validação desse agrupamento.****
** **
Caso esteja falando muita besteira me corrijam, pois também fiquei na dúvida, se não acredito que seja por aí!****
** **
Abraços****
Zeni****
** **
*De:* r-br-bounces@listas.c3sl.ufpr.br [mailto: r-br-bounces@listas.c3sl.ufpr.br] *Em nome de *Vinicius Brito Rocha *Enviada em:* Friday, July 29, 2011 2:25 PM *Para:* r-br@listas.c3sl.ufpr.br *Assunto:* Re: [R-br] Cluster + ANOVA****
** **
Bom, no livro esta ANOVA.****
De qualquer forma se vc tiver um material de como fazer via MANOVA estou aceitando.****
****
Att.****
Em 29 de julho de 2011 14:10, Guilherme Moraes Ferraudo < guiferraudo@gmail.com> escreveu:****
Vinicius não seria via MANOVA???
Em 29 de julho de 2011 11:48, Vinicius Brito Rocha <viniciusbritor@gmail.com> escreveu:****
Srs.
Estou lendo um livro de multivariada onde existe uma avaliação dos cluster produzidos pelo K-means através de ANOVA.
Não entendi muito bem o que estava sendo feito. Num primeito momento me pareceu que para cada variável realizava-se uma ANOVA, e amarzenava-se as somas de quadrados individualmente.
Alguém já viu isso? Ou melhor. Alguem já avaliou cluster via ANOVA?
Att.
-- Vinicius Brito Rocha. Estatístico e Atuário, Mestre em Pesquisa Operacional
www.aplicademic.blogspot.com http://twitter.com/viniciusbritor
"Não se preocupe muito com as suas dificuldades em Matemática, posso assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.
****
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Guilherme Moraes Ferraudo Jaboticabal/Campinas - SP http://lattes.cnpq.br/2096118558794430 _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.****
-- Vinicius Brito Rocha. Estatístico e Atuário, Mestre em Pesquisa Operacional
www.aplicademic.blogspot.com http://twitter.com/viniciusbritor
"Não se preocupe muito com as suas dificuldades em Matemática, posso assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.
****
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Vinicius Brito Rocha. Estatístico e Atuário, Mestre em Pesquisa Operacional
www.aplicademic.blogspot.com http://twitter.com/viniciusbritor
"Não se preocupe muito com as suas dificuldades em Matemática, posso assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Pois bem Éder, Que foi feito, que eu relatei, foi: diante de dos métodos de clusterização (de n existentes) se obteviram dos mesmos tratamentos n grupamentos, aé aí acho que todos entenderam. Vale destacar que no MEU caso a rsposta não era efetivamente multivariada no sentido estrito da palavra. Era uma análise da interação genótipo x ambiente. Os mesmos genetipos avaliados e vários ambientes. Geramos grupamentos desses genotipos que "classificam" esses genótipos em estáveis, responsivos, não responśivos, etc... A Anova nesse caso pode ser aplicada p/ as médias desses genótipos nos vários ambientes. No delineamento one-way. A interpretação foi feita como disse no outro e-mail! Reiterando o que disse, essa foi uma sugestão "old school". Não sei se isso etá certo ou errado. Acho que não há qualquer sofismo, mas sou completamente aberto a críticas... PS: Se tiver oportunidade mande um alô pro Gabardo! abraço, FH 2011/7/29 Eder David Borges da Silva <eder@leg.ufpr.br>
Pessoal, Venho acompanhando o tópico e me gerou algumas duvidas, por exemplo: ### Exemplo do Kmeans set.seed(123) x <- rbind(matrix(rnorm(100, sd = 0.3), ncol = 4), matrix(rnorm(100, mean = 1, sd = 0.3), ncol = 4)) colnames(x) <- letters[1:4] head(x) cl <- kmeans(x, 3) plot(x, col = cl$cluster) points(cl$centers, col = 1:2, pch = 8, cex=2) m1 <- manova(x~as.factor(cl$cluster)) summary(m1)
### Hierarchical Clustering hc <- hclust(dist(USArrests)^2, "cen") memb <- cutree(hc, k = 10) m2 <- manova(as.matrix(USArrests)~as.factor(memb)) summary(m2)
Nestes dois exemplos a MANOVA verificada sob H0 que os centroides dos grupos são iguais, certo? isso poderia ser um meio de validação que realmente os grupos são diferentes entre si. Meu conhecimento vai até ai, Agora quanto a resposta do Fernando não consegui entender como a ANOVA poderia ser utilizada. No livro de multivariada do Furtado ele cita a MANOVA como validação dos grupos, pena que não faz um exemplo para esclarecer melhor. Outra duvida que surgiu foi a seguinte: A MANOVA quando tenho dois grupos OK, mas quando são n grupos como poderemos por exemplo de 9 grupos formados se 8 forem iguais e apenas um for diferente a MANOVA será significativa, as entre os 8 grupos não é.
O tópico é bem interessante... Att
Em 29 de julho de 2011 19:09, Fernando Henrique Toledo < fernandohtoledo@gmail.com> escreveu:
Vinicius, boa noite!
Estou acompanhando aqui esse tópico!
Uma vez fiz uma coisa um pouco parecida com o que você viu. O que fiz foi a partir de duas formas de agrupar (clusterizar) um conjunto de tratamentos realizei um ANOVA one-way.
Essa abordagem foi proposta por mei orientador (que é da old school). A princípio achei um pouco simples "demais". Mas depois fui compreendendo a idéia...
A SQ do erro da ANOVA one-way é a média das variâncias dentro de cada tratamento. Nesse caso os tratamentos eram os tratamentos, propriamente ditos, dentro dos clusteres. O resultado dessa ANOVA permitiu ver qual era o método de agrupamento que "melhor" agrupava os tratamentos... gerando a menor SQ. Permitiu ver tb, Parametrizando como Efeitos de grupo e tratamento dentro de grupo, os grupos com maiores variâncias dentro (indicativo de um agrupamento "fraco").
Não sou teórico o suficiente p/ me delongar, nem sei se o que falei ou fiz esta de todo certo ou foi pura masturbação de dados ou ainda se existe uma forma "melhor" de se fazer isso! Mas EU não vejo porque isso possa estar errado... Fiquem a vontade p/ me corrigir.
att, FH
2011/7/29 Vinicius Brito Rocha <viniciusbritor@gmail.com>
Senhores,
vejão bem, eu sei o que cada técnica siginifica. O que perguntei foi:
Alguém já utilizou avaliação de clusters via ANOVA.
Guilherme não é MANOVA. é ANOVA utilizando as somas de quadrados, de resíduos e totais.
Abs
Em 29 de julho de 2011 15:03, Hugo Zeni <hzeni82@gmail.com> escreveu:
Vinicius,****
** **
Pelo o que eu sei você realiza um agrupamento (seja hierárquico ou não) pelas medidas de similaridade ou dissimilaridade.****
** **
O fato de usar uma MANOVA como o Guilherme citou acredito que seja para validação desse agrupamento.****
** **
Caso esteja falando muita besteira me corrijam, pois também fiquei na dúvida, se não acredito que seja por aí!****
** **
Abraços****
Zeni****
** **
*De:* r-br-bounces@listas.c3sl.ufpr.br [mailto: r-br-bounces@listas.c3sl.ufpr.br] *Em nome de *Vinicius Brito Rocha *Enviada em:* Friday, July 29, 2011 2:25 PM *Para:* r-br@listas.c3sl.ufpr.br *Assunto:* Re: [R-br] Cluster + ANOVA****
** **
Bom, no livro esta ANOVA.****
De qualquer forma se vc tiver um material de como fazer via MANOVA estou aceitando.****
****
Att.****
Em 29 de julho de 2011 14:10, Guilherme Moraes Ferraudo < guiferraudo@gmail.com> escreveu:****
Vinicius não seria via MANOVA???
Em 29 de julho de 2011 11:48, Vinicius Brito Rocha <viniciusbritor@gmail.com> escreveu:****
Srs.
Estou lendo um livro de multivariada onde existe uma avaliação dos cluster produzidos pelo K-means através de ANOVA.
Não entendi muito bem o que estava sendo feito. Num primeito momento me pareceu que para cada variável realizava-se uma ANOVA, e amarzenava-se as somas de quadrados individualmente.
Alguém já viu isso? Ou melhor. Alguem já avaliou cluster via ANOVA?
Att.
-- Vinicius Brito Rocha. Estatístico e Atuário, Mestre em Pesquisa Operacional
www.aplicademic.blogspot.com http://twitter.com/viniciusbritor
"Não se preocupe muito com as suas dificuldades em Matemática, posso assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.
****
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Guilherme Moraes Ferraudo Jaboticabal/Campinas - SP http://lattes.cnpq.br/2096118558794430 _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.****
-- Vinicius Brito Rocha. Estatístico e Atuário, Mestre em Pesquisa Operacional
www.aplicademic.blogspot.com http://twitter.com/viniciusbritor
"Não se preocupe muito com as suas dificuldades em Matemática, posso assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.
****
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Vinicius Brito Rocha. Estatístico e Atuário, Mestre em Pesquisa Operacional
www.aplicademic.blogspot.com http://twitter.com/viniciusbritor
"Não se preocupe muito com as suas dificuldades em Matemática, posso assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Fernando, Agora acho que deu uma clareada na sua aplicação, vamos esperar para ver se mais alguém da mas umas dicas de como esclarecer melhor este tópico, que acho muito interessante. PS: Diu Madona...Vou tentar dar uma alô para ele. Falow Em 29 de julho de 2011 21:50, Fernando Henrique Toledo < fernandohtoledo@gmail.com> escreveu:
Pois bem Éder,
Que foi feito, que eu relatei, foi: diante de dos métodos de clusterização (de n existentes) se obteviram dos mesmos tratamentos n grupamentos, aé aí acho que todos entenderam.
Vale destacar que no MEU caso a rsposta não era efetivamente multivariada no sentido estrito da palavra. Era uma análise da interação genótipo x ambiente. Os mesmos genetipos avaliados e vários ambientes. Geramos grupamentos desses genotipos que "classificam" esses genótipos em estáveis, responsivos, não responśivos, etc...
A Anova nesse caso pode ser aplicada p/ as médias desses genótipos nos vários ambientes. No delineamento one-way. A interpretação foi feita como disse no outro e-mail!
Reiterando o que disse, essa foi uma sugestão "old school". Não sei se isso etá certo ou errado. Acho que não há qualquer sofismo, mas sou completamente aberto a críticas...
PS: Se tiver oportunidade mande um alô pro Gabardo!
abraço, FH
2011/7/29 Eder David Borges da Silva <eder@leg.ufpr.br>
Pessoal, Venho acompanhando o tópico e me gerou algumas duvidas, por exemplo: ### Exemplo do Kmeans set.seed(123) x <- rbind(matrix(rnorm(100, sd = 0.3), ncol = 4), matrix(rnorm(100, mean = 1, sd = 0.3), ncol = 4)) colnames(x) <- letters[1:4] head(x) cl <- kmeans(x, 3) plot(x, col = cl$cluster) points(cl$centers, col = 1:2, pch = 8, cex=2) m1 <- manova(x~as.factor(cl$cluster)) summary(m1)
### Hierarchical Clustering hc <- hclust(dist(USArrests)^2, "cen") memb <- cutree(hc, k = 10) m2 <- manova(as.matrix(USArrests)~as.factor(memb)) summary(m2)
Nestes dois exemplos a MANOVA verificada sob H0 que os centroides dos grupos são iguais, certo? isso poderia ser um meio de validação que realmente os grupos são diferentes entre si. Meu conhecimento vai até ai, Agora quanto a resposta do Fernando não consegui entender como a ANOVA poderia ser utilizada. No livro de multivariada do Furtado ele cita a MANOVA como validação dos grupos, pena que não faz um exemplo para esclarecer melhor. Outra duvida que surgiu foi a seguinte: A MANOVA quando tenho dois grupos OK, mas quando são n grupos como poderemos por exemplo de 9 grupos formados se 8 forem iguais e apenas um for diferente a MANOVA será significativa, as entre os 8 grupos não é.
O tópico é bem interessante... Att
Em 29 de julho de 2011 19:09, Fernando Henrique Toledo < fernandohtoledo@gmail.com> escreveu:
Vinicius, boa noite!
Estou acompanhando aqui esse tópico!
Uma vez fiz uma coisa um pouco parecida com o que você viu. O que fiz foi a partir de duas formas de agrupar (clusterizar) um conjunto de tratamentos realizei um ANOVA one-way.
Essa abordagem foi proposta por mei orientador (que é da old school). A princípio achei um pouco simples "demais". Mas depois fui compreendendo a idéia...
A SQ do erro da ANOVA one-way é a média das variâncias dentro de cada tratamento. Nesse caso os tratamentos eram os tratamentos, propriamente ditos, dentro dos clusteres. O resultado dessa ANOVA permitiu ver qual era o método de agrupamento que "melhor" agrupava os tratamentos... gerando a menor SQ. Permitiu ver tb, Parametrizando como Efeitos de grupo e tratamento dentro de grupo, os grupos com maiores variâncias dentro (indicativo de um agrupamento "fraco").
Não sou teórico o suficiente p/ me delongar, nem sei se o que falei ou fiz esta de todo certo ou foi pura masturbação de dados ou ainda se existe uma forma "melhor" de se fazer isso! Mas EU não vejo porque isso possa estar errado... Fiquem a vontade p/ me corrigir.
att, FH
2011/7/29 Vinicius Brito Rocha <viniciusbritor@gmail.com>
Senhores,
vejão bem, eu sei o que cada técnica siginifica. O que perguntei foi:
Alguém já utilizou avaliação de clusters via ANOVA.
Guilherme não é MANOVA. é ANOVA utilizando as somas de quadrados, de resíduos e totais.
Abs
Em 29 de julho de 2011 15:03, Hugo Zeni <hzeni82@gmail.com> escreveu:
Vinicius,****
** **
Pelo o que eu sei você realiza um agrupamento (seja hierárquico ou não) pelas medidas de similaridade ou dissimilaridade.****
** **
O fato de usar uma MANOVA como o Guilherme citou acredito que seja para validação desse agrupamento.****
** **
Caso esteja falando muita besteira me corrijam, pois também fiquei na dúvida, se não acredito que seja por aí!****
** **
Abraços****
Zeni****
** **
*De:* r-br-bounces@listas.c3sl.ufpr.br [mailto: r-br-bounces@listas.c3sl.ufpr.br] *Em nome de *Vinicius Brito Rocha *Enviada em:* Friday, July 29, 2011 2:25 PM *Para:* r-br@listas.c3sl.ufpr.br *Assunto:* Re: [R-br] Cluster + ANOVA****
** **
Bom, no livro esta ANOVA.****
De qualquer forma se vc tiver um material de como fazer via MANOVA estou aceitando.****
****
Att.****
Em 29 de julho de 2011 14:10, Guilherme Moraes Ferraudo < guiferraudo@gmail.com> escreveu:****
Vinicius não seria via MANOVA???
Em 29 de julho de 2011 11:48, Vinicius Brito Rocha <viniciusbritor@gmail.com> escreveu:****
Srs.
Estou lendo um livro de multivariada onde existe uma avaliação dos cluster produzidos pelo K-means através de ANOVA.
Não entendi muito bem o que estava sendo feito. Num primeito momento me pareceu que para cada variável realizava-se uma ANOVA, e amarzenava-se as somas de quadrados individualmente.
Alguém já viu isso? Ou melhor. Alguem já avaliou cluster via ANOVA?
Att.
-- Vinicius Brito Rocha. Estatístico e Atuário, Mestre em Pesquisa Operacional
www.aplicademic.blogspot.com http://twitter.com/viniciusbritor
"Não se preocupe muito com as suas dificuldades em Matemática, posso assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.
****
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Guilherme Moraes Ferraudo Jaboticabal/Campinas - SP http://lattes.cnpq.br/2096118558794430 _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.****
-- Vinicius Brito Rocha. Estatístico e Atuário, Mestre em Pesquisa Operacional
www.aplicademic.blogspot.com http://twitter.com/viniciusbritor
"Não se preocupe muito com as suas dificuldades em Matemática, posso assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.
****
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Vinicius Brito Rocha. Estatístico e Atuário, Mestre em Pesquisa Operacional
www.aplicademic.blogspot.com http://twitter.com/viniciusbritor
"Não se preocupe muito com as suas dificuldades em Matemática, posso assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Correto Hugo.... Guilherme Ferraudo - sent from mobile Em jul 29, 2011 3:03 PM, "Hugo Zeni" <hzeni82@gmail.com>escreveu: Vinicius,**** ** ** Pelo o que eu sei você realiza um agrupamento (seja hierárquico ou não) pelas medidas de similaridade ou dissimilaridade.**** ** ** O fato de usar uma MANOVA como o Guilherme citou acredito que seja para validação desse agrupamento.**** ** ** Caso esteja falando muita besteira me corrijam, pois também fiquei na dúvida, se não acredito que seja por aí!**** ** ** Abraços**** Zeni**** ** ** *De:* r-br-bounces@listas.c3sl.ufpr.br [mailto: r-br-bounces@listas.c3sl.ufpr.br] *Em nome de *Vinicius Brito Rocha *Enviada em:* Friday, July 29, 2011 2:25 PM *Para:* r-br@listas.c3sl.ufpr.br *Assunto:* Re: [R-br] Cluster + ANOVA**** Bom, no livro esta ANOVA. De qualquer forma se vc tiver um material de como fazer via MANOVA e... _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
participantes (5)
-
Eder David Borges da Silva
-
Fernando Henrique Toledo
-
Guilherme Moraes Ferraudo
-
Hugo Zeni
-
Vinicius Brito Rocha