Re: [R-br] Método de Agrupamento Ward (bruno vidigal)

Bruno, na verdade o método de Ward precisa sim da matriz de distância como os outros métodos de clsuter; o que muda é a forma como ele cria o dendograma. Ele calcula a soma dos quadrados das distâncias entre os objetos, dividida pelo número de objetos, buscando minimizá-la. Então é necessária uma matriz de distância como nos outros casos, e o que muda na função hclust é o argumento method="ward". Se tiver acesso, veja o excelente *Numerical Ecology with R* (Bocard, Gillet & Legendre, 2011), que é uma excelente fonte para estudar métodos multivariados no R (o foco é em Ecologia, mas com certeza pode ser útil em outros casos). Abraços Marcos -- Marcos Vinícius Carneiro Vital Universidade Federal de Alagoas Instituto de Ciências Biológicas e da Saúde Setor de Biodiversidade e Ecologia

Oi Marcos, Concordo com o que vc falou sobre o Ward, mas continuo sem entender o que o R faz. Veja bem meu raciocínio: Segundo Mingoti (2005) o método de Ward faz o seguinte: 1 - Calcula a soma de quadrados dentro de cada conglomerado; 2 - Calcula a soma de quadrados entre dois conglomerados; 3 - Os dois conglomerados que minimizam a distância calculada no item 2 são combinados. Então, ao meu ver, não precisaria de uma matriz de distância como o R pede já que o próprio método de Ward já utiliza a soma de quadrados para agrupar os indivíduos mais homogêneos. Vou ler o material sugerido, abraço Em 27 de janeiro de 2013 19:04, Marcos Vital <marcosvital@gmail.com>escreveu:
Bruno, na verdade o método de Ward precisa sim da matriz de distância como os outros métodos de clsuter; o que muda é a forma como ele cria o dendograma.
Ele calcula a soma dos quadrados das distâncias entre os objetos, dividida pelo número de objetos, buscando minimizá-la. Então é necessária uma matriz de distância como nos outros casos, e o que muda na função hclust é o argumento method="ward".
Se tiver acesso, veja o excelente *Numerical Ecology with R* (Bocard, Gillet & Legendre, 2011), que é uma excelente fonte para estudar métodos multivariados no R (o foco é em Ecologia, mas com certeza pode ser útil em outros casos).
Abraços
Marcos
-- Marcos Vinícius Carneiro Vital Universidade Federal de Alagoas Instituto de Ciências Biológicas e da Saúde Setor de Biodiversidade e Ecologia
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Bruno C. Vidigal

Bruno Como minimizar a distância sem calcular a mesma? pense nisso. Em 27/01/2013 20:01, bruno vidigal escreveu:
Oi Marcos,
Concordo com o que vc falou sobre o Ward, mas continuo sem entender o que o R faz. Veja bem meu raciocínio:
Segundo Mingoti (2005) o método de Ward faz o seguinte:
1 - Calcula a soma de quadrados dentro de cada conglomerado;
2 - Calcula a soma de quadrados entre dois conglomerados;
3 - Os dois conglomerados que minimizam a distância calculada no item 2 são combinados.
Então, ao meu ver, não precisaria de uma matriz de distância como o R pede já que o próprio método de Ward já utiliza a soma de quadrados para agrupar os indivíduos mais homogêneos.
Vou ler o material sugerido,
abraço
Em 27 de janeiro de 2013 19:04, Marcos Vital <marcosvital@gmail.com <mailto:marcosvital@gmail.com>> escreveu:
Bruno, na verdade o método de Ward precisa sim da matriz de distância como os outros métodos de clsuter; o que muda é a forma como ele cria o dendograma.
Ele calcula a soma dos quadrados das distâncias entre os objetos, dividida pelo número de objetos, buscando minimizá-la. Então é necessária uma matriz de distância como nos outros casos, e o que muda na função hclust é o argumento method="ward".
Se tiver acesso, veja o excelente *Numerical Ecology with R* (Bocard, Gillet & Legendre, 2011), que é uma excelente fonte para estudar métodos multivariados no R (o foco é em Ecologia, mas com certeza pode ser útil em outros casos).
Abraços
Marcos
-- Marcos Vinícius Carneiro Vital Universidade Federal de Alagoas Instituto de Ciências Biológicas e da Saúde Setor de Biodiversidade e Ecologia
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br <mailto:R-br@listas.c3sl.ufpr.br> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Bruno C. Vidigal
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
participantes (3)
-
bruno vidigal
-
Leonard de Assis
-
Marcos Vital