[R-br] Euclidiana para dados binarios

Marcelo Laia marcelolaia em gmail.com
Sexta Agosto 15 21:51:26 BRT 2014


Um colega pediu para que rodasse uns dados binarios para obtenção de
dissimilaridade e respectivo dendrograma por meio da distância
euclidiana. Eu sempre udei Jaccard ou Nei e Li para dados binários.

Mas, o pacote vegan tem a função vegdist que aceita binários para
euclidiana. Rodei os dados e a matriz de dissimilaridade tem valores
entre 0 e 4! Eu esperava valores entre 0 e 1!

Eis o código:

library(vegan)
library(MASS)
lili.dist.euc <- vegdist(lili, method="euclidian", binary=TRUE)
lili.clua.euc <- hclust(lili.dist.euc, "average")
plot(lili.clua.euc, cex=0.9, hang = -1)

Pergunto:

Tem algo errado?
Euclidiana é aplicada a dados binários?
Se não, como argumentar com o colega e demovê-lo da ideia?
Jaccard é melhor neste caso?

Se desejar, posso disponibilizar o BD.

Laia

-- 
Marcelo


Mais detalhes sobre a lista de discussão R-br