[R-br] Análise de agrupamento

Nathalia Sousa nathalia_sousam em yahoo.com.br
Quarta Janeiro 8 20:01:25 BRST 2014


Muito Obrigada Marcos,

O problema é que eu estou tentando aprender a mexer o R e ao mesmo tempo aprender estatística!

Quando eu calculo a matriz de distância da erro por causa das linhas com zeros em todos os itens.
Pelo que eu entendi dos estudos que fiz sobre análise de agrupamento, o Bray Curtis é o melhor para análise de abundância, e aceita duplos zeros e ele "lê" os zeros como semelhança. Como eu li isso, pensei que daria certo ter linhas com zeros.

Eu estou fazendo análise de alimentação e esses grupos (peixes, crustáceos...) foram os itens que eu encontrei nos conteúdos estomacais, então as linhas zeradas tem muita importância, pois indica de aquele peixe estava com estômago vazio.
 Eu quero comparar esses indivíduos com a área em que eles foram capturados, por exemplo. E retirando essas amostras com zero, eu perco muita informação...

Vou dar uma lida nesse livro que você indicou, mas acho que vou precisar de uma ajuda para criar uma nova métrica.... =)

Muito obrigada!
 
Att., 

Nathalia de Sousa Motta 
Oceanógrafa/Oceanographer 
Mestranda em Pesca - Instituto de Pesca


________________________________
 De: Marcos Vital <marcosvital em gmail.com>
Para: r-br em listas.c3sl.ufpr.br 
Enviadas: Sábado, 4 de Janeiro de 2014 15:34
Assunto: Re: [R-br] Análise de agrupamento
 


Natália, é possível que o problema seja a métrica que você está utilizando. Aparece um erro quando você calcula a matriz de distância usando Bray Curtis? É isso? Ou é alguma outra coisa?

Não sei se o coeficiente de Bray Curtis aceita linhas com zeros. Acredito que não aceite, pois acho que uma linha de zeros não deva fazer muito sentido nesta métrica. Normalmente usamos Bray Curtis para comparar comunidades biológicas de acordo com sua similaridade de composição e abundâncias de espécies (algo como a "estrutura" da comunidade), e neste contexto uma linha só de zeros não dá informações úteis para compreendermos as relações de similaridade.

Se for isto mesmo, a questão aqui é encontrar uma métrica que possa responder a sua pergunta. Aliás, este é um ponto crucial: qual a sua pergunta? Por que os zeros importam?

Dependendo da situação você pode até criar uma métrica própria usando a função designdist, também do pacote vegan.

Se precisar de uma boa literatura sobre estas medidas, sugiro começar pelo Numerical Ecology (Legendre & Legendre).

Abraços

Marcos
-- 
Marcos Vinícius Carneiro Vital
Universidade Federal de Alagoas
Instituto de Ciências Biológicas e da Saúde
Setor de Biodiversidade e Ecologia 
_______________________________________________
R-br mailing list
R-br em listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20140108/92b942f5/attachment.html>


Mais detalhes sobre a lista de discussão R-br