Caro(a) listeiro(a), 

Possuo um grupo de dados com valores representando a proporção de dado composto na planta. Esses valores variam de 0 a 100%. Assim, o composto Y pode apresentar valor 41 e o Z valor 0,02, por exemplo. Há em torno de 70 compostos. Nem todas as plantas contém todos os compostos. 

Hipótese: plantas resistentes possuem compostos exclusivos e/ou em proporção significativamente diferente das plantas suscetíveis.

Para os compostos exclusivos, é tranquilo, pois, se o Z está presente somente no resistente, é muito possível que ele tenha influência sobre a resistência. 

O problema são aqueles que aparecem tanto no resistente quanto no suscetível em proporção diferente.

Outra questão que pode acontecer é a interação entre compostos. Ou seja, dois ou mais compostos explicarem o efeito de resistência ou suscetibilidade. Neste caso, um composto pode agir como facilitador para a ação de outro, que seria o composto tóxico. Logo, sem o primeiro, o composto tóxico, sozinho, não teria efeito. 

Pensei em usar abordagem genômica, tratando cada composto como um gene. Não deu certo. Resultado estatístico não explica o biológico. Outra opção seria pensar na análise de QTLs. Não tentei essa. 

Mas, lendo trabalhos na área médica, vi que alguns utilizam vários sintomas para explicar a doença. Por exemplo, associam faixas de valores de hemoglobina, ácido úrico e proteína X para explicar a ocorrência de determinado câncer. 

Pergunto: você já viu ou já fez análises estatísticas no R para esse último caso? Explicar a doença com base em um roll de sintomas? Qual pacote usou? Poderia sugerir alguma literatura? Tutorial? Site? 

Muito obrigado 

Marcelo