Chiara,
A escolha da "melhor" distribuição deve ser sempre feita considerando o processo de geração dos seus dados e menos usando informações obtidas dos próprios dados « ... dados não são normais e também não apresentam homoscedasticidade, mesmo após realizar transformação (log) ... ».
Outrossim, já que você cita a GLM, numa regressão o mais importante não é que os dados "sejam normais" mas sim que a distribuição dos resíduos da regressão tenham uma distribuição Normal com média zero, e o melhor a fazer é examinar esses resíduos usando os gráficos de diagnóstico, que atualmente estão já programados no R.
Responder se "Binomial Negativa" é correta sem mais informações sobre seu experimento tem a mesma chance de acertar a pergunta "qual vai ser a taxa de câmbio da Lira klingoniana por dólar da Federação em 2129" 😶!
Se você quiser mais assertividade, conte-nos um pouco mais sobre o problema, a variável modelada e as independentes, nº de amostras, etc.
HTH
--
Cesar Rabak