[R-br] Resíduos e MCMCglmm
Elias Teixeira Krainski
eliaskrainski em yahoo.com.br
Segunda Novembro 23 13:45:56 BRST 2015
Para salientar o que o Wagner falou sobre esquecer teste de normalidade
de resíduos. Historicamente tivemos evolução dos modelos lineares aos
modelos GLM e desejou-se fazer análises parecidas (em GLM) para checar a
suposição de distribuição do modelo. Uma destas, o "envelope de
resíduos" (alguém mais clever que eu deu esse nome então o estou usando)
é a que faz mais sentido para mim. Ou seja, como o Wagner falou: esqueça
teste de normalidade!
Eu tinha esquecido de mencionar que ao fazer análise Bayesiana podemos
usar a Probability Integral Transform (PIT) para verificar a suposição
de distribuição. No INLA isso pode ser obtido considerando
control.compute=list(cpo=TRUE)
e você pode visualizar isso no plot() do output.
Elias
On 23/11/15 16:18, Wagner Bonat wrote:
> 1 - Se sua resposta for Gaussiana o residuo deve ser Gaussiano. Eu nao
> tenho nenhuma experiencia com o pacote MCMCglmm, mas eu acho que vc
> esta assumindo Gaussianidade pq vc nao especificou nenhuma
> distribuicao no argumento family.
> O envelope simulado que o Elias falou vai ajudar a interpretar o
> QQ-plot que deve sim indicar que os residuos sao Gaussianos i.e.
> pontos dentro do envelope.
> Eu nao vi o qq-plot dos seus residuos talvez vc possa colocar aqui pra
> gente ver.
> As vezes nas pontas fica meio estranho mesmo.
>
> 2 - Esses testes de normalidade esquece isso.
>
> 3 - Apesar da normalidade dos residuos ser importantes, muitas vezes
> isso nao tem nenhum grande efeito na estimacao dos parametros que em
> geral e bastante robusta. Eu estaria mais preocupado em verificar se
> existe um relacionamento entre media e variancia, vc pode usar por
> exemplo um grafico residuos versus preditos ou observados. Se vc
> identificar algum padrao e sinal de problema no modelo.
> Vc precisa de alguma forma padronizar esses residuos para vc ter uma
> ideia do tamanho que eles sao. E identificar possiveis outliers ou
> pontos influentes aberrantes...
>
> 4 - MCMCglmm e so um pacote que ajusta Generalized Linear Mixed Models
> (GLMM) using MCMC methods. Vc pode ajustar GLMM usando diferentes
> distribuicoes para a sua variavel resposta, como Gaussiana, Gamma,
> Normal Inverse, T e outras.
>
> 5 - O pacote INLA e capaz de ajustar esse modelo filogenetico que vc
> quer. Vc pode ajustar usando a Normal e tbm tem opcao skew Normal and
> Gamma. Vc deve usar o modelo generic0 e passar a inversa da sua matriz
> filogenetica parecido com o que vc passou pro MCMCglmm.
> Ver http://www.math.ntnu.no/inla/r-inla.org/doc/latent/generic0.pdf.
> Exemplo de aplicacao de INLA em animal models que e praticamente a
> mesma coisa que o modelo filogetico neste paper.
> http://www.g3journal.org/content/3/8/1241.full
>
> 6 - Meu pacote mcglm tbm e capaz de ajustar esse modelo, usando
> estimating function uma abordagem diferente. No caso Gaussiano os
> modelos sao iguais a menos do efeito da priori.
> Vc pode baixar o meu paper aqui e ver se atende suas necessidades
> https://www.researchgate.net/profile/Wagner_Bonat2
>
> 7 - Se vc tiver interesse em uma abordagem nao Bayesiana. Manda um
> e-mail e conversamos.
>
>
>
>
>
> Em 23 de novembro de 2015 15:34, Filipe Cristovão <filipe.cunha em uzh.ch
> <mailto:filipe.cunha em uzh.ch>> escreveu:
>
> Olá,
>
> Muito obrigado pelas mensagens.
>
> Vou dar continuidade a discussão com alguns esclarecimentos e um
> pouco de código:
>
> 1- Elias pergunta como calculo os resíduos nesse modelo:
>
>
> >residuals_model<-(data$response_variable-predict(model))
>
> 2- Wagner, sua pergunta é, de alguma maneira, minha grande dúvida:
> "Se vc já sabe que sua variável resposta é gamma pq não ajusta um
> modelo gamma? Ou mesmo qq outro modelo para resposta contínua como
> a Gaussian Inverse?”. Contudo, qual tipo de análise que não
> MCMCglmm me permitiria controlar meus dados quanto à filogenia?
>
> 3. E finalmente sobre os motivos de se usar MCMCglmm: recaem
> novamente na não independência dos dados e na possibilidade de se
> controlar filogeneticamente.
>
> Mas, a mesma pergunta que foi feita, é parte da minha questão:
> "Por que assumindo distribuição de probabilidade aos parâmetros, a
> interpretação dos resultados é baseada no fato de que também se
> obtem distribuições de probabilidade à posteriori para
> interpretar?” Em outras palavras, por que os resíduos devem seguir
> uma distribuição normal mesmo se os dados não são normais? Ou essa
> última frase está equivocada?
>
> O modelo segue:
>
> #Phylo é minha árvore filogenética.
>
> >MCMC1<-MCMCglmm(Response_var~var1*var2*+var3,
> + random = ~Phylo, family=“?”,
> + ginverse=list(Phylo=inv.phylo$Ainv), prior = prior,
> + nitt = 10000,
> + burnin = 1000, thin = 500, data = mob,
> + verbose = F )
>
> # Os resíduos estão acima. E para checar a normalidade dos
> resíduos usei:
>
> > qqnorm(residuals_model)
> > shapiro.test(residuals_model)
>
> Enfim, após as mensagens que me fizeram estudar novos artigos =)
> refaço as perguntas:
>
> A) Meus resíduos precisam ser normais quando uso um modelo MCMCglmm?
>
> B) Que outro pacote me permite controlar a filogenia em um modelo?
>
> Abraços,
>
>
>
> Filipe Cristovão R. da Cunha
> Anthropological Institute & Museum
> University of Zurich - Campus Irchel
> Winterthurerstrasse 190, CH-8057 Zürich
> Switzerland
> www.aim.uzh.ch/Research/birdfamilies/filipe.html
> <http://www.aim.uzh.ch/Research/birdfamilies/filipe.html>
> www.flickr.com/photos/filipe_cristovao
> <http://www.flickr.com/photos/filipe_cristovao>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br <mailto:R-br em listas.c3sl.ufpr.br>
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e
> forneça código mínimo reproduzível.
>
>
>
>
> --
> Wagner Hugo Bonat
> ----------------------------------------------------------------------------------------------
> Department of Mathematics and Computer Science (IMADA)
> University of Southern Denmark (SDU) and
> Laboratório de Estatística e Geoinformação (LEG)
> Universidade Federal do Paraná (UFPR)
>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo m�nimo reproduz�vel.
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20151123/b83bca0c/attachment.html>
Mais detalhes sobre a lista de discussão R-br