Chi-quadrado demonstra associação, mas e daí?

Prezados membros da lista R-br, Solicito a ajuda de vocês para resolver o seguinte problema: Tenho duas espécies de parasitas e alguns fatores que podem estar associados a incidência deles, como o período climático e a própria presença de um dos parasitas. Então executei o qui-quadrado para os seguintes dados: Giardia negativa Giardia positiva Cryptosporidium negativo 79,9% (250/313) 4,8% (15/313) Cryptosporidium positivo 10,9% (34/313) 4,5% (14/313) O resultado do chi-quadrado é siginificativo, mas como interpretar/extrair mais informações além do fato de os fatores estarem associados? O teste fala que há associação, mas apenas 4,5% das amostras continham os dois parasitas ao mesmo tempo. Pesquisei bastante sobre isso e o que achei foi algo muito sucinto sobre odds ratio, mas não entendi, nem saberia fazer no R. Agradecido, André -- *MSc. André Lucas de O. Moreira* http://lattes.cnpq.br/7258065668864153 <http://www.wikiaves.com.br/perfil_andrelukinhas> http://www.wikiaves.com.br/perfil_andrelukinhas 79 8837-3562 79 9132-9093

André, Parabéns por não se conformar com o qui-quadrado. Há um bom tempo o valor p não é suficiente numa publicação biomédica, e você está certo em procurar extrair mais informação de seus dados. Do ponto de vista estatístico, a razão de chances (*odds ratio*) se ajusta melhor para dados dessa natureza, mas a razão de prevalência (razão de proporções) e a diferença de proporções podem ser mais interpretáveis. O pacote PropCIs e, provavelmente, um ou mais pacotes voltados para a epidemiologia incluem funções para tudo isso; além do prop.diff(), que já vem de fábrica. (Alternativamente, você poderia transformar essa tabela num data frame com duas variáveis dicotômicas (crytposporidium e giardia), e gerar as medidas de associação através de regressão linear generalizada (função glm()).) Mas, pelo que entendi, sua primeira dificuldade é conceitual. Se os livros de estatística ao seu alcance não o ajudarem, recomendo abrir um livro de epidemiologia, especialmente nos capítulos sobre medidas de ocorrência (aparentemente, prevalência) e as medidas de associação cabíveis. Dependendo dos objetivos de sua investigação, você pode estar interessado em uma medida de associação entre criptospídeos e giárdias ajustada para os fatores citados (período climático, etc.). Para isso, vai precisar ler sobre análise estratificada (ou, alternativamente, regressão múltipla). Alguns livros de epidemiologia tratam bem o suficiente disso, mas acho ser mais provável que você encontre uma boa explicação num livro de estatística. Espero ter ajudado! Att, Leonardo Ferreira Fontenelle[1] Em Ter 3 nov. 2015, às 16:19, André Lucas de Oliveira Moreira escreveu:
Prezados membros da lista R-br,
Solicito a ajuda de vocês para resolver o seguinte problema:
Tenho duas espécies de parasitas e alguns fatores que podem estar associados a incidência deles, como o período climático e a própria presença de um dos parasitas. Então executei o qui-quadrado para os seguintes dados:
Giardia negativa
Giardia positiva
Cryptosporidium negativo
79,9% (250/313)
4,8% (15/313)
Cryptosporidium positivo
10,9% (34/313)
4,5% (14/313)
O resultado do chi-quadrado é siginificativo, mas como interpretar/extrair mais informações além do fato de os fatores estarem associados? O teste fala que há associação, mas apenas 4,5% das amostras continham os dois parasitas ao mesmo tempo. Pesquisei bastante sobre isso e o que achei foi algo muito sucinto sobre odds ratio, mas não entendi, nem saberia fazer no R.
Agradecido, André
--
*MSc. André Lucas de O. Moreira* http://lattes.cnpq.br/7258065668864153 http://www.wikiaves.com.br/perfil_andrelukinhas 79 8837-3562 79 9132-9093 _________________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
Links: 1. http://lattes.cnpq.br/9234772336296638

André, Veja se este exemplo pode te ajudar(pelo menos de início para suas análises). Como não deu maiores detalhes suponho que, quando usou as palavras negativo e positivo na sua tabela, estava querendo indicar ausência e presença dos parasitas. Primeiro pode verificar se existe diferença entre as proporções de negativo e positivo, assim pode verificar se a presença ou não de cada parasita tem diferença significativa em seus dados: ##Diferença entre Proporções e IC95%(d) dados<-matrix(c(250,15,34,14),ncol=2,byrow=T) dados ## Calculando as proporções entre Cryptosporidium negativo e Cryptosporidium positivo p11<-(dados[1,1]/(sum(dados[1,]))) p11 p21<-(dados[2,1]/(sum(dados[2,]))) p21 d<-p11-p21 d vd<-((p11*(1-p11))/(sum(dados[1,])-1)) + ((p21*(1-p21))/(sum(dados[2,])-1)) dvd<-sqrt(vd) z<-qnorm(0.975) li<- d - (z*dvd) ls<- d + (z*dvd) cbind(d,li,ls) # Aqui você verificou que a diferença entre Cryptosporidium negativo e positivo é significativa #Abaixo o famoso Qui-Quadrado. Note que o argumento sim=200 faz com que o p-valor seja calculado por simulações para que o pressupostos da validade do teste Qui-quadrado não sejam violados. chisq.test(dados,sim=500) ##Há evidências de se rejeitar H0,logo Cryptosporidium e Giardia estão associados #Pode também ter verificar qual a chance de ausência ou não dos parasitas. ##Razão de Chances ou Odds Ratio (OR) e IC95%(OR) OR<-(dados[1,1]*dados[2,2])/(dados[1,2]*dados[2,1]) vf<-(1/dados[1,1])+(1/dados[1,2])+(1/dados[2,1]+(1/dados[2,2])) dpf<-sqrt(vf) z<-qnorm(0.975) li<-exp(log(OR)-z*dpf) ls<-exp(log(OR)+z*dpf) cbind(OR,li,ls) ## A chance de ausência Cryptosporidium e Giardia é 6,8 vezes maior que a presença podendo variar entre 3 e 15,4 vezes ao nível de confiança de 95%. -- Atenciosamente Felipe E. Barletta Mendes Estatístico - Conre3 9766-A +55 (41)-92077191 +55 (41)-33287216

Em Ter 3 nov. 2015, às 17:21, Leonardo Ferreira Fontenelle escreveu:
[...] além do prop.diff(), que já vem de fábrica. [...]
Ops! A função é prop.test(), não prop.diff(). Leonardo Ferreira Fontenelle[1] Links: 1. http://lattes.cnpq.br/9234772336296638

Não seria o caso de fazer uma matriz de correlação, para estabelecer a intensidade da relação entre dois fatores? De qualquer maneira esse é um passo para fazer a regressão, estou certo? Att. Francisco Putini Enviado pelo Outlook para Android On Tue, Nov 3, 2015 at 1:44 PM -0800, "Leonardo Ferreira Fontenelle" <leonardof@leonardof.med.br> wrote: Em Ter 3 nov. 2015, às 17:21, Leonardo Ferreira Fontenelle escreveu:
[...] além do prop.diff(), que já vem de fábrica. [...]
Ops! A função é prop.test(), não prop.diff(). Leonardo Ferreira Fontenelle[1] Links: 1. http://lattes.cnpq.br/9234772336296638 _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo m�nimo reproduz�vel.
participantes (4)
-
André Lucas de Oliveira Moreira
-
Felipe
-
Leonardo Ferreira Fontenelle
-
putini@outlook.com