<div dir="ltr">André, <div><br></div><div>A gente fica feliz que possa ter sido de ajuda, embora o assunto levantado por você extrapola o foco desta lista, que é precipuamente o uso do R.</div><div><br></div><div>Se você quer analisar <i>incidência</i> você precisa fazer um estudo prospectivo, posto que a incidência define-se como "Taxa de eventos novos que surgem numa população num período de tempo."</div><div><br></div><div>Sua tabela provavelmente mostra a <u>prevalência</u> que é definida como "Proporção de casos existentes numa população".</div><div><br></div><div>Os dados de prevalência são geralmente obtidos de um estudo denominado transversal, que é um nome usado em epidemiologia para denominar um "instantâneo" da população sob estudo.</div><div><br></div><div>Uma observação no seu post original também acende a lâmpada amarela: ". . . <span style="font-size:12.8px">apenas 4,5% das amostras continham os dois parasitas ao mesmo tempo."</span></div><div><span style="font-size:12.8px"><br></span></div><div><span style="font-size:12.8px">A pergunta necessária: os casos que apenas um dos parasitas apareceram não estão na tabela por que?</span></div><div><span style="font-size:12.8px"><br></span></div><div><span style="font-size:12.8px">Se aparece um parasita "positivo" ele exclui a possibilidade do "negativo"?</span></div><div><span style="font-size:12.8px"><br></span></div><div><span style="font-size:12.8px">E a mais importante para ver se a sua busca por associação teria validade: as proporções dos parasitas (as marginais na sua tabela de contingência) são as esperadas na Natureza?</span></div><div><span style="font-size:12.8px"><br></span></div><div><span style="font-size:12.8px">Essas questões deverão ajudá-lo a verificar se você tem uma descoberta ou apenas está a fazer um constatação trivial.</span></div><div><span style="font-size:12.8px"><br></span></div><div><span style="font-size:12.8px">HTH</span></div><div><span style="font-size:12.8px">--</span></div><div><span style="font-size:12.8px">Cesar Rabak</span></div><div><br></div></div><div class="gmail_extra"><br><div class="gmail_quote">2015-11-08 8:53 GMT-02:00 André Lucas de Oliveira Moreira <span dir="ltr"><<a href="mailto:andremoreirazoo@gmail.com" target="_blank">andremoreirazoo@gmail.com</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">Oi César, obrigado pela contribuição.<div><br></div><div>Muito interessante seus comentários e suas sugestões de leitura, estou animado para aprender um pouco mais. Afinal, aprender mais é sempre motivador.</div><div><br></div><div>Interessante também tudo que o pessoal falou sobre as alternativas que existem, pois na literatura da biologia não se aborda essas alternativas.</div><div><br></div><div>...Então, a ideia nesse teste é verificar se a incidência de Cryptosporidium positivo está associado à incidência de Giardia positiva...</div><div><br></div><div><br></div><div>Mais uma vez obrigado a todos,</div><div>Toda essa discussão foi muito proveitosa.</div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div></div><div class="HOEnZb"><div class="h5"><div class="gmail_extra"><br><div class="gmail_quote">Em 6 de novembro de 2015 16:30, Cesar Rabak <span dir="ltr"><<a href="mailto:cesar.rabak@gmail.com" target="_blank">cesar.rabak@gmail.com</a>></span> escreveu:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">André,<div><br></div><div>Sua questão sobre o quê o resultado do teste estatístico que você realizou é muito importante.</div><div><br></div><div>Antes de mais nada gostaria de colocar que as alternativas propostas são todas tautológicas no sentido matemático/estatístico (puro) pois um fato da vida é o de que todas as "medidas" obteníveis de uma tabela de contingência estão todas inter-relacionadas. . .</div><div><br></div><div>Uma abordagem mais lúcida a meu ver é entender o resultado do teste, "por preguiça" eu abrevei os nomes dos seus microorganismos:</div><div><br></div><div>> tabela <- matrix(c(250,15,34,14),nrow=2,byrow=T,dimnames=list(c("CN","CP"),c("GN","GP")))<br></div><div><br></div><div>Rodando o mosaicplot nesses dados:</div><div><br></div><div>> mosaicplot(tabela, shade=T)<br></div><div>ou melhor ainda</div><div>> library(vcd)</div><div>> mosaic(tabela, shade=T)</div><div><br></div><div>A gente vê que os resíduos de Pearson por célula da tabela que estão gerando o valor do qui², e consequentemente do valor-p.</div><div><br></div><div>Nessa figura fica claro que a expectativa não cumprida é que a porcentagem do GP para CP (posto que a quantidade de CN versus CP é muito maior). A pergunta a fazer então é a seguinte, o quê essa tabela está testando?</div><div><br></div><div>Em outras palavras, qual experimento foi realizado? </div><div>313 amostras obtidas aleatoriamente foram classificadas para <span style="font-family:Calibri,sans-serif;font-size:13.3333px">Cryptosporidium e Giardia</span>?</div><div><br></div><div>As proporções de <span style="font-family:Calibri,sans-serif;font-size:13.3333px">Cryptosporidium e Giardia</span> são as que aparecem na Natureza?</div><div><br></div><div>Cada uma dessas questões levaria a uma análise diferente.</div><div><br></div><div>Admitindo que a análise adequada conduzisse para uma melhor medida explicativa, as medidas de associação em tabelas de contingência (de novo veja que elas são apenas o resultado obtido em "outra roupagem", posto que emanam de exatamente as mesmas métricas e variáveis. . .)</div><div><br></div><div><a href="https://en.wikipedia.org/wiki/Contingency_table#Measures_of_association" target="_blank">https://en.wikipedia.org/wiki/Contingency_table#Measures_of_association</a> (<i>sorry</i> a pág. em português sobre este tema é pobrezinha), e <a href="https://en.wikipedia.org/wiki/Phi_coefficient" target="_blank">https://en.wikipedia.org/wiki/Phi_coefficient</a>.<br></div><div><br></div><div>No R:</div><div><div>> library(psych)</div><div>> phi(tabela)<br></div><div>[1] 0,29</div><div>> </div></div><div><br></div><div>As medidas de associação têm mais respeito porque podem medir o assim chamado "tamanho do efeito", e auxiliar a análise em relação à importância prática do resultado.</div><div><br></div><div>Um tratamento teórico dessas medidas pode ser encontrado aqui: <a href="https://corplingstats.wordpress.com/2012/04/09/measures-of-association/" target="_blank">https://corplingstats.wordpress.com/2012/04/09/measures-of-association/</a></div><div><br></div><div>Um outro aspecto a ser mencionado é que todos os testes baseados na estatítica do qui² são sensíveis ao tamanho da amostra na tabela, daí a ideia de se usar outra maneira de interpretar os dados.</div><div><br></div><div>A propósito, o comentário do Leonardo sobre IC de Wald versus Wilson é tratado neste interessante post: <a href="https://corplingstats.wordpress.com/2012/03/31/z-squared/" target="_blank">https://corplingstats.wordpress.com/2012/03/31/z-squared/</a></div><div><br></div><div>Por fim, gostaria de propor a leitura deste post para que você decida o quê o seu resultado signfica: <a href="http://www.theguardian.com/commentisfree/2011/sep/09/bad-science-research-error" target="_blank">http://www.theguardian.com/commentisfree/2011/sep/09/bad-science-research-error</a></div><div><br></div><div>HTH</div><div><br></div></div><div><div><div class="gmail_extra"><br><div class="gmail_quote">2015-11-05 14:30 GMT-02:00 André Lucas de Oliveira Moreira <span dir="ltr"><<a href="mailto:andremoreirazoo@gmail.com" target="_blank">andremoreirazoo@gmail.com</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">Pessoal, muito obrigado por tudo!<div><br></div><div>Felipe, com os comentários ficou mais fácil de associar o que já sei com os exemplos que você utilizou. :D</div><div><br></div><div><br></div><div>Abraços a todos,</div><div>André</div></div><div class="gmail_extra"><br><div class="gmail_quote"><div><div>Em 4 de novembro de 2015 17:33, Felipe <span dir="ltr"><<a href="mailto:felipe.e.barletta@gmail.com" target="_blank">felipe.e.barletta@gmail.com</a>></span> escreveu:<br></div></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div><div>
  
    
  
  <div text="#000000" bgcolor="#FFFFFF">
    André,<br>
    <br>
    Como o Leonardo disse no e-mail anterior, há pacotes que já calculam
    medidas como diferença de proporção OR, seus respectivos IC e outras
    medidas que podem atender suas necessidades no seu estudo.<br>
    Além dos pacotes que ele já sugeriu, outro que pode consultar é o
    epiR:<br>
    <br>
    <a href="https://cran.r-project.org/web/packages/epiR/epiR.pdf" target="_blank">https://cran.r-project.org/web/packages/epiR/epiR.pdf</a>  <br>
    <br>
    Outra sugestão de leitura que gostaria de é o material da professora
    Silvia Shimakura:<br>
    <br>
    <a href="http://leg.ufpr.br/~silvia/CE008/" target="_blank">http://leg.ufpr.br/~silvia/CE008/</a><br>
    <a href="http://leg.ufpr.br/~silvia/CE001/node68.html" target="_blank">http://leg.ufpr.br/~silvia/CE001/node68.html</a><br>
    <br>
    Veja qual forma se apresenta mais interessante para seu aprendizado,
    mas quando escrevo as funções no R como calculadora, acredito que os
    exemplos se tornam mais didáticos mesmo que já implementados em
    alguns pacotes do R.<br>
    <br>
    E como solicitou segue alguns comentários acerca dos comandos que
    enviei anteriormente:<br>
    <br>
    <br>
    ## Carregando os dados da tabela que enviou no e-mail<br>
    dados<-matrix(c(250,15,34,14),ncol=2,byrow=T)<br>
    <br>
    ## Verificando a existência de associação entre os parasitas através
    da Estatística Qui-quadrado<br>
    ## Quando utilizamos o teste o argumento sim=500, há um alerta pois
    há casela com frequência logo um pressuposto de validade do teste
    não foi atendido.<br>
    ## Uma alternativa então é calcular o p-valor através de simulação
    ou o teste exato de Fisher. Note que quando simulamos o p-valor não
    é necessário usar a correção de continuidade de Yates. <br>
    Q<-chisq.test(dados,sim=500)<br>
    Q<br>
    Q$observed ### frequência observada<br>
    Q$expected ### frequência esperada<span><br>
    ##Há evidências de se rejeitar H0 <br>
    <br></span>
    # Comandos para obtenção da diferença entre proporções e seu IC(95%)<span><br>
    ## Calculando as proporções entre Cryptosporidium negativo e
    Cryptosporidium positivo<br>
    p11<-(dados[1,1]/(sum(dados[1,])))<br></span>
    p22<-(dados[1,1]/(sum(dados[1,])))<br>
    <br>
    d<-p11-p21 # diferença entre as proporções<br>
    vd<-((p11*(1-p11))/(sum(dados[1,])-1)) +
    ((p21*(1-p21))/(sum(dados[2,])-1)) ## Estimativa para a variância<br>
    dvd<-sqrt(vd) ## raíz quadrada da variância<br>
    z<-qnorm(0.975) #percentil da Normal padrão<br>
    li<- d - (z*dvd) # Limite inferior<br>
    ls<- d + (z*dvd) # Limite superior<br>
    cbind(d,li,ls) # Intervalo de Confiança de 95%. Como o valor zero
    não está contido no IC a diferença é significativa ao nível de 95%
    de confiança.<span><br>
    <br>
    ##Razão de Chances ou Odds Ratio (OR) e IC95%(OR)<br></span>
    OR<-(dados[1,1]*dados[2,2])/(dados[1,2]*dados[2,1]) ## Calculando
    a <i><b>odds ratio (n11*n22/n12*n21)<br>
      </b></i>## Quando OR=1 indica chances iguais. Se for OR>1, o
    grupo 1 apresenta maior chance que o grupo 2.<br>
    ## Para o cálculo do IC para a OR, usamos o logaritmo da OR na base
    <i>e.</i><br>
    vf<-(1/dados[1,1])+(1/dados[1,2])+(1/dados[2,1]+(1/dados[2,2]))
    ##Estimativa para variância<br>
    dpf<-sqrt(vf) ## raíz quadrada da variância<br>
    z<-qnorm(0.975) #Percentil da Normal padrão<br>
    liOR<-exp(log(OR)-z*dpf) #Limite inferior<br>
    lsOR<-exp(log(OR)+z*dpf) # Limite Superior<br>
    cbind(OR,liOR,lsOR)<br>
    ## A chance de não haver Cryptosporidium e Giardia é 6,8 vezes maior
    que a presença podendo variar entre 3 e 15,4 vezes ao nível de
    confiança de 95%.<span><br>
    <br>
    <br>
    <br>
    <pre cols="72">-- 
Atenciosamente
Felipe E. Barletta Mendes
Estatístico - Conre3 9766-A
<a href="tel:%2B55%20%2841%29-92077191" value="+554192077191" target="_blank">+55 (41)-92077191</a>
<a href="tel:%2B55%20%2841%29-33287216" value="+554133287216" target="_blank">+55 (41)-33287216</a></pre>
  </span></div>

<br></div></div><span>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" rel="noreferrer" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" rel="noreferrer" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></span></blockquote></div><br><br clear="all"><span><div><br></div>-- <br><div><div dir="ltr"><div><br></div><b>MSc. André Lucas de O. Moreira</b><br><a href="http://lattes.cnpq.br/7258065668864153" target="_blank">http://lattes.cnpq.br/7258065668864153</a><br><a href="http://www.wikiaves.com.br/perfil_andrelukinhas" target="_blank"></a><a href="http://www.wikiaves.com.br/perfil_andrelukinhas" target="_blank">http://www.wikiaves.com.br/perfil_andrelukinhas</a><br>79 8837-3562<br>79 9132-9093<br><br></div></div>
</span></div>
<br>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" rel="noreferrer" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" rel="noreferrer" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br></div>
</div></div><br>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" rel="noreferrer" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" rel="noreferrer" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br><br clear="all"><div><br></div>-- <br><div><div dir="ltr"><div><br></div><b>MSc. André Lucas de O. Moreira</b><br><a href="http://lattes.cnpq.br/7258065668864153" target="_blank">http://lattes.cnpq.br/7258065668864153</a><br><a href="http://www.wikiaves.com.br/perfil_andrelukinhas" target="_blank"></a><a href="http://www.wikiaves.com.br/perfil_andrelukinhas" target="_blank">http://www.wikiaves.com.br/perfil_andrelukinhas</a><br>79 8837-3562<br>79 9132-9093<br><br></div></div>
</div>
</div></div><br>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" rel="noreferrer" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" rel="noreferrer" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br></div>