[R-br] Chi-quadrado demonstra associação, mas e daí?

Felipe felipe.e.barletta em gmail.com
Quarta Novembro 4 18:33:28 BRST 2015


André,

Como o Leonardo disse no e-mail anterior, há pacotes que já calculam 
medidas como diferença de proporção OR, seus respectivos IC e outras 
medidas que podem atender suas necessidades no seu estudo.
Além dos pacotes que ele já sugeriu, outro que pode consultar é o epiR:

https://cran.r-project.org/web/packages/epiR/epiR.pdf

Outra sugestão de leitura que gostaria de é o material da professora 
Silvia Shimakura:

http://leg.ufpr.br/~silvia/CE008/
http://leg.ufpr.br/~silvia/CE001/node68.html

Veja qual forma se apresenta mais interessante para seu aprendizado, mas 
quando escrevo as funções no R como calculadora, acredito que os 
exemplos se tornam mais didáticos mesmo que já implementados em alguns 
pacotes do R.

E como solicitou segue alguns comentários acerca dos comandos que enviei 
anteriormente:


## Carregando os dados da tabela que enviou no e-mail
dados<-matrix(c(250,15,34,14),ncol=2,byrow=T)

## Verificando a existência de associação entre os parasitas através da 
Estatística Qui-quadrado
## Quando utilizamos o teste o argumento sim=500, há um alerta pois há 
casela com frequência logo um pressuposto de validade do teste não foi 
atendido.
## Uma alternativa então é calcular o p-valor através de simulação ou o 
teste exato de Fisher. Note que quando simulamos o p-valor não é 
necessário usar a correção de continuidade de Yates.
Q<-chisq.test(dados,sim=500)
Q
Q$observed ### frequência observada
Q$expected ### frequência esperada
##Há evidências de se rejeitar H0

# Comandos para obtenção da diferença entre proporções e seu IC(95%)
## Calculando as proporções entre Cryptosporidium negativo e 
Cryptosporidium positivo
p11<-(dados[1,1]/(sum(dados[1,])))
p22<-(dados[1,1]/(sum(dados[1,])))

d<-p11-p21 # diferença entre as proporções
vd<-((p11*(1-p11))/(sum(dados[1,])-1)) + 
((p21*(1-p21))/(sum(dados[2,])-1)) ## Estimativa para a variância
dvd<-sqrt(vd) ## raíz quadrada da variância
z<-qnorm(0.975) #percentil da Normal padrão
li<- d - (z*dvd) # Limite inferior
ls<- d + (z*dvd) # Limite superior
cbind(d,li,ls) # Intervalo de Confiança de 95%. Como o valor zero não 
está contido no IC a diferença é significativa ao nível de 95% de confiança.

##Razão de Chances ou Odds Ratio (OR) e IC95%(OR)
OR<-(dados[1,1]*dados[2,2])/(dados[1,2]*dados[2,1]) ## Calculando a 
/*odds ratio (n11*n22/n12*n21)
*/## Quando OR=1 indica chances iguais. Se for OR>1, o grupo 1 apresenta 
maior chance que o grupo 2.
## Para o cálculo do IC para a OR, usamos o logaritmo da OR na base /e./
vf<-(1/dados[1,1])+(1/dados[1,2])+(1/dados[2,1]+(1/dados[2,2])) 
##Estimativa para variância
dpf<-sqrt(vf) ## raíz quadrada da variância
z<-qnorm(0.975) #Percentil da Normal padrão
liOR<-exp(log(OR)-z*dpf) #Limite inferior
lsOR<-exp(log(OR)+z*dpf) # Limite Superior
cbind(OR,liOR,lsOR)
## A chance de não haver Cryptosporidium e Giardia é 6,8 vezes maior que 
a presença podendo variar entre 3 e 15,4 vezes ao nível de confiança de 95%.



-- 
Atenciosamente
Felipe E. Barletta Mendes
Estatístico - Conre3 9766-A
+55 (41)-92077191
+55 (41)-33287216

-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20151104/ae036f7d/attachment.html>


Mais detalhes sobre a lista de discussão R-br