[R-br] análise de sarampo - como proceder com o teste de hipóteses?
Daniela Recchia
daniela_recchia em yahoo.com.br
Quinta Dezembro 8 11:24:04 BRST 2011
Olá pessoal,
a pergunta é mais teórica. Estou analisando o comportamento do sarampo ao longo dos anos. Aqui, em 1999 foi criada a lei que diz que as criancas devem ser vacinadas contra sarampo, cachumba e rubéola em 2 doses de vacinas, para a garantia de aproximadamente 99% de protecao contra as doencas.
Mas a princípio, parece que ao decorrer do tempo (analiso de 2001 a 2011) o numero de criancas com sarampo realmente diminui, após essa campanha. Existem sim ainda algumas, devido a varios fatores (pais nao querem vacinar os filhos, as criancas só tomam 1 vacina...) mas o numero de adultos que apresentam sarampo tem aumentado, se comparado ao inicio da campanha. Por exemplo, se olhar os dados de doentes no peridio de 2003-2005 e 2009-2011 os adultos infectados nesses ultimos anos sao bem mais do que nos primeiros. (Na verdade nas idades de 15-39 anos)
Entao a pincipio tenho dados para os doentes ao longo dos anos e por idade, algo como:
> dados2
Altersgruppe 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
1 00-00 107 156 39 14 38 156 24 28 50 29 66
2 01-01 524 405 81 22 57 157 35 50 63 41 96
3 02-02 420 313 42 9 30 68 20 31 15 25 49
4 03-03 359 320 71 10 40 73 25 42 20 16 47
5 04-04 397 375 56 5 42 82 21 46 17 19 42
6 05-09 1594 1527262 17 250 446 123 210 83 127 293
7 10-14 1034 803 112 8 136 515 116 217 72 179 340
8 15-19 786 356 48 11 56 375 68 139 74 133 218
9 20-24 376 147 26 2 37 135 39 44 55 64 126
10 25-29 175 85 12 8 31 110 32 41 49 45 99
11 30-39 168 124 14 6 45 122 49 46 51 67 124
12 40-49 49 29 11 8 13 39 11 13 17 28 70
13 50-59 17 7 3 2 3 19 3 6 3 4 8
14 60-69 9 3 0 1 3 8 0 1 0 3 3
15 70 1 3 0 0 0 3 0 0 2 0 3
A minha idéia entao é rodar umt este estatistico, para a hipótese nula H0: a proporcao(?) ou o numero de adultos doentes no periodo 2003-2005 nao se diferencia significativamente dos doentes no periodo de 2009-2011.
Tudo bem, meu próximo passo entao foi agrupar os dados, de talforma que tenho agora grupo de pessoas de 0 a 4 anos, 5 a 14 anos, 15 a 39 anos e acima de 40 anos. Para analisar por pediordos, simplesmente somei os casos para os anos de 2003-2005 e 2009-2011. Ok, agora tenho um numero por periodo e por grupo. Como compara-los efetivamente? Pois do jeito que retrabalhei os dados, nao consigo aplicar o teste T para 2 populacoes, nao tenho como medir normalidade e homocedasticidade. Na verdade, nao sei se o jeito que formatei os dados para a análise está correta para analisar a hipótese desejada.
Como vcs fariam?
Abracos,
--
Daniela Rodrigues Recchia
Master Student of Statistics - Technische Universität Dortmund.
"It is better to have an inexact answer to the right question than a precise one to the wrong question!"
John Tuckey
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20111208/a289dc09/attachment.html>
Mais detalhes sobre a lista de discussão R-br