
Olá pessoal, a pergunta é mais teórica. Estou analisando o comportamento do sarampo ao longo dos anos. Aqui, em 1999 foi criada a lei que diz que as criancas devem ser vacinadas contra sarampo, cachumba e rubéola em 2 doses de vacinas, para a garantia de aproximadamente 99% de protecao contra as doencas. Mas a princípio, parece que ao decorrer do tempo (analiso de 2001 a 2011) o numero de criancas com sarampo realmente diminui, após essa campanha. Existem sim ainda algumas, devido a varios fatores (pais nao querem vacinar os filhos, as criancas só tomam 1 vacina...) mas o numero de adultos que apresentam sarampo tem aumentado, se comparado ao inicio da campanha. Por exemplo, se olhar os dados de doentes no peridio de 2003-2005 e 2009-2011 os adultos infectados nesses ultimos anos sao bem mais do que nos primeiros. (Na verdade nas idades de 15-39 anos) Entao a pincipio tenho dados para os doentes ao longo dos anos e por idade, algo como:
dados2 Altersgruppe 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 1 00-00 107 156 39 14 38 156 24 28 50 29 66 2 01-01 524 405 81 22 57 157 35 50 63 41 96 3 02-02 420 313 42 9 30 68 20 31 15 25 49 4 03-03 359 320 71 10 40 73 25 42 20 16 47 5 04-04 397 375 56 5 42 82 21 46 17 19 42 6 05-09 1594 1527262 17 250 446 123 210 83 127 293 7 10-14 1034 803 112 8 136 515 116 217 72 179 340 8 15-19 786 356 48 11 56 375 68 139 74 133 218 9 20-24 376 147 26 2 37 135 39 44 55 64 126 10 25-29 175 85 12 8 31 110 32 41 49 45 99 11 30-39 168 124 14 6 45 122 49 46 51 67 124 12 40-49 49 29 11 8 13 39 11 13 17 28 70 13 50-59 17 7 3 2 3 19 3 6 3 4 8 14 60-69 9 3 0 1 3 8 0 1 0 3 3 15 70 1 3 0 0 0 3 0 0 2 0 3
A minha idéia entao é rodar umt este estatistico, para a hipótese nula H0: a proporcao(?) ou o numero de adultos doentes no periodo 2003-2005 nao se diferencia significativamente dos doentes no periodo de 2009-2011. Tudo bem, meu próximo passo entao foi agrupar os dados, de talforma que tenho agora grupo de pessoas de 0 a 4 anos, 5 a 14 anos, 15 a 39 anos e acima de 40 anos. Para analisar por pediordos, simplesmente somei os casos para os anos de 2003-2005 e 2009-2011. Ok, agora tenho um numero por periodo e por grupo. Como compara-los efetivamente? Pois do jeito que retrabalhei os dados, nao consigo aplicar o teste T para 2 populacoes, nao tenho como medir normalidade e homocedasticidade. Na verdade, nao sei se o jeito que formatei os dados para a análise está correta para analisar a hipótese desejada. Como vcs fariam? Abracos, -- Daniela Rodrigues Recchia Master Student of Statistics - Technische Universität Dortmund. "It is better to have an inexact answer to the right question than a precise one to the wrong question!" John Tuckey