Eu preciso fazer uma análise para verificar a relação das variáveis com a morte e meus dados são semelhantes a tabela abaixo:
necessariamente quer dizer que esse município tenha mais mortes ou que elas são causadas mais provavelmente pela frota de carros ou motos.
Então pensando em evitar viéses, e por isso eu pensei em normalizar os dados dividindo as colunas UTI, PIB, AUTO, MOTO, ONIBUS, CAMINHÃO e MORTE
pela coluna da POPULAÇÃO e dividir por 10.000, por exemplo para MORTE da linha 2, ficaria: (11/11958)*1000 = 9,1989.
Sessa forma a tabela ficaria assim:
CD_MUN |
MUNIC |
UF |
POPULAÇÃO |
UTI |
PIB |
AUTO |
MOTO |
ONIBUS |
CAMINHÃO |
MORTE |
1 |
A |
X |
3577 |
27,9564 |
51814,2018 |
4330,4445 |
1847,9172 |
111,8256 |
1006,4300 |
5,5913 |
2 |
B |
Y |
11958 |
1,6725 |
10442,6827 |
4517,4778 |
1868,2054 |
154,7081 |
1171,6006 |
9,1989 |
3 |
C |
Z |
6936 |
11,5340 |
14341,1188 |
3153,1142 |
2130,9112 |
86,5052 |
960,2076 |
8,6505 |
Ou ainda poderia usar alguma ferramento do R que fosse mais confiável ?
--
Best regards... 8^)
“
The mind that is open to new ideas never come backto its original size”
Albert Einstein --