
Massa pra caramba Leonardo, vou testar isso já. muitíssimo obrigado Em 24 de junho de 2016 17:08, Elias Carvalho <ecacarva@gmail.com> escreveu:
Pessoal,
Eu preciso fazer uma análise para verificar a relação das variáveis com a morte e meus dados são semelhantes a tabela abaixo:
*CD_MUN* *MUNIC* *UF* *POPULAÇÃO* *UTI* *PIB* *AUTO* *MOTO* *ONIBUS* *CAMINHÃO* *MORTE* 1 A X 3577 10 18533,94 1549 661 40 360 2 *2* *B* *Y* *11958* *2* *12487,36* *5402* *2234* *185* *1401* *11* 3 C Z 6936 8 9947 2187 1478 60 666 6
Nessa tabela o município da linha 2 tem mais população, mais PIB, mais veículos e mais morte. Isso é óbvio porque a sua população e maior, mas isso não necessariamente quer dizer que esse município tenha mais mortes ou que elas são causadas mais provavelmente pela frota de carros ou motos.
Então pensando em evitar viéses, e por isso eu pensei em normalizar os dados dividindo as colunas UTI, PIB, AUTO, MOTO, ONIBUS, CAMINHÃO e MORTE pela coluna da POPULAÇÃO e dividir por 10.000, por exemplo para MORTE da linha 2, ficaria: (11/11958)*1000 = 9,1989.
Sessa forma a tabela ficaria assim:
*CD_MUN* *MUNIC* *UF* *POPULAÇÃO* *UTI* *PIB* *AUTO* *MOTO* *ONIBUS* *CAMINHÃO* *MORTE* 1 A X 3577 27,9564 51814,2018 4330,4445 1847,9172 111,8256 1006,4300 5,5913 *2* *B* *Y* *11958* *1,6725* *10442,6827* *4517,4778* *1868,2054* *154,7081* *1171,6006* *9,1989* 3 C Z 6936 11,5340 14341,1188 3153,1142 2130,9112 86,5052 960,2076 8,6505
Ou ainda poderia usar alguma ferramento do R que fosse mais confiável ?
-- Best regards... 8^)
“The mind that is open to new ideas never come back to its original size” *Albert Einstein*
-- Obrigado Elias
-- Best regards... 8^) “The mind that is open to new ideas never come back to its original size” *Albert Einstein* -- Obrigado Elias