[R-br] Normalização de dados
Elias Carvalho
ecacarva em gmail.com
Sexta Junho 24 17:08:07 BRT 2016
Pessoal,
Eu preciso fazer uma análise para verificar a relação das variáveis com a
morte e meus dados são semelhantes a tabela abaixo:
*CD_MUN* *MUNIC* *UF* *POPULAÇÃO* *UTI* *PIB* *AUTO* *MOTO* *ONIBUS*
*CAMINHÃO* *MORTE*
1 A X 3577 10 18533,94 1549 661 40 360 2
*2* *B* *Y* *11958* *2* *12487,36* *5402* *2234* *185* *1401* *11*
3 C Z 6936 8 9947 2187 1478 60 666 6
Nessa tabela o município da linha 2 tem mais população, mais PIB, mais
veículos e mais morte. Isso é óbvio porque a sua população e maior, mas
isso não
necessariamente quer dizer que esse município tenha mais mortes ou que elas
são causadas mais provavelmente pela frota de carros ou motos.
Então pensando em evitar viéses, e por isso eu pensei em normalizar os
dados dividindo as colunas UTI, PIB, AUTO, MOTO, ONIBUS, CAMINHÃO e MORTE
pela coluna da POPULAÇÃO e dividir por 10.000, por exemplo para MORTE da
linha 2, ficaria: (11/11958)*1000 = 9,1989.
Sessa forma a tabela ficaria assim:
*CD_MUN* *MUNIC* *UF* *POPULAÇÃO* *UTI* *PIB* *AUTO* *MOTO* *ONIBUS*
*CAMINHÃO* *MORTE*
1 A X 3577 27,9564 51814,2018 4330,4445 1847,9172 111,8256 1006,4300 5,5913
*2* *B* *Y* *11958* *1,6725* *10442,6827* *4517,4778* *1868,2054* *154,7081*
*1171,6006* *9,1989*
3 C Z 6936 11,5340 14341,1188 3153,1142 2130,9112 86,5052 960,2076 8,6505
Ou ainda poderia usar alguma ferramento do R que fosse mais confiável ?
--
Best regards... 8^)
“The mind that is open to new ideas never come back
to its original size” *Albert Einstein*
--
Obrigado
Elias
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20160624/3ff9230d/attachment.html>
Mais detalhes sobre a lista de discussão R-br