[R-br] Normalização de dados

Elias Carvalho ecacarva em gmail.com
Sexta Junho 24 17:08:07 BRT 2016


Pessoal,

Eu preciso fazer uma análise para verificar a relação das variáveis com a
morte e meus dados são semelhantes a tabela abaixo:

*CD_MUN* *MUNIC* *UF* *POPULAÇÃO* *UTI* *PIB* *AUTO* *MOTO* *ONIBUS*
*CAMINHÃO* *MORTE*
1 A X 3577 10 18533,94 1549 661 40 360 2
*2* *B* *Y* *11958* *2* *12487,36* *5402* *2234* *185* *1401* *11*
3 C Z 6936 8 9947 2187 1478 60 666 6

Nessa tabela o município da linha 2 tem mais população, mais PIB, mais
veículos e mais morte. Isso é óbvio porque a sua população e maior, mas
isso não
necessariamente quer dizer que esse município tenha mais mortes ou que elas
são causadas mais provavelmente pela frota de carros ou motos.

Então pensando em evitar viéses, e por isso eu pensei em normalizar os
dados dividindo as colunas UTI, PIB, AUTO, MOTO, ONIBUS, CAMINHÃO e MORTE
pela coluna da POPULAÇÃO e dividir por 10.000, por exemplo para MORTE  da
linha 2, ficaria: (11/11958)*1000 = 9,1989.

Sessa forma a tabela ficaria assim:

*CD_MUN* *MUNIC* *UF* *POPULAÇÃO* *UTI* *PIB* *AUTO* *MOTO* *ONIBUS*
*CAMINHÃO* *MORTE*
1 A X 3577 27,9564 51814,2018 4330,4445 1847,9172 111,8256 1006,4300 5,5913
*2* *B* *Y* *11958* *1,6725* *10442,6827* *4517,4778* *1868,2054* *154,7081*
*1171,6006* *9,1989*
3 C Z 6936 11,5340 14341,1188 3153,1142 2130,9112 86,5052 960,2076 8,6505

Ou ainda poderia usar alguma ferramento do R que fosse mais confiável ?

-- 
Best regards... 8^)

“The mind that is open to new ideas never come back
to its original size”  *Albert Einstein*


-- 
Obrigado
Elias
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20160624/3ff9230d/attachment.html>


Mais detalhes sobre a lista de discussão R-br