[R-br] microdados censo IBGE 2010
Manoel Nascimento
manoelnascimento em gmail.com
Terça Agosto 14 08:58:24 BRT 2012
Olá!
Sou novo na lista e no uso do R, ainda estou me adaptando e entendendo
como funciona, e já apareceram várias dúvidas.
Estou precisando ler os microdados do Censo IBGE 2010. Pelo que vi, os
pacotes "IBGEPesq" e "dicionariosIBGE" ainda não foram atualizados para
nos fornecer os dicionários para o censo, então as diversas funções que
eles fornecem ainda não servem para o censo.
Por isso, fiz o seguinte (podem dar risada que é coisa de novato mesmo):
1) Fiz um script para cada conjunto de dados, que é mais ou menos o
seguinte (mudando alguns dados para cada conjunto de dados --
domicílios, mortalidade, pessoas, migrações):
initial.dir<-getwd()
setwd("/diretorio/local/IBGE/MicrodadosCenso2010")
sink("DomiciliosCenso2010.out")
DomicilioAC2010 <-
read.fwf("/diretorio/local/IBGE/MicrodadosCenso2010/AC/Dados/Domicilios/Amostra_Domicilios_12.txt",
widths = c(2, 5, 13, 8, 3, 1, 2, 3, 2, 1, 2, 2, 1, 6, 4, 1, 2, 2, 2, 2,
1, 1, 1, 2, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 1, 7, 5,
6, 4, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
1, 1, 1, 1, 1, 1))
[A mesma sintaxe é repetida para os microdados de domicílio de cada estado.]
save.image("~/Documentos/cidades/IBGE/MicrodadosCenso2010/Censo2010Domicilios.RData")
setwd(initial.dir)
Feito deste modo, o script demora um pouco para terminar, mas funciona
direitinho. Todas as tabelas são construídas de acordo com as
informações que forneci.
2) Tentei fazer este script funcionar usando o "read.fwf" com a variável
"col.names" para inserir os cabeçalhos de cada variável, mas ele dá um
erro. (Terei que refazer mais tarde o script com esta variável para
colar aqui o erro que dá.) Por isto, consegui construir as tabelas, mas
elas estão sem cabeçalhos. Pergunto: há algum modo de inserir os
cabeçalhos nas tabelas sem ser pela variável "col.names" do comando
"read.fwf"?
3) Alguns números constantes nas tabelas são códigos, a serem
substituídos por referências específicas. (Exs.: na coluna "Unidades da
Federação", para a região Norte, 11=Rondônia, 12=Acre, 13=Amazonas,
14=Roraima, 15=Pará, 16=Amapá, 17=Tocantins; cada município tem um
código específico; etc..) A única forma que tenho de saber se as tabelas
que construí estão corretas é substituir os números pelas referências.
Há algum meio simples de fazer isto?
Obrigado pela atenção e paciência.
Atenciosamente,
Manoel Nascimento
Mais detalhes sobre a lista de discussão R-br