[R-br] leitura dados PNAD 2003 - variáveis V1701 a V1377
Leonardo Ferreira Fontenelle
leonardof em leonardof.med.br
Terça Março 24 13:24:24 BRT 2015
Para ler o arquivo, você poderia em princípio usar a função read.fwf.
Mas essa função não é otimizada para dados grandes, então você vai
preferir alguma alternativa. Uma opção é importar com o comando laf.open
do pacote LaF, e outra é transformar de largura fixa para csv com o
comando fwf2csv do pacote descr, e então importar com o comando
read.table do pacote data.table. Atualmente minha opção favorita é esta
última. Procurando nesta lista de discussão e no stack overflow você
encontra orientações detalhadas.
--
Leonardo Ferreira Fontenelle
http://lattes.cnpq.br/9234772336296638
Em Ter 24 mar. 2015, às 09:52, Luciane Maria Pilotto escreveu:
> Bom dia,
>
> estou tentando ler as variáveis da PNAD de 2003 - V1701 a V1377-
> relacionadas ao suplemento Saúde- e as mesmas aparecem como NA. O banco
> está disponível no site do IBGE
> http://www.ibge.gov.br/home/estatistica/populacao/trabalhoerendimento/pnad2013/microdados.shtm.
>
> Também podem ser acessados no dropbox:
> https://www.dropbox.com/sh/d0z62bg4qqyg2x3/AAAVDYWjVlb4JpUTYlQfvq-Ka?dl=0.
>
> Estou usando os comandos abaixo:
>
> #----------------Ler microdados da PNAD 2003 (variáveis referente ao
> suplemento Saúde) utilizando a função read.fwf.r ----------------------#
>
> source(file.choose()) #carregar a função selectvar da pasta funcoes
> source(file.choose()) #carregar a função getdic da pasta funcoes
>
> # Gerar os dicionários de dados a partir dos arquivos: 'input
> PES2003.txt'
> dicPNAD2003Pes <- getdic(file.choose())# abrir o arquivo input
> PES2003.txt, dentro da Pasta Input
>
> head(dicPNAD2003Pes)
> str(dicPNAD2003Pes)
> nrow(dicPNAD2003Pes)
> dim(dicPNAD2003Pes)
>
> # Para EXCLUSÃO do "UF" (que apresenta erro na importação por começar na
> mesma posição que número de controle):
>
> dicPNAD2003Pes <- subset(dicPNAD2003Pes, cod !="UF")
> head(dicPNAD2003Pes)
> dim(dicPNAD2003Pes)
>
> ####Usar estes comandos para importar *apenas algumas variáveis* da base
> de dados das PESSOAS
>
> variaveis <- selectvar(dicPNAD2003Pes) # Com a tecla CTRL pressionada,
> selecione as variáveis de interesse, neste caso são as que aparecem como
> NA:
> Erro em substring(x, first, last) : invalid substring arguments
>
> ### PROBLEMA: Ao abrir a janela das variáveis utilizando o comando acima,
> as variáveis de interesse referentes a saúde aparecem como NA,
> diferentemente das demais variáveis que aparecem no banco. No dicionário
> as mesmas aparecerem corretamente.
>
> Atenciosamente,
>
> __________________________________________________
> Luciane Maria Pilotto
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
Mais detalhes sobre a lista de discussão R-br