[R-br] Acessar microdados RAIS Estabelecimentos

Éder Comunello comunello.eder em gmail.com
Quinta Maio 12 16:51:54 BRT 2016


​Carlos, boa tarde!

Eu dei uma olhada nos arquivos e de fato não batem. Acho que a melhor saída
é a que o colega Rodrigo indicou.

Mas se você estiver disposto a testar, poderia avaliar essa divisão que
fiz. Teria que verificar se as colunas importadas estão coerentes com o
dados esperados(conforme mencionado no XLS).

### <code r>
readLines("ESTB2014 com UF e CEP.txt", n=1)

lab <- c("BairrosSP", "BairrosFortaleza", "BairrosRJ", "CNAE20Classe",
"CNAE95Classe", "DistritosSP", "QtdVínculosCLT", "QtdVínculosAtivos",
"QtdVínculosEstatutários", "IndAtividadeAno", "IndCEIVinculado",
"IndEstabParticipaPAT", "Vazio1", "IndRaisNegativa", "IndSimples",
"Município", "NaturezaJurídica", "Vazio2", "RegiõesAdmDF",
"CNAE20_Subclasse",
"TamanhoEstab", "TipoEstab1", "TipoEstab2", "UF", "CEPEstab")

# Dados com 168 colunas
wid <- (c(4,4,4,5,5,7,20,20,20,1,1,1,19,1,1,6,4,16,4,7,2,2,4,2,8))

data.frame(lab, wid)

# importação das primeiras 10.000 linhas!!!!
tmp <- read.fwf("ESTB2014 com UF e CEP.txt", widths=wid, col.names=lab,
                skip=1, n=10000, as.is=T)

### </code>​


​
================================================
Éder Comunello
Agronomist (UEM), MSc in Environ. Sciences (UEM)
DSc in Agricultural Systems Engineering (USP/Esalq)
Brazilian Agricultural Research Corporation (Embrapa)
Dourados, MS, Brazil |<O>|
================================================
GEO, -22.2752, -54.8182, 408m
UTC-04:00 / DST: UTC-03:00




Em 12 de maio de 2016 13:55, Carlos Andrade <prf.cantonio em gmail.com>
escreveu:

> Éder,
>
> Obrigado pela resposta. Também baixei este arquivo. Pelo que entendi os
> campos são descritos e informado o tamanho. Somando esses valores dá 87.
> Abrindo o arquivo txt vejo que são  172 colunas, com várias delas vazias no
> meio do registro. O arquivo de layout não está claro, não informa os campos
> em branco e nem o início e o fim dos outros campos.
> Estou pesquisando na web mas ainda não encontrei a resposta da minha
> dúvida.
>
> Em 12 de maio de 2016 09:03, Éder Comunello <comunello.eder em gmail.com>
> escreveu:
>
>> Carlos, bom dia!
>>
>> Normalmente tem uma descrição do formato junto dos dados. Nesse caso não
>> está no mesmo diretório, mas logo acima...
>>
>> ftp://ftp.mtps.gov.br/pdet/microdados/RAIS/RAIS_estabelecimento_layout.xls
>>
>>>> ================================================
>> Éder Comunello
>> Agronomist (UEM), MSc in Environ. Sciences (UEM)
>> DSc in Agricultural Systems Engineering (USP/Esalq)
>> Brazilian Agricultural Research Corporation (Embrapa)
>> Dourados, MS, Brazil |<O>|
>> ================================================
>> GEO, -22.2752, -54.8182, 408m
>> UTC-04:00 / DST: UTC-03:00
>>
>>
>>
>>
>> Em 11 de maio de 2016 20:20, Carlos Andrade <prf.cantonio em gmail.com>
>> escreveu:
>>
>>> Prezados amigos da lista,
>>>
>>> Solicito ajuda para uma tarefa. Estou tentando acessar os dados do
>>> arquivo de microdados da RAIS Estabelecimentos.
>>> Tentei com o comando read.fwf, pois o arquivo não possui delimitadores,
>>> informando o tamanho dos campos, segundo o arquivo de layout. Sem sucesso.
>>> Abri o arquivo txt no editor vim e verifiquei que há 172 colunas, mas
>>> quando faço a soma dos campos informados pelo layout só dá 87. Observei
>>> também colunas vazias.
>>>
>>> Repositório dos microdados:
>>> ftp://ftp.mtps.gov.br/pdet/microdados/RAIS/2014/
>>> Baixei o arquivo ESTB com UF e CEP.7z
>>>
>>> Agradeço antecipadamente.
>>> --
>>> Atenciosamente,
>>>
>>> Prof. Carlos A. S. de Andrade
>>> LAPEA - Laboratório de Pesquisa em Economia Aplicada e Engenharia de
>>> Produção
>>> Universidade Federal de Campina Grande.
>>> Centro de Humanidades
>>> Unidade Acadêmica de Economia
>>>
>>> _______________________________________________
>>> R-br mailing list
>>> R-br em listas.c3sl.ufpr.br
>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>> código mínimo reproduzível.
>>>
>>
>>
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>>
>
>
>
> --
> Atenciosamente,
>
> Prof. Carlos A. S. de Andrade
> LAPEA - Laboratório de Pesquisa em Economia Aplicada e Engenharia de
> Produção
> Universidade Federal de Campina Grande.
> Centro de Humanidades
> Unidade Acadêmica de Economia
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20160512/c1123ae8/attachment.html>


Mais detalhes sobre a lista de discussão R-br