<div dir="ltr"><div class="gmail_default" style="font-family:verdana,sans-serif">​Carlos, boa tarde!</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Eu dei uma olhada nos arquivos e de fato não batem. Acho que a melhor saída é a que o colega Rodrigo indicou.</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Mas se você estiver disposto a testar, poderia avaliar essa divisão que fiz. Teria que verificar se as colunas importadas estão coerentes com o dados esperados(conforme mencionado no XLS).</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif"><span style="font-family:monospace,monospace">### <code r></span><br></div><div class="gmail_default"><div class="gmail_default"><font face="monospace, monospace">readLines("ESTB2014 com UF e CEP.txt", n=1)</font></div><div class="gmail_default"><font face="monospace, monospace"><br></font></div><div class="gmail_default"><font face="monospace, monospace">lab <- c("BairrosSP", "BairrosFortaleza", "BairrosRJ", "CNAE20Classe", </font></div><div class="gmail_default"><font face="monospace, monospace">"CNAE95Classe", "DistritosSP", "QtdVínculosCLT", "QtdVínculosAtivos", </font></div><div class="gmail_default"><font face="monospace, monospace">"QtdVínculosEstatutários", "IndAtividadeAno", "IndCEIVinculado", </font></div><div class="gmail_default"><font face="monospace, monospace">"IndEstabParticipaPAT", "Vazio1", "IndRaisNegativa", "IndSimples", </font></div><div class="gmail_default"><font face="monospace, monospace">"Município", "NaturezaJurídica", "Vazio2", "RegiõesAdmDF", "CNAE20_Subclasse", </font></div><div class="gmail_default"><font face="monospace, monospace">"TamanhoEstab", "TipoEstab1", "TipoEstab2", "UF", "CEPEstab")</font></div><div class="gmail_default"><font face="monospace, monospace"><br></font></div><div class="gmail_default"><font face="monospace, monospace"># Dados com 168 colunas</font></div><div class="gmail_default"><font face="monospace, monospace">wid <- (c(4,4,4,5,5,7,20,20,20,1,1,1,19,1,1,6,4,16,4,7,2,2,4,2,8))</font></div><div class="gmail_default"><font face="monospace, monospace"><br></font></div><div class="gmail_default"><font face="monospace, monospace">data.frame(lab, wid)</font></div><div class="gmail_default"><font face="monospace, monospace"><br></font></div><div class="gmail_default"><font face="monospace, monospace"># importação das primeiras 10.000 linhas!!!!</font></div><div class="gmail_default"><font face="monospace, monospace">tmp <- read.fwf("ESTB2014 com UF e CEP.txt", widths=wid, col.names=lab, </font></div><div class="gmail_default"><font face="monospace, monospace">                skip=1, n=10000, <a href="http://as.is">as.is</a>=T)</font></div><div class="gmail_default"><font face="monospace, monospace"><br></font></div></div><div class="gmail_default" style="font-family:verdana,sans-serif"><span style="font-family:monospace,monospace">### </code></span>​</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div></div><div class="gmail_extra"><br clear="all"><div><div class="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><font face="arial, helvetica, sans-serif" style="font-size:small"><div style="font-family:'trebuchet ms',sans-serif;display:inline">​</div></font><font face="arial, helvetica, sans-serif" style="font-size:12.8px"><span style="font-size:small">================================================</span><br>Éder Comunello</font><div style="font-size:12.8px"><span style="font-family:arial,helvetica,sans-serif">Agronomist (UEM), MSc in Environ. Sciences (UEM)</span><font face="arial, helvetica, sans-serif"><br></font></div><div style="font-size:12.8px"><div style="font-size:small"><span style="font-family:arial,helvetica,sans-serif">DSc in Agricultural Systems Engineering (USP/Esalq)</span><br></div><div><span style="font-size:small">Brazilian Agricultural Research Corporation (</span><font face="arial, helvetica, sans-serif" style="font-size:small">Embrapa)</font></div><div><div><font face="arial, helvetica, sans-serif" style="font-size:small">Dourados, MS, Brazil </font><font face="arial, helvetica, sans-serif" size="2">|<O>|</font></div><div style="font-size:small"><span style="font-family:arial,helvetica,sans-serif">================================================</span><br></div></div></div><div style="font-size:small"><font face="arial, helvetica, sans-serif">GEO, </font>-22.2752, -54.8182, 408m<span style="font-family:arial,helvetica,sans-serif"><br></span></div><div style="font-size:12.8px"><span style="font-size:small;font-family:arial,helvetica,sans-serif">UTC-04:00 / DST: UTC-03:00</span></div><div><div><div><br></div><div><br></div></div><div style="font-size:small"><br></div></div></div></div></div></div></div></div></div></div></div>
<br><div class="gmail_quote">Em 12 de maio de 2016 13:55, Carlos Andrade <span dir="ltr"><<a href="mailto:prf.cantonio@gmail.com" target="_blank">prf.cantonio@gmail.com</a>></span> escreveu:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div><div>Éder,<br><br></div>Obrigado pela resposta. Também baixei este arquivo. Pelo que entendi os campos são descritos e informado o tamanho. Somando esses valores dá 87. Abrindo o arquivo txt vejo que são  172 colunas, com várias delas vazias no meio do registro. O arquivo de layout não está claro, não informa os campos em branco e nem o início e o fim dos outros campos.<br></div>Estou pesquisando na web mas ainda não encontrei a resposta da minha dúvida.<br></div><div class="HOEnZb"><div class="h5"><div class="gmail_extra"><br><div class="gmail_quote">Em 12 de maio de 2016 09:03, Éder Comunello <span dir="ltr"><<a href="mailto:comunello.eder@gmail.com" target="_blank">comunello.eder@gmail.com</a>></span> escreveu:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div class="gmail_default" style="font-family:verdana,sans-serif">Carlos, bom dia!</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Normalmente tem uma descrição do formato junto dos dados. Nesse caso não está no mesmo diretório, mas logo acima...</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default"><font face="verdana, sans-serif"><a href="ftp://ftp.mtps.gov.br/pdet/microdados/RAIS/RAIS_estabelecimento_layout.xls" target="_blank">ftp://ftp.mtps.gov.br/pdet/microdados/RAIS/RAIS_estabelecimento_layout.xls</a></font><br></div></div><div class="gmail_extra"><br clear="all"><div><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><font style="font-size:small" face="arial, helvetica, sans-serif"><div style="font-family:'trebuchet ms',sans-serif;display:inline">​</div></font><font style="font-size:12.8px" face="arial, helvetica, sans-serif"><span style="font-size:small">================================================</span><br>Éder Comunello</font><div style="font-size:12.8px"><span style="font-family:arial,helvetica,sans-serif">Agronomist (UEM), MSc in Environ. Sciences (UEM)</span><font face="arial, helvetica, sans-serif"><br></font></div><div style="font-size:12.8px"><div style="font-size:small"><span style="font-family:arial,helvetica,sans-serif">DSc in Agricultural Systems Engineering (USP/Esalq)</span><br></div><div><span style="font-size:small">Brazilian Agricultural Research Corporation (</span><font style="font-size:small" face="arial, helvetica, sans-serif">Embrapa)</font></div><div><div><font style="font-size:small" face="arial, helvetica, sans-serif">Dourados, MS, Brazil </font><font face="arial, helvetica, sans-serif" size="2">|<O>|</font></div><div style="font-size:small"><span style="font-family:arial,helvetica,sans-serif">================================================</span><br></div></div></div><div style="font-size:small"><font face="arial, helvetica, sans-serif">GEO, </font>-22.2752, -54.8182, 408m<span style="font-family:arial,helvetica,sans-serif"><br></span></div><div style="font-size:12.8px"><span style="font-size:small;font-family:arial,helvetica,sans-serif">UTC-04:00 / DST: UTC-03:00</span></div><div><div><div><br></div><div><br></div></div><div style="font-size:small"><br></div></div></div></div></div></div></div></div></div></div></div>
<br><div class="gmail_quote"><div><div>Em 11 de maio de 2016 20:20, Carlos Andrade <span dir="ltr"><<a href="mailto:prf.cantonio@gmail.com" target="_blank">prf.cantonio@gmail.com</a>></span> escreveu:<br></div></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div><div><div dir="ltr"><div><div><div><div><div>Prezados amigos da lista,<br><br></div>Solicito ajuda para uma tarefa. Estou tentando acessar os dados do arquivo de microdados da RAIS Estabelecimentos.<br></div>Tentei com o comando read.fwf, pois o arquivo não possui delimitadores, informando o tamanho dos campos, segundo o arquivo de layout. Sem sucesso.<br></div>Abri o arquivo txt no editor vim e verifiquei que há 172 colunas, mas quando faço a soma dos campos informados pelo layout só dá 87. Observei também colunas vazias.<br><br></div>Repositório dos microdados: <a href="ftp://ftp.mtps.gov.br/pdet/microdados/RAIS/2014/" target="_blank">ftp://ftp.mtps.gov.br/pdet/microdados/RAIS/2014/</a><br></div>Baixei o arquivo ESTB com UF e CEP.7z<br clear="all"><div><div><div><div><div><div><br></div><div>Agradeço antecipadamente.<span><font color="#888888"><br></font></span></div><span><font color="#888888"><div>-- <br><div>Atenciosamente,<br><br>Prof. Carlos A. S. de Andrade<br>LAPEA - Laboratório de Pesquisa em Economia Aplicada e Engenharia de Produção<br><div>Universidade Federal de Campina Grande.<br></div><div>Centro de Humanidades 
 </div><div>Unidade Acadêmica de Economia</div></div>
</div></font></span></div></div></div></div></div></div>
<br></div></div>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" rel="noreferrer" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" rel="noreferrer" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br></div>
<br>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" rel="noreferrer" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" rel="noreferrer" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br><br clear="all"><br>-- <br><div>Atenciosamente,<br><br>Prof. Carlos A. S. de Andrade<br>LAPEA - Laboratório de Pesquisa em Economia Aplicada e Engenharia de Produção<br><div>Universidade Federal de Campina Grande.<br></div><div>Centro de Humanidades 
 </div><div>Unidade Acadêmica de Economia</div></div>
</div>
</div></div></blockquote></div><br></div>