<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">

<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40"><head><meta name=Generator content="Microsoft Word 14 (filtered medium)"><style><!--

/* Font Definitions */

@font-face

        {font-family:Calibri;

        panose-1:2 15 5 2 2 2 4 3 2 4;}

@font-face

        {font-family:Tahoma;

        panose-1:2 11 6 4 3 5 4 4 2 4;}

@font-face

        {font-family:Consolas;

        panose-1:2 11 6 9 2 2 4 3 2 4;}

/* Style Definitions */

p.MsoNormal, li.MsoNormal, div.MsoNormal

        {margin:0cm;

        margin-bottom:.0001pt;

        font-size:12.0pt;

        font-family:"Times New Roman","serif";}

a:link, span.MsoHyperlink

        {mso-style-priority:99;

        color:blue;

        text-decoration:underline;}

a:visited, span.MsoHyperlinkFollowed

        {mso-style-priority:99;

        color:purple;

        text-decoration:underline;}

p

        {mso-style-priority:99;

        mso-margin-top-alt:auto;

        margin-right:0cm;

        margin-bottom:5.95pt;

        margin-left:0cm;

        font-size:12.0pt;

        font-family:"Times New Roman","serif";}

pre

        {mso-style-priority:99;

        mso-style-link:"Pré-formatação HTML Char";

        margin:0cm;

        margin-bottom:.0001pt;

        font-size:10.0pt;

        font-family:"Courier New";}

span.Pr-formataoHTMLChar

        {mso-style-name:"Pré-formatação HTML Char";

        mso-style-priority:99;

        mso-style-link:"Pré-formatação HTML";

        font-family:"Consolas","serif";

        mso-fareast-language:PT-BR;}

p.western, li.western, div.western

        {mso-style-name:western;

        mso-margin-top-alt:auto;

        margin-right:0cm;

        margin-bottom:5.95pt;

        margin-left:0cm;

        font-size:12.0pt;

        font-family:"Times New Roman","serif";}

span.EstiloDeEmail21

        {mso-style-type:personal-reply;

        font-family:"Calibri","sans-serif";

        color:#1F497D;}

.MsoChpDefault

        {mso-style-type:export-only;

        font-family:"Calibri","sans-serif";

        mso-fareast-language:EN-US;}

@page WordSection1

        {size:612.0pt 792.0pt;

        margin:70.85pt 3.0cm 70.85pt 3.0cm;}

div.WordSection1

        {page:WordSection1;}

--></style><!--[if gte mso 9]><xml>

<o:shapedefaults v:ext="edit" spidmax="1026" />

</xml><![endif]--><!--[if gte mso 9]><xml>

<o:shapelayout v:ext="edit">

<o:idmap v:ext="edit" data="1" />

</o:shapelayout></xml><![endif]--></head><body lang=PT-BR link=blue vlink=purple><div class=WordSection1><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>Roney,<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>Para importar qualquer tipo de dados fixo, pode-se utilizar a função read.fwf do pacote gdata.<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>Entretanto, certa vez o Prof. Djalma ao trabalhar com os dados da PNAD utilizava, salvo engano, a função scan() e o substr() para separar os dados. Parecia ser mais rápida, ainda não tive tempo para verificar. Na função read.fwf tem um parâmetro de buffer que dependendo do seu computador pode ser interessante aumentar para ganhar tempo.<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>Um abraço,<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>Leandro<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><b><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'>De:</span></b><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'> r-br-bounces@listas.c3sl.ufpr.br [mailto:r-br-bounces@listas.c3sl.ufpr.br] <b>Em nome de </b>Roney Fraga<br><b>Enviada em:</b> sexta-feira, 27 de janeiro de 2012 19:50<br><b>Para:</b> R-br<br><b>Assunto:</b> [R-br] Importar Microdados - arquivos .txt sem separação entre as colunas<o:p></o:p></span></p><p class=MsoNormal><o:p> </o:p></p><p class=western style='margin-bottom:0cm;margin-bottom:.0001pt'>Caros,<o:p></o:p></p><p class=western style='margin-bottom:0cm;margin-bottom:.0001pt'>Diante da necessidade de importar microdados, principalmente do IBGE, por meio do pacote IBGEPesq()<i> </i>que vem apresentando alguns problemas, pergunto se algum usuário tem alguma sugestão para importar microdados alternativa ao pacote IBGEPesq().<o:p></o:p></p><p class=western style='margin-bottom:0cm;margin-bottom:.0001pt'>Microdados consiste geralmente em grandes pesquisas que são disponibilizadas em arquivos .txt apenas com números sem nenhuma separação entre as colunas, sendo o arquivo dicionário disponibilizado a parte em outro arquivo .txt, nesse arquivo dicionário consta em que coluna começa e termina cada variável. No link <a href="http://www.datafilehost.com/download-2565fe79.html">http://www.datafilehost.com/download-2565fe79.html</a> segue exemplo do arquivo .txt com os dados da PNAD 2009 banco domicílios. E no link <a href="http://www.datafilehost.com/download-fe9c31a8.html">http://www.datafilehost.com/download-fe9c31a8.html</a> segue exemplos de dicionários para o SAS, disponibilizado pelo IBGE, e para o Stata que fiz com base no dicionário anterior. Se necessário o mesmo dicionário pode ser encontrado no R através dos comandos<o:p></o:p></p><pre><span style='color:blue'>install.packages('dicionariosIBGE')</span><o:p></o:p></pre><pre><span style='color:blue'>library(dicionariosIBGE) <br>data(dicPNAD2009)<br>dicdom2009</span><o:p></o:p></pre><p class=western style='margin-bottom:0cm;margin-bottom:.0001pt'>No Stata uma vez que tenha o dicionário, na extensão .dct, e o arquivo .txt com os dados a serem lidos basta executar o comando <o:p></o:p></p><p class=MsoNormal><span style='font-family:"Courier New";color:blue'>infile using “/Caminho/Arquivo/dicionario.dct”</span><br>no R não sei se é possível seguir o mesmo raciocínio para importar dados em arquivos .txt, caso algum usuário possa contribuir será uma grande ajuda. <o:p></o:p></p><p class=western style='margin-bottom:0cm;margin-bottom:.0001pt'>Os arquivos em .txt geralmente são grandes, por exemplo, a PNAD 2009 arquivo pessoas tem 320MB. Uma vez ultrapassada a dificuldade de importar os dados, será mais fácil utilizar o R para trabalhar com os dados públicos das seguintes pesquisas:<o:p></o:p></p><p class=MsoNormal>PNAD, POF, PME, Enade, Censo Escolar, Censo da Educação Superior, Censo dos Profissionais do Magistério, Saeb, Enem, Provão, PNERA, Prova Brasil, Pesquisa de Ações Discriminatórias no Âmbito Escolar, etc... <o:p></o:p></p><p class=western style='margin-bottom:0cm;margin-bottom:.0001pt'>Atenciosamente<o:p></o:p></p><p class=MsoNormal>Roney <o:p></o:p></p></div></body></html>