<p dir="ltr">8ttgdftfese</p>
<div class="gmail_extra"><br><div class="gmail_quote">Em 02/10/2016 12:00, <<a href="mailto:r-br-request@listas.c3sl.ufpr.br">r-br-request@listas.c3sl.ufpr.br</a>> escreveu:<br type="attribution"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Enviar submissões para a lista de discussão R-br para<br>
<a href="mailto:r-br@listas.c3sl.ufpr.br">r-br@listas.c3sl.ufpr.br</a><br>
<br>
Para se cadastrar ou descadastrar via WWW, visite o endereço<br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" rel="noreferrer" target="_blank">https://listas.inf.ufpr.br/<wbr>cgi-bin/mailman/listinfo/r-br</a><br>
ou, via email, envie uma mensagem com a palavra 'help' no assunto ou<br>
corpo da mensagem para<br>
<a href="mailto:r-br-request@listas.c3sl.ufpr.br">r-br-request@listas.c3sl.ufpr.<wbr>br</a><br>
<br>
Você poderá entrar em contato com a pessoa que gerencia a lista pelo<br>
endereço<br>
<a href="mailto:r-br-owner@listas.c3sl.ufpr.br">r-br-owner@listas.c3sl.ufpr.br</a><br>
<br>
Quando responder, por favor edite sua linha Assunto assim ela será<br>
mais específica que "Re: Contents of R-br digest..."<br>
<br>
<br>
Tópicos de Hoje:<br>
<br>
1. Re: Bando de dado .txt (Andre Oliveira)<br>
<br>
<br>
------------------------------<wbr>------------------------------<wbr>----------<br>
<br>
Message: 1<br>
Date: Sun, 2 Oct 2016 12:03:27 +0000 (UTC)<br>
From: Andre Oliveira <<a href="mailto:andreolsouza@yahoo.com.br">andreolsouza@yahoo.com.br</a>><br>
To: Marcos Silva <<a href="mailto:marcosfs2006@gmail.com">marcosfs2006@gmail.com</a>><br>
Cc: "<a href="mailto:r-br@listas.c3sl.ufpr.br">r-br@listas.c3sl.ufpr.br</a>" <<a href="mailto:r-br@listas.c3sl.ufpr.br">r-br@listas.c3sl.ufpr.br</a>><br>
Subject: Re: [R-br] Bando de dado .txt<br>
Message-ID: <<a href="mailto:1862678262.297135.1475409807537@mail.yahoo.com">1862678262.297135.<wbr>1475409807537@mail.yahoo.com</a>><br>
Content-Type: text/plain; charset="utf-8"<br>
<br>
Oi Marcos,obrigado pelas sugestões. Eu estava indo muito bem com a data.table, tentei library(ff) e library(ffbase), mas sem sucesso.<br>
<br>
André Oliveira Souza. Graduação em Matemática, mestrado em estatística aplicada.Instituto Federal de Educação, Ciência e Tecnologia do Espirito Santo. IFES<br>
<br>
Em Domingo, 2 de Outubro de 2016 9:00, Marcos Silva <<a href="mailto:marcosfs2006@gmail.com">marcosfs2006@gmail.com</a>> escreveu:<br>
<br>
<br>
Dá uma olhada nesse post:<br>
<a href="http://rcoster.blogspot.com.br/2014/02/lendo-grandes-bancos-de-dados.html" rel="noreferrer" target="_blank">http://rcoster.blogspot.com.<wbr>br/2014/02/lendo-grandes-<wbr>bancos-de-dados.html</a><br>
<br>
Em 2 de outubro de 2016 08:36, Marcos Silva <<a href="mailto:marcosfs2006@gmail.com">marcosfs2006@gmail.com</a>> escreveu:<br>
<br>
André,<br>
Este tipo de arquivo não tem um caractere delimitador, tal como virgula, ponto e virgula, pipe ("|"), Você não vai conseguir importar com read.table() e derivações (read.csv(), read.csv2()) ou mesmo com fread().<br>
Mas para vc "ler" esse arquivo, vc precisa saber qual o comprimento de cada variável (quantidade de caracteres que ocupa no arquivo), informação essa que deveria estar no dicionário de variáveis.<br>
<br>
Este tipo de arquivo vc importa com read.fwf() ou read_fwf() do pacote readr. Mas como essa base é muito grande, recomendo utilizar algum pacote, a exemplo do pacote LaF. Existem outras possibilidades talvez melhores.<br>
<br>
<br>
<br>
<br>
<br>
Em 2 de outubro de 2016 03:13, Andre Oliveira <<a href="mailto:andreolsouza@yahoo.com.br">andreolsouza@yahoo.com.br</a>> escreveu:<br>
<br>
Oi Marcos,neste dicionário fala que é formato em formato ASCII. Não tem mais instruções pelo que percebi. Descreve os nomes da varáveis também! André Oliveira Souza. Graduação em Matemática, mestrado em estatística aplicada.Instituto Federal de Educação, Ciência e Tecnologia do Espirito Santo. IFES<br>
<br>
Em Domingo, 2 de Outubro de 2016 0:13, Marcos Silva <<a href="mailto:marcosfs2006@gmail.com">marcosfs2006@gmail.com</a>> escreveu:<br>
<br>
<br>
Acho que este e um arquivo de formato fixo. Vc vai precisar do dicionario de dados para importar. Normalmente este dicionario e disponibilizado com os dados pelo inep.<br>
Em 01/10/2016 22:31, "Andre Oliveira via R-br" <<a href="mailto:r-br@listas.c3sl.ufpr.br">r-br@listas.c3sl.ufpr.br</a>> escreveu:<br>
<br>
Boa noite,não estou conseguindo identificar o motivo de não abrir este arquivo .txt corretamente, ele tem em torno de 6.3 GBAlguém teria uma dica para compartilhar? Acredito que não estou trabalhando corretamente!<br>
<br>
library(data.table)<br>
readLines("DADOS_ENEM_2011. TXT", n = 1)<br>
<br>
[1] "3000000000012011 2803548708SAO BERNARDO DO CAMPO SP110000000000000000000011 . . ...3548708SAO BERNARDO DO CAMPO SP1111 577.10 576.00 575.50 737. 10CEBDCACBEAABBAABAEBDCABDCDEA AADCBBEBADDBEBECDDEECABABEBDDE BAEADCACABCBBECADDAADBADDAABAB CAEEAEAEDDDAAEEBDECADCEABDDBAE CAAABDAEBCCACBAECBAEBECCAAEBAB ECECCDDAACDADADBACCBAADCAECCCE DD1241201251290CECDDACBCAEBEBB ACEEDCAEBDAEDADBEBBDDADCBCBACD DEECEBABAADDEBAECDCACEDCBBEBCD CAADBADDDBAEACAEEDBDBDDCAEDDDA CDEBBECAACDABADBAECCEADDCEBCBA CBAEEBAEEECCEEEBCBECEBADCBDBEA DCDBDCCCBADCAECCCCDDP 140.00 140.00 140.00 140.00 60.00 620.000 . . . <br>
<br>
require(bit64)<br>
enem2011<- fread("DADOS_ENEM_2011.TXT", nrow = 1, header = TRUE, sep=";")<br>
head(enem2011)<br>
<br>
3000000000012011 2803548708SAO BERNARDO DO CAMPO SP110000000000000000000011 . . ...3548708SAO BERNARDO DO CAMPO SP1111 577.10 576.00 575.50 737. 10CEBDCACBEAABBAABAEBDCABDCDEA AADCBBEBADDBEBECDDEECABABEBDDE BAEADCACABCBBECADDAADBADDAABAB CAEEAEAEDDDAAEEBDECADCEABDDBAE CAAABDAEBCCACBAECBAEBECCAAEBAB ECECCDDAACDADADBACCBAADCAECCCE DD1241201251290CECDDACBCAEBEBB ACEEDCAEBDAEDADBEBBDDADCBCBACD DEECEBABAADDEBAECDCACEDCBBEBCD CAADBADDDBAEACAEEDBDBDDCAEDDDA CDEBBECAACDABADBAECCEADDCEBCBA CBAEEBAEEECCEEEBCBECEBADCBDBEA DCDBDCCCBADCAECCCCDDP 140.00 140.00 140.00 140.00 60.00 620.000 . . . ...<br>
1: 3000000000022011 2214125506SAO JOSE DOS PINHAIS PR110000000000000000000011 . . ...4125506SAO JOSE DOS PINHAIS PR0000 . . . . 1211171251290DCEACDBECBCAEBACB EAECEDEDAABDBEDBBDDDCABCBDCAED EBCEAEDBDAACACECDBBCACEDCDCBAE ADADBBDDEAABAEEDBDBDDCAEDDDACD EBBECAACDABADBAECCEADDCEBCBACB AEEBAEEECCEEEBCBECEBADCBDBEADC DBDCCCBADCAECCCCDDF 0.00 0.00 0.00 0.00 0.00 0.000 . . . obrigado.<br>
<br>
<br>
André Oliveira Souza. Graduação em Matemática, mestrado em estatística aplicada.Instituto Federal de Educação, Ciência e Tecnologia do Espirito Santo. IFES<br>
______________________________ _________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/" rel="noreferrer" target="_blank">https://listas.inf.ufpr.br/</a> cgi-bin/mailman/listinfo/r-br<br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-" rel="noreferrer" target="_blank">http://www.leg.ufpr.br/r-br-</a> guia) e forneça código mínimo reproduzível.<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
--<br>
Marcos F. Silva<br>
<a href="http://sites.google.com/site/" rel="noreferrer" target="_blank">http://sites.google.com/site/</a> marcosfs2006<br>
<br>
<br>
<br>
--<br>
Marcos F. Silva<br>
<a href="http://sites.google.com/site/marcosfs2006" rel="noreferrer" target="_blank">http://sites.google.com/site/<wbr>marcosfs2006</a><br>
<br>
<br>
-------------- Próxima Parte ----------<br>
Um anexo em HTML foi limpo...<br>
URL: <<a href="http://listas.inf.ufpr.br/pipermail/r-br/attachments/20161002/24cbb345/attachment-0001.html" rel="noreferrer" target="_blank">http://listas.inf.ufpr.br/<wbr>pipermail/r-br/attachments/<wbr>20161002/24cbb345/attachment-<wbr>0001.html</a>><br>
<br>
------------------------------<br>
<br>
Subject: Legenda do Digest<br>
<br>
______________________________<wbr>_________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" rel="noreferrer" target="_blank">https://listas.inf.ufpr.br/<wbr>cgi-bin/mailman/listinfo/r-br</a><br>
<br>
<br>
------------------------------<br>
<br>
Fim da Digest R-br, volume 70, assunto 3<br>
******************************<wbr>**********<br>
</blockquote></div></div>