Obrigado, mas o arquivo é produzido por terceiros. <div><br></div><div><br></div><div class="gmail_extra"><br><br><div class="gmail_quote">2012/10/31 Fátima Lima Paula <span dir="ltr"><<a href="mailto:fatima.lima.paula@gmail.com" target="_blank">fatima.lima.paula@gmail.com</a>></span><br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><font color="#993399"><font size="4"><font face="comic sans ms,sans-serif">Tente salvar o arquivo em .csv (separado por vírgulas) e leia pelo</font></font></font><div>
<font color="#993399"><font size="4"><font face="comic sans ms,sans-serif">read.csv2.</font></font></font></div>
<div><font color="#993399"><font size="4"><font face="comic sans ms,sans-serif">Acho que vai conseguir.</font></font></font></div><div><font color="#993399"><font size="4"><font face="comic sans ms,sans-serif">Fátima<br>
</font></font></font><br>
<div class="gmail_quote">Em 31 de outubro de 2012 11:22, Roberto de Pinho <span dir="ltr"><<a href="mailto:robertodepinho@gmail.com" target="_blank">robertodepinho@gmail.com</a>></span> escreveu:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div><div class="h5">
Caros, <div><br></div><div>Estou tentando ler o arquivo de servidores disponível no portal da transparência.</div><div><br></div><div>( </div><div><a href="http://arquivos.portaldatransparencia.gov.br/PortalTransparenciaEscolheTipoDePlanilha.asp?origem=Servidores&Planilha=0" target="_blank">http://arquivos.portaldatransparencia.gov.br/PortalTransparenciaEscolheTipoDePlanilha.asp?origem=Servidores&Planilha=0</a> - mais de 200MB) </div>
<div><br></div><div>É um CSV codificado em UTF-16.</div><div><br></div><div>No entanto, ele reconhece prematuramente fins de linhas em algumas linhas quando encontra campos com nulo [00 00]. Há valores não nulos não sendo lidos após campos nulos que provocam o reconhecimento de fim de linha.</div>
<div><br></div><div>Alguém saberia como poderia fazer com que o R possa ler este arquivo?</div><div><br></div><div>Estou lendo o arquivo com:</div><div><br></div><div>servidores = read.table("teste.csv", header = T, sep="\t",quote="",stringsAsFactors=T,fileEncoding="UTF-16", fill=T)<br>
</div><div><br></div><div>o fill=T estou sando para evitar que dê erro de diferente numero de campos. </div><div><br></div><div>Envio, em anexo, um extrato das primeiras linhas do arquivo. </div><div><br></div><div><br></div>
<div>Obrigado pela atenção. </div><div><br></div><div>====</div><div>Sequencia de bytes que provocam o reconhecimento de nova linha:</div><div><br></div><div>09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00<span><font color="#888888"><br>
</font></span></div><span><font color="#888888"><div><br></div><div><br></div><div><br></div><div><br></div><div><br clear="all"><div><br></div>-- <br>Roberto de Pinho<br><a href="mailto:robertodepinho@gmail.com" target="_blank">robertodepinho@gmail.com</a><br>
<a href="http://www.ascoisas.com" target="_blank">http://www.ascoisas.com</a><div>
<a href="http://lattes.cnpq.br/4816166073408660" target="_blank">http://lattes.cnpq.br/4816166073408660</a></div><br>
</div>
</font></span><br></div></div>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br></div>
<br>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br><br clear="all"><div><br></div>-- <br>
Roberto de Pinho<br><a href="mailto:robertodepinho@gmail.com" target="_blank">robertodepinho@gmail.com</a><br><a href="http://www.ascoisas.com" target="_blank">http://www.ascoisas.com</a><div><a href="http://lattes.cnpq.br/4816166073408660" target="_blank">http://lattes.cnpq.br/4816166073408660</a></div>
<br>
</div>