Bom, eu tô usando um Macbook.<div><br></div><div>Tente também UTF-8 e UTF-16LE. Aqui deu certo novamente com UTF-16LE.</div><div><div><br></div><div>







<p class="">data1 <- read.delim(file.choose(),header=TRUE,sep="\t",  fill=TRUE, fileEncoding = "UTF-16LE")</p></div><div>







<p class="">data1 <- read.delim(file.choose(),header=TRUE,sep="\t",  fill=TRUE, fileEncoding = "UTF-16LE")</p><br><div>







<p class="">head(data1)</p>
<p class="">   ANO MES ID_SERVIDOR_PORTAL            CPF</p>
<p class="">1 2012   5            1283851 ***.128.531-**</p>
<p class="">2 2012   5            1725850 ***.014.030-**</p>
<p class="">3 2012   5            2042804 ***.520.808-**</p>
<p class="">4 2012   5            1545949 ***.513.705-**</p>
<p class="">5 2012   5            1849695 ***.449.371-**</p>
<p class="">6 2012   5            1272960 ***.822.991-**</p>
<p class="">                                         NOME</p>
<p class="">1   ABADIO MENDES FERREIRA                   </p>
<p class="">2 ABELARDO SCALCO ISQUIERDO                  </p>
<p class="">3   ADAIL DE ALMEIDA ROLLO                   </p>
<p class="">4    ADAILTON DOS SANTOS                     </p>
<p class="">5      ADALBERTO FAZZIO                      </p>
<p class="">6 ADALIA MARIA SILVA PONTES                  </p>
<p class="">                                                                                        OBSERVACAO</p>
<p class="">1 OS VALORES EXTRA-SIAPE NAO ESTAO CONSIDERADOS. ESTA INFORMACAO ESTARA DISPONIVEL ATE 30/AGO/2012</p>
<p class="">2 OS VALORES EXTRA-SIAPE NAO ESTAO CONSIDERADOS. ESTA INFORMACAO ESTARA DISPONIVEL ATE 30/AGO/2012</p>
<p class="">3 OS VALORES EXTRA-SIAPE NAO ESTAO CONSIDERADOS. ESTA INFORMACAO ESTARA DISPONIVEL ATE 30/AGO/2012</p>
<p class="">4 OS VALORES EXTRA-SIAPE NAO ESTAO CONSIDERADOS. ESTA INFORMACAO ESTARA DISPONIVEL ATE 30/AGO/2012</p>
<p class="">5 OS VALORES EXTRA-SIAPE NAO ESTAO CONSIDERADOS. ESTA INFORMACAO ESTARA DISPONIVEL ATE 30/AGO/2012</p>
<p class="">6 OS VALORES EXTRA-SIAPE NAO ESTAO CONSIDERADOS. ESTA INFORMACAO ESTARA DISPONIVEL ATE 30/AGO/2012</p></div></div></div><div class="gmail_extra"><br><br><div class="gmail_quote">2012/10/31 Roberto de Pinho <span dir="ltr"><<a href="mailto:robertodepinho@gmail.com" target="_blank">robertodepinho@gmail.com</a>></span><br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Caro Daniel, <div><br></div><div>obrigado, vou tentar amanhã. </div><div><br></div><div>Acho estranho ter funcionado por conta do encoding, com latin1, eu sempre recebia texto não aproveitável. </div>

<div><br></div><div><br>
</div><div>abs</div><span class="HOEnZb"><font color="#888888"><div>Roberto</div></font></span><div class="HOEnZb"><div class="h5"><div><br></div><div class="gmail_extra"><br><br><div class="gmail_quote">2012/10/31 Daniel Marcelino <span dir="ltr"><<a href="mailto:dmsilva.br@gmail.com" target="_blank">dmsilva.br@gmail.com</a>></span><br>


<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div>Resolvido:</div><div>você precisa acrescentar os seguintes paramentros nos comandos que eu enviei anteriormente:</div>


<div><br></div><div>fileEncoding = "latin1", <a href="http://as.is" target="_blank">as.is</a> = TRUE<br></div>

<div><br></div><div><br></div><div>Você pode também abrir os dados de seu computador assim:</div><div><br></div>data1 <- read.delim(file.choose(),header=TRUE,sep="\t",  fill=TRUE, fileEncoding = "latin1", <a href="http://as.is" target="_blank">as.is</a> = TRUE)<div>


<div><div>

<br></div><div><div class="gmail_extra"><br><br><div class="gmail_quote">2012/10/31 Daniel Marcelino <span dir="ltr"><<a href="mailto:dmsilva.br@gmail.com" target="_blank">dmsilva.br@gmail.com</a>></span><br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">




<div>E se tudo der certo, </div><div>corte a conexao depois.</div><div><br></div>unlink(temp)<div><div><br><div class="gmail_extra"><br><br><div class="gmail_quote">2012/10/31 Daniel Marcelino <span dir="ltr"><<a href="mailto:dmsilva.br@gmail.com" target="_blank">dmsilva.br@gmail.com</a>></span><br>





<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><div>Tenta assim:</div><div><br></div><div><br></div><div>




temp <- tempfile()</div><div>> download.file("<a href="http://arquivos.portaldatransparencia.gov.br/PortalTransparenciaEscolheTipoDePlanilha.asp?origem=Servidores&Planilha=0" target="_blank">http://arquivos.portaldatransparencia.gov.br/PortalTransparenciaEscolheTipoDePlanilha.asp?origem=Servidores&Planilha=0</a>",temp)</div>






<div>trying URL '<a href="http://arquivos.portaldatransparencia.gov.br/PortalTransparenciaEscolheTipoDePlanilha.asp?origem=Servidores&Planilha=0" target="_blank">http://arquivos.portaldatransparencia.gov.br/PortalTransparenciaEscolheTipoDePlanilha.asp?origem=Servidores&Planilha=0</a>'</div>






<div>Content type 'application/x-zip-compressed' length 284100659 bytes (270.9 Mb)</div><div>opened URL</div><div>===============================================================================</div><div>=====<br>






</div><div>







<p>data1 <- read.delim(unz(temp, "20120930_Servidores.csv"),header=TRUE,sep="\t",  fill=TRUE)</p><p>







</p><p>data2 <- read.delim(unz(temp, "20120930_Observacoes_Servidores.csv"),header=TRUE,sep="\t",  fill=TRUE)</p><p>







</p><p>data3 <- read.delim(unz(temp, "20120930_Remuneracao_Servidores.csv"),header=TRUE,sep="\t",  fill=TRUE)</p><p>







</p><p>data4 <- read.delim(unz(temp, "20120930_Jetom_Servidores.csv"),header=TRUE,sep="\t",  fill=TRUE)</p><p><br></p><p>Daniel</p><p></p><p></p><p></p></div><div class="gmail_extra"><div><div>

<br><br><div class="gmail_quote">2012/10/31 Roberto de Pinho <span dir="ltr"><<a href="mailto:robertodepinho@gmail.com" target="_blank">robertodepinho@gmail.com</a>></span><br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">






obrigado.<div><div><div><br></div><div class="gmail_extra"><br><br><div class="gmail_quote">2012/10/31 Paulo Justiniano <span dir="ltr"><<a href="mailto:paulojus@leg.ufpr.br" target="_blank">paulojus@leg.ufpr.br</a>></span><br>







<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">O site do leg está em uma rapida manutencao e já retorna<div>




<div><br>
<br>
<br>
On Wed, 31 Oct 2012, Roberto de Pinho wrote:<br>
<br>
<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
o guia foi movido?<br>
<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-<u></u>guia</a><br>
<br>
                                                               Not Found<br>
<br>
The requested URL /r-br-guia was not found on this server.<br>
<br>
<br>
<br>
2012/10/31 Walmes Zeviani <<a href="mailto:walmeszeviani@gmail.com" target="_blank">walmeszeviani@gmail.com</a>><br>
      Não envie arquivos anexados nas mensagens. Forneça um CMR. Para isso hospede seu arquivo na web ou passe o dput() do mesmo.<br>
      Leia o guia de postagem.<br>
<br>
      À disposição.<br>
      Walmes.<br>
<br>
      ==============================<u></u>==============================<u></u>==============<br>
      Walmes Marques Zeviani<br>
      LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W)<br>
      Departamento de Estatística - Universidade Federal do Paraná<br>
      fone: <a href="tel:%28%2B55%29%2041%203361%203573" value="+554133613573" target="_blank">(+55) 41 3361 3573</a><br>
      VoIP: (3361 3600) 1053 1173<br>
      e-mail: <a href="mailto:walmes@ufpr.br" target="_blank">walmes@ufpr.br</a><br>
      skype: walmeszeviani<br>
      twitter: @walmeszeviani<br>
      homepage: <a href="http://www.leg.ufpr.br/~walmes" target="_blank">http://www.leg.ufpr.br/~walmes</a><br>
      linux user number: 531218<br>
      ==============================<u></u>==============================<u></u>==============<br>
<br>
<br>
      2012/10/31 Fátima Lima Paula <<a href="mailto:fatima.lima.paula@gmail.com" target="_blank">fatima.lima.paula@gmail.com</a>><br>
            Tente salvar o arquivo em .csv (separado por vírgulas) e leia peloread.csv2.<br>
Acho que vai conseguir.<br>
Fátima<br>
<br>
Em 31 de outubro de 2012 11:22, Roberto de Pinho <<a href="mailto:robertodepinho@gmail.com" target="_blank">robertodepinho@gmail.com</a>> escreveu:<br>
      Caros, <br>
Estou tentando ler o arquivo de servidores disponível no portal da transparência.<br>
<br>
( <br>
<a href="http://arquivos.portaldatransparencia.gov.br/PortalTransparenciaEscolheTipoDePlanilha.asp?origem=Servidores&Planilha=0" target="_blank">http://arquivos.<u></u>portaldatransparencia.gov.br/<u></u>PortalTransparenciaEscolheTipo<u></u>DePlanilha.asp?origem=<u></u>Servidores&Planilha=0</a><br>








 - mais de 200MB) <br>
<br>
É um CSV  codificado em UTF-16.<br>
<br>
No entanto, ele reconhece prematuramente fins de linhas em algumas linhas quando encontra campos com nulo [00 00]. Há<br>
valores não nulos não sendo lidos após campos nulos que provocam o reconhecimento de fim de linha.<br>
<br>
Alguém saberia como poderia fazer com que o R possa ler este arquivo?<br>
<br>
Estou lendo o arquivo com:<br>
<br>
servidores = read.table("teste.csv", header = T, sep="\t",quote="",<u></u>stringsAsFactors=T,<u></u>fileEncoding="UTF-16", fill=T)<br>
<br>
o fill=T estou sando para evitar que dê erro de diferente numero de campos. <br>
<br>
Envio, em anexo, um extrato das primeiras linhas do arquivo. <br>
<br>
<br>
Obrigado pela atenção. <br>
<br>
====<br>
Sequencia de bytes que provocam o reconhecimento de nova linha:<br>
<br>
09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00<br>
00 09 00 00 00 09 00 00 00 09 00<br>
<br>
<br>
<br>
<br>
<br>
<br>
--<br>
Roberto de Pinho<br>
<a href="mailto:robertodepinho@gmail.com" target="_blank">robertodepinho@gmail.com</a><br>
<a href="http://www.ascoisas.com" target="_blank">http://www.ascoisas.com</a> <a href="http://lattes.cnpq.br/4816166073408660" target="_blank">http://lattes.cnpq.br/<u></u>4816166073408660</a><br>
<br>
<br>
______________________________<u></u>_________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/<u></u>cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-<u></u>guia</a>) e forneça código mínimo reproduzível.<br>
<br>
<br>
<br>
______________________________<u></u>_________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/<u></u>cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-<u></u>guia</a>) e forneça código mínimo reproduzível.<br>
<br>
<br>
<br>
______________________________<u></u>_________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/<u></u>cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-<u></u>guia</a>) e forneça código mínimo reproduzível.<br>
<br>
<br>
<br>
<br>
--<br>
Roberto de Pinho<br>
<a href="mailto:robertodepinho@gmail.com" target="_blank">robertodepinho@gmail.com</a><br>
http://www.ascoisas.comhttp://<a href="http://lattes.cnpq.br/4816166073408660" target="_blank"><u></u>lattes.cnpq.br/<u></u>4816166073408660</a><br>
<br>
<br>
</blockquote>
</div></div><br>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br><br clear="all"><div><br></div>-- <br>







Roberto de Pinho<br><a href="mailto:robertodepinho@gmail.com" target="_blank">robertodepinho@gmail.com</a><br><a href="http://www.ascoisas.com" target="_blank">http://www.ascoisas.com</a><div><a href="http://lattes.cnpq.br/4816166073408660" target="_blank">http://lattes.cnpq.br/4816166073408660</a></div>







<br>
</div>
</div></div><br>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br></div></div></div></blockquote></div>





<br>
</div>
</div></div></blockquote></div><br><br>
</div></div>
</div></div><br>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br><br clear="all"><div><br></div>-- <br>


Roberto de Pinho<br><a href="mailto:robertodepinho@gmail.com" target="_blank">robertodepinho@gmail.com</a><br><a href="http://www.ascoisas.com" target="_blank">http://www.ascoisas.com</a><div><a href="http://lattes.cnpq.br/4816166073408660" target="_blank">http://lattes.cnpq.br/4816166073408660</a></div>


<br>
</div>
</div></div><br>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br><br clear="all"><div><br></div>-- <br>

"Small steps toward a much better world"<br><br>\begin{signature}<br>Daniel Marcelino<br>Land Phone 1+514 343 6111 #3799<br>3200 Jean Brillant,  Office C5071<br>Montreal, QC; H3T 1N8<br>Canada<br>\end{signature}<br>


</div>