Bom, eu tô usando um Macbook.<div><br></div><div>Tente também UTF-8 e UTF-16LE. Aqui deu certo novamente com UTF-16LE.</div><div><div><br></div><div>
<p class="">data1 <- read.delim(file.choose(),header=TRUE,sep="\t", fill=TRUE, fileEncoding = "UTF-16LE")</p></div><div>
<p class="">data1 <- read.delim(file.choose(),header=TRUE,sep="\t", fill=TRUE, fileEncoding = "UTF-16LE")</p><br><div>
<p class="">head(data1)</p>
<p class=""> ANO MES ID_SERVIDOR_PORTAL CPF</p>
<p class="">1 2012 5 1283851 ***.128.531-**</p>
<p class="">2 2012 5 1725850 ***.014.030-**</p>
<p class="">3 2012 5 2042804 ***.520.808-**</p>
<p class="">4 2012 5 1545949 ***.513.705-**</p>
<p class="">5 2012 5 1849695 ***.449.371-**</p>
<p class="">6 2012 5 1272960 ***.822.991-**</p>
<p class=""> NOME</p>
<p class="">1 ABADIO MENDES FERREIRA </p>
<p class="">2 ABELARDO SCALCO ISQUIERDO </p>
<p class="">3 ADAIL DE ALMEIDA ROLLO </p>
<p class="">4 ADAILTON DOS SANTOS </p>
<p class="">5 ADALBERTO FAZZIO </p>
<p class="">6 ADALIA MARIA SILVA PONTES </p>
<p class=""> OBSERVACAO</p>
<p class="">1 OS VALORES EXTRA-SIAPE NAO ESTAO CONSIDERADOS. ESTA INFORMACAO ESTARA DISPONIVEL ATE 30/AGO/2012</p>
<p class="">2 OS VALORES EXTRA-SIAPE NAO ESTAO CONSIDERADOS. ESTA INFORMACAO ESTARA DISPONIVEL ATE 30/AGO/2012</p>
<p class="">3 OS VALORES EXTRA-SIAPE NAO ESTAO CONSIDERADOS. ESTA INFORMACAO ESTARA DISPONIVEL ATE 30/AGO/2012</p>
<p class="">4 OS VALORES EXTRA-SIAPE NAO ESTAO CONSIDERADOS. ESTA INFORMACAO ESTARA DISPONIVEL ATE 30/AGO/2012</p>
<p class="">5 OS VALORES EXTRA-SIAPE NAO ESTAO CONSIDERADOS. ESTA INFORMACAO ESTARA DISPONIVEL ATE 30/AGO/2012</p>
<p class="">6 OS VALORES EXTRA-SIAPE NAO ESTAO CONSIDERADOS. ESTA INFORMACAO ESTARA DISPONIVEL ATE 30/AGO/2012</p></div></div></div><div class="gmail_extra"><br><br><div class="gmail_quote">2012/10/31 Roberto de Pinho <span dir="ltr"><<a href="mailto:robertodepinho@gmail.com" target="_blank">robertodepinho@gmail.com</a>></span><br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Caro Daniel, <div><br></div><div>obrigado, vou tentar amanhã. </div><div><br></div><div>Acho estranho ter funcionado por conta do encoding, com latin1, eu sempre recebia texto não aproveitável. </div>
<div><br></div><div><br>
</div><div>abs</div><span class="HOEnZb"><font color="#888888"><div>Roberto</div></font></span><div class="HOEnZb"><div class="h5"><div><br></div><div class="gmail_extra"><br><br><div class="gmail_quote">2012/10/31 Daniel Marcelino <span dir="ltr"><<a href="mailto:dmsilva.br@gmail.com" target="_blank">dmsilva.br@gmail.com</a>></span><br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div>Resolvido:</div><div>você precisa acrescentar os seguintes paramentros nos comandos que eu enviei anteriormente:</div>
<div><br></div><div>fileEncoding = "latin1", <a href="http://as.is" target="_blank">as.is</a> = TRUE<br></div>
<div><br></div><div><br></div><div>Você pode também abrir os dados de seu computador assim:</div><div><br></div>data1 <- read.delim(file.choose(),header=TRUE,sep="\t", fill=TRUE, fileEncoding = "latin1", <a href="http://as.is" target="_blank">as.is</a> = TRUE)<div>
<div><div>
<br></div><div><div class="gmail_extra"><br><br><div class="gmail_quote">2012/10/31 Daniel Marcelino <span dir="ltr"><<a href="mailto:dmsilva.br@gmail.com" target="_blank">dmsilva.br@gmail.com</a>></span><br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
<div>E se tudo der certo, </div><div>corte a conexao depois.</div><div><br></div>unlink(temp)<div><div><br><div class="gmail_extra"><br><br><div class="gmail_quote">2012/10/31 Daniel Marcelino <span dir="ltr"><<a href="mailto:dmsilva.br@gmail.com" target="_blank">dmsilva.br@gmail.com</a>></span><br>
<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><div>Tenta assim:</div><div><br></div><div><br></div><div>
temp <- tempfile()</div><div>> download.file("<a href="http://arquivos.portaldatransparencia.gov.br/PortalTransparenciaEscolheTipoDePlanilha.asp?origem=Servidores&Planilha=0" target="_blank">http://arquivos.portaldatransparencia.gov.br/PortalTransparenciaEscolheTipoDePlanilha.asp?origem=Servidores&Planilha=0</a>",temp)</div>
<div>trying URL '<a href="http://arquivos.portaldatransparencia.gov.br/PortalTransparenciaEscolheTipoDePlanilha.asp?origem=Servidores&Planilha=0" target="_blank">http://arquivos.portaldatransparencia.gov.br/PortalTransparenciaEscolheTipoDePlanilha.asp?origem=Servidores&Planilha=0</a>'</div>
<div>Content type 'application/x-zip-compressed' length 284100659 bytes (270.9 Mb)</div><div>opened URL</div><div>===============================================================================</div><div>=====<br>
</div><div>
<p>data1 <- read.delim(unz(temp, "20120930_Servidores.csv"),header=TRUE,sep="\t", fill=TRUE)</p><p>
</p><p>data2 <- read.delim(unz(temp, "20120930_Observacoes_Servidores.csv"),header=TRUE,sep="\t", fill=TRUE)</p><p>
</p><p>data3 <- read.delim(unz(temp, "20120930_Remuneracao_Servidores.csv"),header=TRUE,sep="\t", fill=TRUE)</p><p>
</p><p>data4 <- read.delim(unz(temp, "20120930_Jetom_Servidores.csv"),header=TRUE,sep="\t", fill=TRUE)</p><p><br></p><p>Daniel</p><p></p><p></p><p></p></div><div class="gmail_extra"><div><div>
<br><br><div class="gmail_quote">2012/10/31 Roberto de Pinho <span dir="ltr"><<a href="mailto:robertodepinho@gmail.com" target="_blank">robertodepinho@gmail.com</a>></span><br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
obrigado.<div><div><div><br></div><div class="gmail_extra"><br><br><div class="gmail_quote">2012/10/31 Paulo Justiniano <span dir="ltr"><<a href="mailto:paulojus@leg.ufpr.br" target="_blank">paulojus@leg.ufpr.br</a>></span><br>
<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">O site do leg está em uma rapida manutencao e já retorna<div>
<div><br>
<br>
<br>
On Wed, 31 Oct 2012, Roberto de Pinho wrote:<br>
<br>
<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
o guia foi movido?<br>
<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-<u></u>guia</a><br>
<br>
Not Found<br>
<br>
The requested URL /r-br-guia was not found on this server.<br>
<br>
<br>
<br>
2012/10/31 Walmes Zeviani <<a href="mailto:walmeszeviani@gmail.com" target="_blank">walmeszeviani@gmail.com</a>><br>
Não envie arquivos anexados nas mensagens. Forneça um CMR. Para isso hospede seu arquivo na web ou passe o dput() do mesmo.<br>
Leia o guia de postagem.<br>
<br>
À disposição.<br>
Walmes.<br>
<br>
==============================<u></u>==============================<u></u>==============<br>
Walmes Marques Zeviani<br>
LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W)<br>
Departamento de Estatística - Universidade Federal do Paraná<br>
fone: <a href="tel:%28%2B55%29%2041%203361%203573" value="+554133613573" target="_blank">(+55) 41 3361 3573</a><br>
VoIP: (3361 3600) 1053 1173<br>
e-mail: <a href="mailto:walmes@ufpr.br" target="_blank">walmes@ufpr.br</a><br>
skype: walmeszeviani<br>
twitter: @walmeszeviani<br>
homepage: <a href="http://www.leg.ufpr.br/~walmes" target="_blank">http://www.leg.ufpr.br/~walmes</a><br>
linux user number: 531218<br>
==============================<u></u>==============================<u></u>==============<br>
<br>
<br>
2012/10/31 Fátima Lima Paula <<a href="mailto:fatima.lima.paula@gmail.com" target="_blank">fatima.lima.paula@gmail.com</a>><br>
Tente salvar o arquivo em .csv (separado por vírgulas) e leia peloread.csv2.<br>
Acho que vai conseguir.<br>
Fátima<br>
<br>
Em 31 de outubro de 2012 11:22, Roberto de Pinho <<a href="mailto:robertodepinho@gmail.com" target="_blank">robertodepinho@gmail.com</a>> escreveu:<br>
Caros, <br>
Estou tentando ler o arquivo de servidores disponível no portal da transparência.<br>
<br>
( <br>
<a href="http://arquivos.portaldatransparencia.gov.br/PortalTransparenciaEscolheTipoDePlanilha.asp?origem=Servidores&Planilha=0" target="_blank">http://arquivos.<u></u>portaldatransparencia.gov.br/<u></u>PortalTransparenciaEscolheTipo<u></u>DePlanilha.asp?origem=<u></u>Servidores&Planilha=0</a><br>
- mais de 200MB) <br>
<br>
É um CSV codificado em UTF-16.<br>
<br>
No entanto, ele reconhece prematuramente fins de linhas em algumas linhas quando encontra campos com nulo [00 00]. Há<br>
valores não nulos não sendo lidos após campos nulos que provocam o reconhecimento de fim de linha.<br>
<br>
Alguém saberia como poderia fazer com que o R possa ler este arquivo?<br>
<br>
Estou lendo o arquivo com:<br>
<br>
servidores = read.table("teste.csv", header = T, sep="\t",quote="",<u></u>stringsAsFactors=T,<u></u>fileEncoding="UTF-16", fill=T)<br>
<br>
o fill=T estou sando para evitar que dê erro de diferente numero de campos. <br>
<br>
Envio, em anexo, um extrato das primeiras linhas do arquivo. <br>
<br>
<br>
Obrigado pela atenção. <br>
<br>
====<br>
Sequencia de bytes que provocam o reconhecimento de nova linha:<br>
<br>
09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00<br>
00 09 00 00 00 09 00 00 00 09 00<br>
<br>
<br>
<br>
<br>
<br>
<br>
--<br>
Roberto de Pinho<br>
<a href="mailto:robertodepinho@gmail.com" target="_blank">robertodepinho@gmail.com</a><br>
<a href="http://www.ascoisas.com" target="_blank">http://www.ascoisas.com</a> <a href="http://lattes.cnpq.br/4816166073408660" target="_blank">http://lattes.cnpq.br/<u></u>4816166073408660</a><br>
<br>
<br>
______________________________<u></u>_________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/<u></u>cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-<u></u>guia</a>) e forneça código mínimo reproduzível.<br>
<br>
<br>
<br>
______________________________<u></u>_________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/<u></u>cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-<u></u>guia</a>) e forneça código mínimo reproduzível.<br>
<br>
<br>
<br>
______________________________<u></u>_________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/<u></u>cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-<u></u>guia</a>) e forneça código mínimo reproduzível.<br>
<br>
<br>
<br>
<br>
--<br>
Roberto de Pinho<br>
<a href="mailto:robertodepinho@gmail.com" target="_blank">robertodepinho@gmail.com</a><br>
http://www.ascoisas.comhttp://<a href="http://lattes.cnpq.br/4816166073408660" target="_blank"><u></u>lattes.cnpq.br/<u></u>4816166073408660</a><br>
<br>
<br>
</blockquote>
</div></div><br>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br><br clear="all"><div><br></div>-- <br>
Roberto de Pinho<br><a href="mailto:robertodepinho@gmail.com" target="_blank">robertodepinho@gmail.com</a><br><a href="http://www.ascoisas.com" target="_blank">http://www.ascoisas.com</a><div><a href="http://lattes.cnpq.br/4816166073408660" target="_blank">http://lattes.cnpq.br/4816166073408660</a></div>
<br>
</div>
</div></div><br>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br></div></div></div></blockquote></div>
<br>
</div>
</div></div></blockquote></div><br><br>
</div></div>
</div></div><br>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br><br clear="all"><div><br></div>-- <br>
Roberto de Pinho<br><a href="mailto:robertodepinho@gmail.com" target="_blank">robertodepinho@gmail.com</a><br><a href="http://www.ascoisas.com" target="_blank">http://www.ascoisas.com</a><div><a href="http://lattes.cnpq.br/4816166073408660" target="_blank">http://lattes.cnpq.br/4816166073408660</a></div>
<br>
</div>
</div></div><br>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br><br clear="all"><div><br></div>-- <br>
"Small steps toward a much better world"<br><br>\begin{signature}<br>Daniel Marcelino<br>Land Phone 1+514 343 6111 #3799<br>3200 Jean Brillant, Office C5071<br>Montreal, QC; H3T 1N8<br>Canada<br>\end{signature}<br>
</div>