tbm sem sucesso:<div><br></div><div>ata1 <- read.delim(url,header=TRUE,sep="\t", fill=TRUE, fileEncoding = "UTF-16", <a href="http://as.is">as.is</a>=T)</div><div>ata1 <- read.delim(url,header=TRUE,sep="\t", fill=TRUE, fileEncoding = "UTF-16")</div>
<div>ata1 <- read.delim(url,header=TRUE,sep="\t", fill=TRUE, fileEncoding = "UTF-16LE", <a href="http://as.is">as.is</a>=T)</div><div>ata1 <- read.delim(url,header=TRUE,sep="\t", fill=TRUE, fileEncoding = "UTF-16LE")</div>
<div><br></div><div><br><br><div class="gmail_quote">2012/10/31 Roberto de Pinho <span dir="ltr"><<a href="mailto:robertodepinho@gmail.com" target="_blank">robertodepinho@gmail.com</a>></span><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
O erro é somente no "<span style="font-family:arial,sans-serif;font-size:13px">20120930_Servidores.csv"</span><div><span style="font-family:arial,sans-serif;font-size:13px"><br></span></div><div><span style="font-family:arial,sans-serif;font-size:13px">aqui no iMac:</span></div>
<div><span style="font-family:arial,sans-serif;font-size:13px"><br></span></div><div>url = "~/Downloads/teste.csv" # que é o arquivo em "<a href="http://doc-0c-9c-docs.googleusercontent.com/docs/securesc/ha0ro937gcuc7l7deffksulhg5h7mbp1/vpmci49343n9hbakrkf8spssbvdm5bf9/1351706400000/13580050277620078750/*/0B7_ApnYB_M44WnA4UHpOVDZKWjQ?e=download" target="_blank">http://doc-0c-9c-docs.googleusercontent.com/docs/securesc/ha0ro937gcuc7l7deffksulhg5h7mbp1/vpmci49343n9hbakrkf8spssbvdm5bf9/1351706400000/13580050277620078750/*/0B7_ApnYB_M44WnA4UHpOVDZKWjQ?e=download</a>"</div>
<div><br></div><div><br></div><div><div>x = read.delim(url,header=TRUE,sep="\t", fill=TRUE)</div><div><br></div><div>Error in make.names(col.names, unique = TRUE) : </div><div> invalid multibyte string at '<ff><fe>I'</div>
</div><div class="HOEnZb"><div class="h5"><div><br></div><div><br></div><div class="gmail_extra"><br><br><div class="gmail_quote">2012/10/31 Daniel Marcelino <span dir="ltr"><<a href="mailto:dmsilva.br@gmail.com" target="_blank">dmsilva.br@gmail.com</a>></span><br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Bom, eu tô usando um Macbook.<div><br></div><div>Tente também UTF-8 e UTF-16LE. Aqui deu certo novamente com UTF-16LE.</div>
<div><div><br></div><div>
<p>data1 <- read.delim(file.choose(),header=TRUE,sep="\t", fill=TRUE, fileEncoding = "UTF-16LE")</p></div><div>
<p>data1 <- read.delim(file.choose(),header=TRUE,sep="\t", fill=TRUE, fileEncoding = "UTF-16LE")</p><br><div>
<p>head(data1)</p>
<p> ANO MES ID_SERVIDOR_PORTAL CPF</p>
<p>1 2012 5 1283851 ***.128.531-**</p>
<p>2 2012 5 1725850 ***.014.030-**</p>
<p>3 2012 5 2042804 ***.520.808-**</p>
<p>4 2012 5 1545949 ***.513.705-**</p>
<p>5 2012 5 1849695 ***.449.371-**</p>
<p>6 2012 5 1272960 ***.822.991-**</p>
<p> NOME</p>
<p>1 ABADIO MENDES FERREIRA </p>
<p>2 ABELARDO SCALCO ISQUIERDO </p>
<p>3 ADAIL DE ALMEIDA ROLLO </p>
<p>4 ADAILTON DOS SANTOS </p>
<p>5 ADALBERTO FAZZIO </p>
<p>6 ADALIA MARIA SILVA PONTES </p>
<p> OBSERVACAO</p>
<p>1 OS VALORES EXTRA-SIAPE NAO ESTAO CONSIDERADOS. ESTA INFORMACAO ESTARA DISPONIVEL ATE 30/AGO/2012</p>
<p>2 OS VALORES EXTRA-SIAPE NAO ESTAO CONSIDERADOS. ESTA INFORMACAO ESTARA DISPONIVEL ATE 30/AGO/2012</p>
<p>3 OS VALORES EXTRA-SIAPE NAO ESTAO CONSIDERADOS. ESTA INFORMACAO ESTARA DISPONIVEL ATE 30/AGO/2012</p>
<p>4 OS VALORES EXTRA-SIAPE NAO ESTAO CONSIDERADOS. ESTA INFORMACAO ESTARA DISPONIVEL ATE 30/AGO/2012</p>
<p>5 OS VALORES EXTRA-SIAPE NAO ESTAO CONSIDERADOS. ESTA INFORMACAO ESTARA DISPONIVEL ATE 30/AGO/2012</p>
<p>6 OS VALORES EXTRA-SIAPE NAO ESTAO CONSIDERADOS. ESTA INFORMACAO ESTARA DISPONIVEL ATE 30/AGO/2012</p></div></div></div><div class="gmail_extra"><div><div><br><br><div class="gmail_quote">2012/10/31 Roberto de Pinho <span dir="ltr"><<a href="mailto:robertodepinho@gmail.com" target="_blank">robertodepinho@gmail.com</a>></span><br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Caro Daniel, <div><br></div><div>obrigado, vou tentar amanhã. </div><div><br></div><div>Acho estranho ter funcionado por conta do encoding, com latin1, eu sempre recebia texto não aproveitável. </div>
<div><br></div><div><br>
</div><div>abs</div><span><font color="#888888"><div>Roberto</div></font></span><div><div><div><br></div><div class="gmail_extra"><br><br><div class="gmail_quote">2012/10/31 Daniel Marcelino <span dir="ltr"><<a href="mailto:dmsilva.br@gmail.com" target="_blank">dmsilva.br@gmail.com</a>></span><br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div>Resolvido:</div><div>você precisa acrescentar os seguintes paramentros nos comandos que eu enviei anteriormente:</div>
<div><br></div><div>fileEncoding = "latin1", <a href="http://as.is" target="_blank">as.is</a> = TRUE<br></div>
<div><br></div><div><br></div><div>Você pode também abrir os dados de seu computador assim:</div><div><br></div>data1 <- read.delim(file.choose(),header=TRUE,sep="\t", fill=TRUE, fileEncoding = "latin1", <a href="http://as.is" target="_blank">as.is</a> = TRUE)<div>
<div><div>
<br></div><div><div class="gmail_extra"><br><br><div class="gmail_quote">2012/10/31 Daniel Marcelino <span dir="ltr"><<a href="mailto:dmsilva.br@gmail.com" target="_blank">dmsilva.br@gmail.com</a>></span><br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
<div>E se tudo der certo, </div><div>corte a conexao depois.</div><div><br></div>unlink(temp)<div><div><br><div class="gmail_extra"><br><br><div class="gmail_quote">2012/10/31 Daniel Marcelino <span dir="ltr"><<a href="mailto:dmsilva.br@gmail.com" target="_blank">dmsilva.br@gmail.com</a>></span><br>
<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><div>Tenta assim:</div><div><br></div><div><br></div><div>
temp <- tempfile()</div><div>> download.file("<a href="http://arquivos.portaldatransparencia.gov.br/PortalTransparenciaEscolheTipoDePlanilha.asp?origem=Servidores&Planilha=0" target="_blank">http://arquivos.portaldatransparencia.gov.br/PortalTransparenciaEscolheTipoDePlanilha.asp?origem=Servidores&Planilha=0</a>",temp)</div>
<div>trying URL '<a href="http://arquivos.portaldatransparencia.gov.br/PortalTransparenciaEscolheTipoDePlanilha.asp?origem=Servidores&Planilha=0" target="_blank">http://arquivos.portaldatransparencia.gov.br/PortalTransparenciaEscolheTipoDePlanilha.asp?origem=Servidores&Planilha=0</a>'</div>
<div>Content type 'application/x-zip-compressed' length 284100659 bytes (270.9 Mb)</div><div>opened URL</div><div>===============================================================================</div><div>=====<br>
</div><div>
<p>data1 <- read.delim(unz(temp, "20120930_Servidores.csv"),header=TRUE,sep="\t", fill=TRUE)</p><p>
</p><p>data2 <- read.delim(unz(temp, "20120930_Observacoes_Servidores.csv"),header=TRUE,sep="\t", fill=TRUE)</p><p>
</p><p>data3 <- read.delim(unz(temp, "20120930_Remuneracao_Servidores.csv"),header=TRUE,sep="\t", fill=TRUE)</p><p>
</p><p>data4 <- read.delim(unz(temp, "20120930_Jetom_Servidores.csv"),header=TRUE,sep="\t", fill=TRUE)</p><p><br></p><p>Daniel</p><p></p><p></p><p></p></div><div class="gmail_extra"><div><div>
<br><br><div class="gmail_quote">2012/10/31 Roberto de Pinho <span dir="ltr"><<a href="mailto:robertodepinho@gmail.com" target="_blank">robertodepinho@gmail.com</a>></span><br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
obrigado.<div><div><div><br></div><div class="gmail_extra"><br><br><div class="gmail_quote">2012/10/31 Paulo Justiniano <span dir="ltr"><<a href="mailto:paulojus@leg.ufpr.br" target="_blank">paulojus@leg.ufpr.br</a>></span><br>
<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">O site do leg está em uma rapida manutencao e já retorna<div>
<div><br>
<br>
<br>
On Wed, 31 Oct 2012, Roberto de Pinho wrote:<br>
<br>
<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
o guia foi movido?<br>
<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-<u></u>guia</a><br>
<br>
Not Found<br>
<br>
The requested URL /r-br-guia was not found on this server.<br>
<br>
<br>
<br>
2012/10/31 Walmes Zeviani <<a href="mailto:walmeszeviani@gmail.com" target="_blank">walmeszeviani@gmail.com</a>><br>
Não envie arquivos anexados nas mensagens. Forneça um CMR. Para isso hospede seu arquivo na web ou passe o dput() do mesmo.<br>
Leia o guia de postagem.<br>
<br>
À disposição.<br>
Walmes.<br>
<br>
==============================<u></u>==============================<u></u>==============<br>
Walmes Marques Zeviani<br>
LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W)<br>
Departamento de Estatística - Universidade Federal do Paraná<br>
fone: <a href="tel:%28%2B55%29%2041%203361%203573" value="+554133613573" target="_blank">(+55) 41 3361 3573</a><br>
VoIP: (3361 3600) 1053 1173<br>
e-mail: <a href="mailto:walmes@ufpr.br" target="_blank">walmes@ufpr.br</a><br>
skype: walmeszeviani<br>
twitter: @walmeszeviani<br>
homepage: <a href="http://www.leg.ufpr.br/~walmes" target="_blank">http://www.leg.ufpr.br/~walmes</a><br>
linux user number: 531218<br>
==============================<u></u>==============================<u></u>==============<br>
<br>
<br>
2012/10/31 Fátima Lima Paula <<a href="mailto:fatima.lima.paula@gmail.com" target="_blank">fatima.lima.paula@gmail.com</a>><br>
Tente salvar o arquivo em .csv (separado por vírgulas) e leia peloread.csv2.<br>
Acho que vai conseguir.<br>
Fátima<br>
<br>
Em 31 de outubro de 2012 11:22, Roberto de Pinho <<a href="mailto:robertodepinho@gmail.com" target="_blank">robertodepinho@gmail.com</a>> escreveu:<br>
Caros, <br>
Estou tentando ler o arquivo de servidores disponível no portal da transparência.<br>
<br>
( <br>
<a href="http://arquivos.portaldatransparencia.gov.br/PortalTransparenciaEscolheTipoDePlanilha.asp?origem=Servidores&Planilha=0" target="_blank">http://arquivos.<u></u>portaldatransparencia.gov.br/<u></u>PortalTransparenciaEscolheTipo<u></u>DePlanilha.asp?origem=<u></u>Servidores&Planilha=0</a><br>
- mais de 200MB) <br>
<br>
É um CSV codificado em UTF-16.<br>
<br>
No entanto, ele reconhece prematuramente fins de linhas em algumas linhas quando encontra campos com nulo [00 00]. Há<br>
valores não nulos não sendo lidos após campos nulos que provocam o reconhecimento de fim de linha.<br>
<br>
Alguém saberia como poderia fazer com que o R possa ler este arquivo?<br>
<br>
Estou lendo o arquivo com:<br>
<br>
servidores = read.table("teste.csv", header = T, sep="\t",quote="",<u></u>stringsAsFactors=T,<u></u>fileEncoding="UTF-16", fill=T)<br>
<br>
o fill=T estou sando para evitar que dê erro de diferente numero de campos. <br>
<br>
Envio, em anexo, um extrato das primeiras linhas do arquivo. <br>
<br>
<br>
Obrigado pela atenção. <br>
<br>
====<br>
Sequencia de bytes que provocam o reconhecimento de nova linha:<br>
<br>
09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00<br>
00 09 00 00 00 09 00 00 00 09 00<br>
<br>
<br>
<br>
<br>
<br>
<br>
--<br>
Roberto de Pinho<br>
<a href="mailto:robertodepinho@gmail.com" target="_blank">robertodepinho@gmail.com</a><br>
<a href="http://www.ascoisas.com" target="_blank">http://www.ascoisas.com</a> <a href="http://lattes.cnpq.br/4816166073408660" target="_blank">http://lattes.cnpq.br/<u></u>4816166073408660</a><br>
<br>
<br>
______________________________<u></u>_________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/<u></u>cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-<u></u>guia</a>) e forneça código mínimo reproduzível.<br>
<br>
<br>
<br>
______________________________<u></u>_________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/<u></u>cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-<u></u>guia</a>) e forneça código mínimo reproduzível.<br>
<br>
<br>
<br>
______________________________<u></u>_________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/<u></u>cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-<u></u>guia</a>) e forneça código mínimo reproduzível.<br>
<br>
<br>
<br>
<br>
--<br>
Roberto de Pinho<br>
<a href="mailto:robertodepinho@gmail.com" target="_blank">robertodepinho@gmail.com</a><br>
http://www.ascoisas.comhttp://<a href="http://lattes.cnpq.br/4816166073408660" target="_blank"><u></u>lattes.cnpq.br/<u></u>4816166073408660</a><br>
<br>
<br>
</blockquote>
</div></div><br>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br><br clear="all"><div><br></div>-- <br>
Roberto de Pinho<br><a href="mailto:robertodepinho@gmail.com" target="_blank">robertodepinho@gmail.com</a><br><a href="http://www.ascoisas.com" target="_blank">http://www.ascoisas.com</a><div><a href="http://lattes.cnpq.br/4816166073408660" target="_blank">http://lattes.cnpq.br/4816166073408660</a></div>
<br>
</div>
</div></div><br>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br></div></div></div></blockquote></div>
<br>
</div>
</div></div></blockquote></div><br><br>
</div></div>
</div></div><br>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br><br clear="all"><div><br></div>-- <br>
Roberto de Pinho<br><a href="mailto:robertodepinho@gmail.com" target="_blank">robertodepinho@gmail.com</a><br><a href="http://www.ascoisas.com" target="_blank">http://www.ascoisas.com</a><div><a href="http://lattes.cnpq.br/4816166073408660" target="_blank">http://lattes.cnpq.br/4816166073408660</a></div>
<br>
</div>
</div></div><br>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br><br clear="all"><div><br></div>-- <br>
</div></div><div>
"Small steps toward a much better world"<br><br>\begin{signature}<br>Daniel Marcelino<br>Land Phone 1<a href="tel:%2B514%20343%206111%20%233799" value="+5143436111" target="_blank">+514 343 6111 #3799</a><br>3200 Jean Brillant, Office C5071<br>
Montreal, QC; H3T 1N8<br>Canada<br>\end{signature}<br>
</div></div>
<br>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br><br clear="all"><div><br></div>-- <br>
Roberto de Pinho<br><a href="mailto:robertodepinho@gmail.com" target="_blank">robertodepinho@gmail.com</a><br><a href="http://www.ascoisas.com" target="_blank">http://www.ascoisas.com</a><div><a href="http://lattes.cnpq.br/4816166073408660" target="_blank">http://lattes.cnpq.br/4816166073408660</a></div>
<br>
</div>
</div></div></blockquote></div><br><br clear="all"><div><br></div>-- <br>Roberto de Pinho<br><a href="mailto:robertodepinho@gmail.com" target="_blank">robertodepinho@gmail.com</a><br><a href="http://www.ascoisas.com" target="_blank">http://www.ascoisas.com</a><div>
<a href="http://lattes.cnpq.br/4816166073408660" target="_blank">http://lattes.cnpq.br/4816166073408660</a></div><br>
</div>