Caro Daniel,
#include <stdio.h>
#include <stdlib.h>
int main(int argc, const char * argv[])
{
FILE * inFile;
FILE * outFile;
inFile = fopen("/Users/robertopinho/Downloads/teste.csv", "rb");
outFile = fopen("/Users/robertopinho/Downloads/teste2.csv", "wb");
while(!feof(inFile)){
char c1;
char c2;
c1 = fgetc(inFile);
c2 = fgetc(inFile);
if(c1 == (int)NULL && c2 == (int)NULL){
c1=0x20;
}
fputc(c1,outFile);
fputc(c2,outFile);
}
fclose(outFile);
fclose(inFile);
return 0;
}
Tenta baixar os dados e importar do computador. É quase 1 gb de texto. É praticamente impossível não ter nenhum erro de codificação.Eu fiz assim e deu certo de novo com o arquivo "20120930_Servidores.csv":data1 <- read.delim(file.choose(),header=TRUE,sep="\t", fill=TRUE, fileEncoding = "UTF-16LE")
R version 2.15.1 (2012-06-22) -- "Roasted Marshmallows"Copyright (C) 2012 The R Foundation for Statistical ComputingISBN 3-900051-07-0Platform: x86_64-apple-darwin9.8.0/x86_64 (64-bit)R is free software and comes with ABSOLUTELY NO WARRANTY.You are welcome to redistribute it under certain conditions.Type 'license()' or 'licence()' for distribution details.Natural language support but running in an English localeR is a collaborative project with many contributors.Type 'contributors()' for more information and'citation()' on how to cite R or R packages in publications.Type 'demo()' for some demos, 'help()' for on-line help, or'help.start()' for an HTML browser interface to help.Type 'q()' to quit R.
> data1 <- read.delim(file.choose(),header=TRUE,sep="\t", fill=TRUE, fileEncoding = "UTF-16LE")> head(data1)ID_SERVIDOR_PORTAL NOME CPF1 1493044 AALINE SEVERIANO DA SILVA ***.592.871-**2 1890528 AARAO CARLOS LUZ MACAMBIRA ***.017.623-**3 1762984 AARAO CAVALCANTE DE AMORIM ***.292.777-**4 1920165 AARAO DE ANDRADE LIMA ***.559.144-**5 1611738 AARAO DIAMANTINO OLIVEIRA ***.056.281-**6 1611738 AARAO DIAMANTINO OLIVEIRA ***.056.281-**MATRICULA DESCRICAO_CARGO CLASSE_CARGO1 019****2 016**** BIBLIOTECARIO-DOCUMENTALISTA E3 009**** AGENTE DE SERV DE ENGENHARIA S4 003**** PROFESSOR 3 GRAU V5 000****6 000**** ANALISTA DO BANCO CENTRAL EREFERENCIA_CARGO PADRAO_CARGO NIVEL_CARGO SIGLA_FUNCAO NIVEL_FUNCAO1 NA NA2 NA NA3 NA NA4 NA NA5 NA NA FBC FDT16 NA IV NAFUNCAO CODIGO_ATIVIDADE12345 FUNCAO COMISSIONADA DO BANCO CENTRAL FDT16ATIVIDADE OPCAO_FUNCAO_TOTAL12345 CHEFE DE SUBUNIDADE6UORG_LOTACAO COD_ORG_LOTACAO1 NA2 NA3 NA4 NA5 DEPTO. CONTR. GEST. PLAN. SUPERVISAO 252016 DEPTO. CONTR. GEST. PLAN. SUPERVISAO 25201ORG_LOTACAO COD_ORGSUP_LOTACAO ORGSUP_LOTACAO1 NA2 NA3 NA4 NA5 BANCO CENTRAL DO BRASIL 25201 BANCO CENTRAL DO BRASIL6 BANCO CENTRAL DO BRASIL 25201 BANCO CENTRAL DO BRASILUORG_EXERCICIO COD_ORG_EXERCICIO12345 DEPTO. CONTR. GEST. PLAN. SUPERVISAO 252016 DEPTO. CONTR. GEST. PLAN. SUPERVISAO 25201ORG_EXERCICIO COD_ORGSUP_EXERCICIO12345 BANCO CENTRAL DO BRASIL 252016 BANCO CENTRAL DO BRASIL 25201ORGSUP_EXERCICIO TIPO_VINCULO SITUACAO_VINCULO1 NA2 NA3 NA4 NA5 BANCO CENTRAL DO BRASIL 1 ATIVO PERMANENTE6 BANCO CENTRAL DO BRASIL 2 ATIVO PERMANENTECOD_GRUPO_AFASTAMENTO COD_AFASTAMENTO DATA_INICIO_AFASTAMENTO1 NA2 NA3 NA4 NA5 NA Não informada6 NA Não informadaDATA_TERMINO_AFASTAMENTO REGIME_JURIDICO JORNADA_DE_TRABALHO12345 Não informada REGIME JURIDICO UNICO 40 HORAS SEMANAIS6 Não informada REGIME JURIDICO UNICO 40 HORAS SEMANAISDATA_INGRESSO_CARGOFUNCAO DATA_NOMEACAO_CARGOFUNCAO1 NA2 NA3 NA4 NA5 27/04/2012 NA6 05/01/1998 NADATA_INGRESSO_ORGAO DOCUMENTO_INGRESSO_SERVICOPUBLICO12345 0000000006 000000000DATA_DIPLOMA_INGRESSO_SERVICOPUBLICO DIPLOMA_INGRESSO_CARGOFUNCAO1 NA2 NA3 NA4 NA5 Não informada NA6 Não informada NADIPLOMA_INGRESSO_CARGOFUNCAO.1 DIPLOMA_INGRESSO_SERVICOPUBLICO1234562012/10/31 Jakson Alves de Aquino <jalvesaq@gmail.com>
2012/10/31 Roberto de Pinho <robertodepinho@gmail.com>:
> tbm sem sucesso:Se estiver usando um sistema operacional que tenha o programa sed
>
> ata1 <- read.delim(url,header=TRUE,sep="\t", fill=TRUE, fileEncoding =
> "UTF-16", as.is=T)
> ata1 <- read.delim(url,header=TRUE,sep="\t", fill=TRUE, fileEncoding =
> "UTF-16")
> ata1 <- read.delim(url,header=TRUE,sep="\t", fill=TRUE, fileEncoding =
> "UTF-16LE", as.is=T)
> ata1 <- read.delim(url,header=TRUE,sep="\t", fill=TRUE, fileEncoding =
> "UTF-16LE")
instalado (qualquer distribuição do Linux), uma tentativa pode ser
"limpar" o arquivo, removendo os 0s:
sed -e 's/\x00//g' teste.csv > teste2.csv
sed -e 's/\xff\xfe//' teste2.csv > teste3.csv
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
--
"Small steps toward a much better world"
\begin{signature}
Daniel Marcelino
Land Phone 1+514 343 6111 #3799
3200 Jean Brillant, Office C5071
Montreal, QC; H3T 1N8
Canada
\end{signature}
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.