
sim, estou usando fileEncoding, obrigado. 2012/10/31 Benilton Carvalho <beniltoncarvalho@gmail.com>
Veja os argumentos "encoding" é "fileEncoding" da função.
Num momento livre, dê uma passadinha nas recomendações p a lista e evite enviar arquivos anexados às suas mensagens.
b
-- Sent from a mobile device. Please apologise for brevity, spelling and punctuation. On 31 Oct 2012 13:22, "Roberto de Pinho" <robertodepinho@gmail.com> wrote:
Caros,
Estou tentando ler o arquivo de servidores disponível no portal da transparência.
(
http://arquivos.portaldatransparencia.gov.br/PortalTransparenciaEscolheTipoD... - mais de 200MB)
É um CSV codificado em UTF-16.
No entanto, ele reconhece prematuramente fins de linhas em algumas linhas quando encontra campos com nulo [00 00]. Há valores não nulos não sendo lidos após campos nulos que provocam o reconhecimento de fim de linha.
Alguém saberia como poderia fazer com que o R possa ler este arquivo?
Estou lendo o arquivo com:
servidores = read.table("teste.csv", header = T, sep="\t",quote="",stringsAsFactors=T,fileEncoding="UTF-16", fill=T)
o fill=T estou sando para evitar que dê erro de diferente numero de campos.
Envio, em anexo, um extrato das primeiras linhas do arquivo.
Obrigado pela atenção.
==== Sequencia de bytes que provocam o reconhecimento de nova linha:
09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00
-- Roberto de Pinho robertodepinho@gmail.com http://www.ascoisas.com http://lattes.cnpq.br/4816166073408660
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Roberto de Pinho robertodepinho@gmail.com http://www.ascoisas.com http://lattes.cnpq.br/4816166073408660