[R-br] [WordCloud] Problema com encoding
Rafael Tieppo
rafaeltieppo em yahoo.com.br
Sexta Fevereiro 9 11:14:56 -02 2018
Ao ler um arquivo tive os seguintes erros:
A <- read.csv("tel.csv", sep = ",")
Error in read.table(file = file, header = header, sep = sep, quote = quote, :
empty beginning of file
In addition: Warning messages:
1: In read.table(file = file, header = header, sep = sep, quote = quote, :
invalid input found on input connection 'tel.csv'
2: In read.table(file = file, header = header, sep = sep, quote = quote, :
line 1 appears to contain embedded nulls
3: In read.table(file = file, header = header, sep = sep, quote = quote, :
incomplete final line found by readTableHeader on 'tel.csv'
Com utf-16 resolveu
A <- read.csv("tel.csv", sep = ",",
fileEncoding="utf-16")
Rafael Tieppo
State University of Mato Grosso - Department of Agricultural Engineering
site: https://rafatieppo.github.io blog: https://fuidebicicleta.wordpress.com"Evite o desperdício: antes de imprimir pense na sua responsabilidade com o ambiente".
On Friday, February 9, 2018, 9:26:34 AM GMT-3, <r-br-request em listas.c3sl.ufpr.br> wrote:
Enviar submissões para a lista de discussão R-br para
r-br em listas.c3sl.ufpr.br
Para se cadastrar ou descadastrar via WWW, visite o endereço
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
ou, via email, envie uma mensagem com a palavra 'help' no assunto ou
corpo da mensagem para
r-br-request em listas.c3sl.ufpr.br
Você poderá entrar em contato com a pessoa que gerencia a lista pelo
endereço
r-br-owner em listas.c3sl.ufpr.br
Quando responder, por favor edite sua linha Assunto assim ela será
mais específica que "Re: Contents of R-br digest..."
Tópicos de Hoje:
1. [WordCloud] Problema com encoding (Max)
----------------------------------------------------------------------
Message: 1
Date: Tue, 26 Sep 2017 22:31:21 -0300
From: Max <max.lara em gmail.com>
To: r-br em listas.c3sl.ufpr.br
Subject: [R-br] [WordCloud] Problema com encoding
Message-ID:
<CAK9SNW2=9j=pc3fYzFnM3ooYhN1eORufRONu-DpqN6jfR-ORhw em mail.gmail.com>
Content-Type: text/plain; charset="utf-8"
Pessoal, boa noite!
Com base em um exemplo pego na internet, tentei fazer uma nuvem de palavras
de um arquivo notepad (peguei uma pequena matéria na internet e salvei, em
.txt, com o nome SaoBento).
O código tem funcionado quase corretamente. O problema é que eu não tenho
tido sucesso em corrigir o *encoding* do texto.
- Tentei usar encoding = "UTF-8" na linha do readlines, mas sem sucesso.
- Também tentei usar enc2native() na última linha do passo 7, mas ocorre
erro argument is not a character vector.
- Salvei o arquivo SaoBento.txt no Notepad++, usando UTF-8 e, também, a
nuvem final acusou problemas de *encoding*.
- Deixei o arquivo SaoBento.txt salvo sozinho em uma pasta e, também, não
tive sucesso em acertar o *encoding*.
Sendo assim, gostaria de saber se alguém poderia fornecer uma dica de como
posso driblar esse problema.
Agradeço pela atenção.
Saudações,
****************************************
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20180209/db4f144e/attachment.html>
Mais detalhes sobre a lista de discussão R-br