[R-br] [WordCloud] Problema com encoding

Rafael Tieppo rafaeltieppo em yahoo.com.br
Sexta Fevereiro 9 11:14:56 -02 2018


Ao ler um arquivo tive os seguintes erros:
A <- read.csv("tel.csv", sep = ",")
Error in read.table(file = file, header = header, sep = sep, quote = quote,  : 
  empty beginning of file
In addition: Warning messages:
1: In read.table(file = file, header = header, sep = sep, quote = quote,  :
  invalid input found on input connection 'tel.csv'
2: In read.table(file = file, header = header, sep = sep, quote = quote,  :
  line 1 appears to contain embedded nulls
3: In read.table(file = file, header = header, sep = sep, quote = quote,  :
  incomplete final line found by readTableHeader on 'tel.csv'
Com utf-16 resolveu
A <- read.csv("tel.csv", sep = ",",
              fileEncoding="utf-16")
Rafael Tieppo
State University of Mato Grosso - Department of Agricultural Engineering 
site: https://rafatieppo.github.io  blog: https://fuidebicicleta.wordpress.com"Evite o desperdício: antes de imprimir pense na sua responsabilidade com o ambiente".  
 

    On Friday, February 9, 2018, 9:26:34 AM GMT-3, <r-br-request em listas.c3sl.ufpr.br> wrote:  
 
 Enviar submissões para a lista de discussão R-br para 
    r-br em listas.c3sl.ufpr.br

Para se cadastrar ou descadastrar via WWW, visite o endereço
    https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
ou, via email, envie uma mensagem com a palavra 'help' no assunto ou
corpo da mensagem para 
    r-br-request em listas.c3sl.ufpr.br

Você poderá entrar em contato com a pessoa que gerencia a lista pelo
endereço
    r-br-owner em listas.c3sl.ufpr.br

Quando responder, por favor edite sua linha Assunto assim ela será
mais específica que "Re: Contents of R-br digest..."


Tópicos de Hoje:

  1. [WordCloud] Problema com encoding (Max)


----------------------------------------------------------------------

Message: 1
Date: Tue, 26 Sep 2017 22:31:21 -0300
From: Max <max.lara em gmail.com>
To: r-br em listas.c3sl.ufpr.br
Subject: [R-br] [WordCloud] Problema com encoding
Message-ID:
    <CAK9SNW2=9j=pc3fYzFnM3ooYhN1eORufRONu-DpqN6jfR-ORhw em mail.gmail.com>
Content-Type: text/plain; charset="utf-8"

Pessoal, boa noite!

Com base em um exemplo pego na internet, tentei fazer uma nuvem de palavras
de um arquivo notepad (peguei uma pequena matéria na internet e salvei, em
.txt, com o nome SaoBento).
O código tem funcionado quase corretamente. O problema é que eu não tenho
tido sucesso em corrigir o *encoding* do texto.

- Tentei usar encoding = "UTF-8" na linha do readlines, mas sem sucesso.
- Também tentei usar enc2native() na última linha do passo 7, mas ocorre
erro argument is not a character vector.
- Salvei o arquivo SaoBento.txt no Notepad++, usando UTF-8 e, também, a
nuvem final acusou problemas de *encoding*.
- Deixei o arquivo SaoBento.txt salvo sozinho em uma pasta e, também, não
tive sucesso em acertar o *encoding*.

Sendo assim, gostaria de saber se alguém poderia fornecer uma dica de como
posso driblar esse problema.

Agradeço pela atenção.

Saudações,
****************************************
  
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20180209/db4f144e/attachment.html>


Mais detalhes sobre a lista de discussão R-br