[R-br] encoding (problema)

Quinta Dezembro 26 22:47:56 BRST 2013

2013/12/26 Edson Lira <edinhoestat em yahoo.com.br>:
> Caros amigos, estou lendo um arquivo em csv originado no odk agregate e não
> consegui qual o formato que usam, latin, UTF-8, …
> Já tentei vários formatos e não consegui.
>
> A rotina que estou usando está abaixo
>
> wj<-read.csv2("pasta/WJ_12_2013.csv",header=T,encoding="macroman")
> wj[wj==""]<-NA
>
> O link para o arquivo em parcial.csv está abaixo:
>
> http://www.datafilehost.com/d/ffb7270f

Baixei e abri o arquivo num editor hexadecimal e o que vi foi que
todas as letras que deveriam estar acentuadas estão com o código 3F,
ou seja, foram substituídas por uma interrogação. Se o arquivo
parcial.csv realmente tiver a mesma codificação do WJ_12_2013.csv,
acho que houve erro na leitura dos dados originais, com perda das
letras acentuadas. O formato do parcial.csv é ASCII:

$ file parcial.csv
parcial.csv: ASCII text, with very long lines, with CR line terminators