[R-br] encoding (problema)

Edson Lira edinhoestat em yahoo.com.br
Sexta Dezembro 27 11:23:44 BRST 2013


Valeu Jackson, acho que o problema está no ODK Agregate no momento da geração do banco em csv. Mandei um email para o suporte, espero que me respondam.


 [  ]'s.

Edson Lira
Estatístico
Manaus-Amazonas



Em Quinta-feira, 26 de Dezembro de 2013 20:47, Jakson Alves de Aquino <jalvesaq em gmail.com> escreveu:
 
2013/12/26 Edson Lira <edinhoestat em yahoo.com.br>:

> Caros amigos, estou lendo um arquivo em csv originado no odk agregate e não
> consegui qual o formato que usam, latin, UTF-8, …
> Já tentei vários formatos e não consegui.
>
> A rotina que estou usando está abaixo
>
> wj<-read.csv2("pasta/WJ_12_2013.csv",header=T,encoding="macroman")
> wj[wj==""]<-NA
>
> O link para o arquivo em parcial.csv está abaixo:
>
> http://www.datafilehost.com/d/ffb7270f

Baixei e abri o arquivo num editor hexadecimal e o que vi foi que
todas as letras que deveriam estar acentuadas estão com o código 3F,
ou seja, foram substituídas por uma interrogação. Se o arquivo
parcial.csv realmente tiver a mesma codificação do WJ_12_2013.csv,
acho que houve erro na leitura dos dados originais, com perda das
letras acentuadas. O formato do parcial.csv é ASCII:

$ file parcial.csv
parcial.csv: ASCII text, with very long lines, with CR line terminators
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20131227/f13d7fd3/attachment.html>


Mais detalhes sobre a lista de discussão R-br