[R-br] Problemas com manipulação de dados e arquivos .csv

Thiago V. dos Santos thi_veloso em yahoo.com.br
Quinta Agosto 4 06:57:35 BRT 2016


Eu vejo pelo menos um problema nesse arquivo...

A coluna "Values" contem alguns asteriscos (*), que fazem o R a tratar como caracter ao invés de número. Eu suponho que esses asteriscos representem dados não disponíveis (NA), e nesse caso você precisa indicar isso explicitamente no comando de leitura:

dados_2 <- read.csv("teste.csv", header=T, sep=",", na.strings="*")

E então passa a ser possível fazer alguma operação numérica, como o exemplo que você indicou: 

> dados_2$Value[1] + 1
[1] 12001


Quanto ao gráfico, o que exatamente você esperava plotar? Os seus dados contém bastante fatores ("categorias"), e quando você manda plotar com o comando que você digitou o R não sabe muito bem o que plotar. Você quer mostrar população emigrada de algum país especifico? Ou o total geral por ano? Acho que antes de plotar os dados você terá que fazer alguma sumarização/agregação nessa tabela de dados.
Hope this helps,
-- Thiago V. dos Santos

PhD student
Land and Atmospheric Science
University of Minnesota




On Thursday, August 4, 2016 1:55 AM, Paulo Henrique Pimenta via R-br <r-br em listas.c3sl.ufpr.br> wrote:




Olá listeiros!

Estou com um problema na manipulação de um .csv e acredito que vcs possam me ajudar. O arquivo (http://www.filedropper.com/teste_3) possui várias colunas que contém informações sobre a imigração da comunidade chilena a partir do ano de 1973 até os anos mais recentes. Ao manipular no R o arquivo não consigo criar um gráfico.

Ao usar um comando como:

####
##

dados_2 <- read.csv("teste.csv", header=T, sep=",")
plot(dados_2$Year[1:100], dados_2$Value[1:100], type="h") 

##
####

O gráfico não coloca os valores correspondentes da população emigrada por ano de saída e posteriormente quando feito para a série completa o mesmo erro continuar e ainda parece que os valores vão ser sempre crescentes para os anos após 1990.  Ao tentar também manipular um elemento também encontro problemas, por exemplo: 


####
##
dados_2$Value[1] + 1 #Um simples teste para mexer com o valor...  
                                        #Os erro é:
                                         #Warning message:
#In Ops.factor(dados_2$Value[1], 2) :‘*’ not meaningful for factors
##    
####

Espero que vcs possam me ajudar!

Um abraço.

Paulo Henrique de A. S. Pimenta.

Graduando em Meteorologia (Bacharelado) - IAG/USP.
Fone: +5511981318435.
_______________________________________________
R-br mailing list
R-br em listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne� c�igo m�imo reproduz�el.


Mais detalhes sobre a lista de discussão R-br