[R-br] Problemas com manipulação de dados e arquivos .csv

paulopimenta6 em hotmail.com paulopimenta6 em hotmail.com
Sexta Agosto 5 18:25:02 BRT 2016



Essa dica da declaração do asterisco na leitura do arquivo foi muito boa. Deu certo e é a série de migração da comunidade chilena desde 1973 mostrou o esperado.


O uso as.numeric() apresenta uma coluna com muitos valores, esta é um adicional do qual irei verificar melhor.


Agradeço a dica!!  Vcs são super!!


Abraços.


Obter o Outlook para Android






On Thu, Aug 4, 2016 at 7:07 AM -0300, "Thiago V. dos Santos" <thi_veloso em yahoo.com.br> wrote:





Eu vejo pelo menos um problema nesse arquivo...

A coluna "Values" contem alguns asteriscos (*), que fazem o R a tratar como caracter ao invés de número. Eu suponho que esses asteriscos representem dados não disponíveis (NA), e nesse caso você precisa indicar isso explicitamente no comando de leitura:

dados_2 <- read.csv("teste.csv", header=T, sep=",", na.strings="*")

E então passa a ser possível fazer alguma operação numérica, como o exemplo que você indicou:

> dados_2$Value[1] + 1
[1] 12001


Quanto ao gráfico, o que exatamente você esperava plotar? Os seus dados contém bastante fatores ("categorias"), e quando você manda plotar com o comando que você digitou o R não sabe muito bem o que plotar. Você quer mostrar população emigrada de algum país especifico? Ou o total geral por ano? Acho que antes de plotar os dados você terá que fazer alguma sumarização/agregação nessa tabela de dados.
Hope this helps,
-- Thiago V. dos Santos

PhD student
Land and Atmospheric Science
University of Minnesota




On Thursday, August 4, 2016 1:55 AM, Paulo Henrique Pimenta via R-br <r-br em listas.c3sl.ufpr.br> wrote:




Olá listeiros!

Estou com um problema na manipulação de um .csv e acredito que vcs possam me ajudar. O arquivo (http://www.filedropper.com/teste_3) possui várias colunas que contém informações sobre a imigração da comunidade chilena a partir do ano de 1973 até os anos mais recentes. Ao manipular no R o arquivo não consigo criar um gráfico.

Ao usar um comando como:

####
##

dados_2 <- read.csv("teste.csv", header=T, sep=",")
plot(dados_2$Year[1:100], dados_2$Value[1:100], type="h")

##
####

O gráfico não coloca os valores correspondentes da população emigrada por ano de saída e posteriormente quando feito para a série completa o mesmo erro continuar e ainda parece que os valores vão ser sempre crescentes para os anos após 1990.  Ao tentar também manipular um elemento também encontro problemas, por exemplo:


####
##
dados_2$Value[1] + 1 #Um simples teste para mexer com o valor...
                                        #Os erro é:
                                         #Warning message:
#In Ops.factor(dados_2$Value[1], 2) :‘*’ not meaningful for factors
##
####

Espero que vcs possam me ajudar!

Um abraço.

Paulo Henrique de A. S. Pimenta.

Graduando em Meteorologia (Bacharelado) - IAG/USP.
Fone: +5511981318435.
_______________________________________________
R-br mailing list
R-br em listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne� c�igo m�imo reproduz�el.
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20160805/06de6573/attachment.html>


Mais detalhes sobre a lista de discussão R-br