[R-br] Problemas com manipulação de dados e arquivos .csv
paulopimenta6 em hotmail.com
paulopimenta6 em hotmail.com
Sexta Agosto 5 18:25:02 BRT 2016
Essa dica da declaração do asterisco na leitura do arquivo foi muito boa. Deu certo e é a série de migração da comunidade chilena desde 1973 mostrou o esperado.
O uso as.numeric() apresenta uma coluna com muitos valores, esta é um adicional do qual irei verificar melhor.
Agradeço a dica!! Vcs são super!!
Abraços.
Obter o Outlook para Android
On Thu, Aug 4, 2016 at 7:07 AM -0300, "Thiago V. dos Santos" <thi_veloso em yahoo.com.br> wrote:
Eu vejo pelo menos um problema nesse arquivo...
A coluna "Values" contem alguns asteriscos (*), que fazem o R a tratar como caracter ao invés de número. Eu suponho que esses asteriscos representem dados não disponíveis (NA), e nesse caso você precisa indicar isso explicitamente no comando de leitura:
dados_2 <- read.csv("teste.csv", header=T, sep=",", na.strings="*")
E então passa a ser possível fazer alguma operação numérica, como o exemplo que você indicou:
> dados_2$Value[1] + 1
[1] 12001
Quanto ao gráfico, o que exatamente você esperava plotar? Os seus dados contém bastante fatores ("categorias"), e quando você manda plotar com o comando que você digitou o R não sabe muito bem o que plotar. Você quer mostrar população emigrada de algum país especifico? Ou o total geral por ano? Acho que antes de plotar os dados você terá que fazer alguma sumarização/agregação nessa tabela de dados.
Hope this helps,
-- Thiago V. dos Santos
PhD student
Land and Atmospheric Science
University of Minnesota
On Thursday, August 4, 2016 1:55 AM, Paulo Henrique Pimenta via R-br <r-br em listas.c3sl.ufpr.br> wrote:
Olá listeiros!
Estou com um problema na manipulação de um .csv e acredito que vcs possam me ajudar. O arquivo (http://www.filedropper.com/teste_3) possui várias colunas que contém informações sobre a imigração da comunidade chilena a partir do ano de 1973 até os anos mais recentes. Ao manipular no R o arquivo não consigo criar um gráfico.
Ao usar um comando como:
####
##
dados_2 <- read.csv("teste.csv", header=T, sep=",")
plot(dados_2$Year[1:100], dados_2$Value[1:100], type="h")
##
####
O gráfico não coloca os valores correspondentes da população emigrada por ano de saída e posteriormente quando feito para a série completa o mesmo erro continuar e ainda parece que os valores vão ser sempre crescentes para os anos após 1990. Ao tentar também manipular um elemento também encontro problemas, por exemplo:
####
##
dados_2$Value[1] + 1 #Um simples teste para mexer com o valor...
#Os erro é:
#Warning message:
#In Ops.factor(dados_2$Value[1], 2) :‘*’ not meaningful for factors
##
####
Espero que vcs possam me ajudar!
Um abraço.
Paulo Henrique de A. S. Pimenta.
Graduando em Meteorologia (Bacharelado) - IAG/USP.
Fone: +5511981318435.
_______________________________________________
R-br mailing list
R-br em listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne� c�igo m�imo reproduz�el.
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20160805/06de6573/attachment.html>
Mais detalhes sobre a lista de discussão R-br