Problemas com manipulação de dados e arquivos .csv

Olá listeiros! Estou com um problema na manipulação de um .csv e acredito que vcs possam me ajudar. O arquivo (http://www.filedropper.com/teste_3) possui várias colunas que contém informações sobre a imigração da comunidade chilena a partir do ano de 1973 até os anos mais recentes. Ao manipular no R o arquivo não consigo criar um gráfico. Ao usar um comando como: #### ## dados_2 <- read.csv("teste.csv", header=T, sep=",") plot(dados_2$Year[1:100], dados_2$Value[1:100], type="h") ## #### O gráfico não coloca os valores correspondentes da população emigrada por ano de saída e posteriormente quando feito para a série completa o mesmo erro continuar e ainda parece que os valores vão ser sempre crescentes para os anos após 1990. Ao tentar também manipular um elemento também encontro problemas, por exemplo: #### ## dados_2$Value[1] + 1 #Um simples teste para mexer com o valor... #Os erro é: #Warning message: #In Ops.factor(dados_2$Value[1], 2) : ‘*’ not meaningful for factors## #### Espero que vcs possam me ajudar! Um abraço. Paulo Henrique de A. S. Pimenta. Graduando em Meteorologia (Bacharelado) - IAG/USP. Fone: +5511981318435.

Eu vejo pelo menos um problema nesse arquivo... A coluna "Values" contem alguns asteriscos (*), que fazem o R a tratar como caracter ao invés de número. Eu suponho que esses asteriscos representem dados não disponíveis (NA), e nesse caso você precisa indicar isso explicitamente no comando de leitura: dados_2 <- read.csv("teste.csv", header=T, sep=",", na.strings="*") E então passa a ser possível fazer alguma operação numérica, como o exemplo que você indicou:
dados_2$Value[1] + 1 [1] 12001
Quanto ao gráfico, o que exatamente você esperava plotar? Os seus dados contém bastante fatores ("categorias"), e quando você manda plotar com o comando que você digitou o R não sabe muito bem o que plotar. Você quer mostrar população emigrada de algum país especifico? Ou o total geral por ano? Acho que antes de plotar os dados você terá que fazer alguma sumarização/agregação nessa tabela de dados. Hope this helps, -- Thiago V. dos Santos PhD student Land and Atmospheric Science University of Minnesota On Thursday, August 4, 2016 1:55 AM, Paulo Henrique Pimenta via R-br <r-br@listas.c3sl.ufpr.br> wrote: Olá listeiros! Estou com um problema na manipulação de um .csv e acredito que vcs possam me ajudar. O arquivo (http://www.filedropper.com/teste_3) possui várias colunas que contém informações sobre a imigração da comunidade chilena a partir do ano de 1973 até os anos mais recentes. Ao manipular no R o arquivo não consigo criar um gráfico. Ao usar um comando como: #### ## dados_2 <- read.csv("teste.csv", header=T, sep=",") plot(dados_2$Year[1:100], dados_2$Value[1:100], type="h") ## #### O gráfico não coloca os valores correspondentes da população emigrada por ano de saída e posteriormente quando feito para a série completa o mesmo erro continuar e ainda parece que os valores vão ser sempre crescentes para os anos após 1990. Ao tentar também manipular um elemento também encontro problemas, por exemplo: #### ## dados_2$Value[1] + 1 #Um simples teste para mexer com o valor... #Os erro é: #Warning message: #In Ops.factor(dados_2$Value[1], 2) :‘*’ not meaningful for factors ## #### Espero que vcs possam me ajudar! Um abraço. Paulo Henrique de A. S. Pimenta. Graduando em Meteorologia (Bacharelado) - IAG/USP. Fone: +5511981318435. _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne� c�igo m�imo reproduz�el.

Essa dica da declaração do asterisco na leitura do arquivo foi muito boa. Deu certo e é a série de migração da comunidade chilena desde 1973 mostrou o esperado. O uso as.numeric() apresenta uma coluna com muitos valores, esta é um adicional do qual irei verificar melhor. Agradeço a dica!! Vcs são super!! Abraços. Obter o Outlook para Android On Thu, Aug 4, 2016 at 7:07 AM -0300, "Thiago V. dos Santos" <thi_veloso@yahoo.com.br> wrote: Eu vejo pelo menos um problema nesse arquivo... A coluna "Values" contem alguns asteriscos (*), que fazem o R a tratar como caracter ao invés de número. Eu suponho que esses asteriscos representem dados não disponíveis (NA), e nesse caso você precisa indicar isso explicitamente no comando de leitura: dados_2 <- read.csv("teste.csv", header=T, sep=",", na.strings="*") E então passa a ser possível fazer alguma operação numérica, como o exemplo que você indicou:
dados_2$Value[1] + 1 [1] 12001
Quanto ao gráfico, o que exatamente você esperava plotar? Os seus dados contém bastante fatores ("categorias"), e quando você manda plotar com o comando que você digitou o R não sabe muito bem o que plotar. Você quer mostrar população emigrada de algum país especifico? Ou o total geral por ano? Acho que antes de plotar os dados você terá que fazer alguma sumarização/agregação nessa tabela de dados. Hope this helps, -- Thiago V. dos Santos PhD student Land and Atmospheric Science University of Minnesota On Thursday, August 4, 2016 1:55 AM, Paulo Henrique Pimenta via R-br <r-br@listas.c3sl.ufpr.br> wrote: Olá listeiros! Estou com um problema na manipulação de um .csv e acredito que vcs possam me ajudar. O arquivo (http://www.filedropper.com/teste_3) possui várias colunas que contém informações sobre a imigração da comunidade chilena a partir do ano de 1973 até os anos mais recentes. Ao manipular no R o arquivo não consigo criar um gráfico. Ao usar um comando como: #### ## dados_2 <- read.csv("teste.csv", header=T, sep=",") plot(dados_2$Year[1:100], dados_2$Value[1:100], type="h") ## #### O gráfico não coloca os valores correspondentes da população emigrada por ano de saída e posteriormente quando feito para a série completa o mesmo erro continuar e ainda parece que os valores vão ser sempre crescentes para os anos após 1990. Ao tentar também manipular um elemento também encontro problemas, por exemplo: #### ## dados_2$Value[1] + 1 #Um simples teste para mexer com o valor... #Os erro é: #Warning message: #In Ops.factor(dados_2$Value[1], 2) :‘*’ not meaningful for factors ## #### Espero que vcs possam me ajudar! Um abraço. Paulo Henrique de A. S. Pimenta. Graduando em Meteorologia (Bacharelado) - IAG/USP. Fone: +5511981318435. _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne� c�igo m�imo reproduz�el.

Paulo, Procure colocar as.numeric(dados_2$Value[1:100]) At. Jobenil Júnior De: R-br [mailto:r-br-bounces@listas.c3sl.ufpr.br] Em nome de Paulo Henrique Pimenta via R-br Enviada em: quinta-feira, 4 de agosto de 2016 03:55 Para: r-br@listas.c3sl.ufpr.br Assunto: [R-br] Problemas com manipulação de dados e arquivos .csv Olá listeiros! Estou com um problema na manipulação de um .csv e acredito que vcs possam me ajudar. O arquivo (http://www.filedropper.com/teste_3) possui várias colunas que contém informações sobre a imigração da comunidade chilena a partir do ano de 1973 até os anos mais recentes. Ao manipular no R o arquivo não consigo criar um gráfico. Ao usar um comando como: #### ## dados_2 <- read.csv("teste.csv", header=T, sep=",") plot(dados_2$Year[1:100], dados_2$Value[1:100], type="h") ## #### O gráfico não coloca os valores correspondentes da população emigrada por ano de saída e posteriormente quando feito para a série completa o mesmo erro continuar e ainda parece que os valores vão ser sempre crescentes para os anos após 1990. Ao tentar também manipular um elemento também encontro problemas, por exemplo: #### ## dados_2$Value[1] + 1 #Um simples teste para mexer com o valor... #Os erro é: #Warning message: #In Ops.factor(dados_2$Value[1], 2) : * not meaningful for factors ## #### Espero que vcs possam me ajudar! Um abraço. Paulo Henrique de A. S. Pimenta. Graduando em Meteorologia (Bacharelado) - IAG/USP. Fone: +5511981318435.
participantes (4)
-
Jobenil - Gmail
-
Paulo Henrique Pimenta
-
paulopimenta6@hotmail.com
-
Thiago V. dos Santos