Re: [R-br] mudar de decimal para inteiro

Acabei de descobrir que quando eu leio o banco esse número "perde o final". É um código. Ele tem os primeiros dígitos depois vem vários zeros e depois mais alguns dígitos. Estou em desespero. Perdi horas e horas de trabalho. Vi que é um problema de importação do banco. Nunca havia trabalhado com bancos grandes. Quando eu peguei o banco, ele veio em txt. Deve ter sido na hora que fui abrir no excel. Alguém pode me dar uma luz em relação a isso? Tenho um banco em txt, separado por ponto e vírgula, sem "header". Como é a melhor forma de trabalhar esse banco no R? Obrigada Em 19 de abril de 2013 18:21, Leandro Marino < leandromarino@leandromarino.com.br> escreveu:
Em um número deste tamanho consideraria transformar para character. Fatalmente é um código de município.
Já tive problemas em números inteiros largos na hora de fazer o merge uma vez que eles são interpretados como pontos flutuantes....
Tive dois números que apesar de serem diferentes na hora do merge eram juntados.... Em 19/04/2013 17:24, "Fátima Lima Paula" <fatima.lima.paula@gmail.com> escreveu:
Prezados meus números estão aparecendo dessa forma: 3.31000e+12 Como faço para que fique 3310008457687 Alguém pode me ajudar, por favor? Obrigada
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Se você puder dar mais informações sobre o banco e o que quer dizer essa variável, pode ajudar. abç M 2013/4/19 Fátima Lima Paula <fatima.lima.paula@gmail.com>
Acabei de descobrir que quando eu leio o banco esse número "perde o final". É um código. Ele tem os primeiros dígitos depois vem vários zeros e depois mais alguns dígitos. Estou em desespero. Perdi horas e horas de trabalho. Vi que é um problema de importação do banco. Nunca havia trabalhado com bancos grandes. Quando eu peguei o banco, ele veio em txt. Deve ter sido na hora que fui abrir no excel. Alguém pode me dar uma luz em relação a isso? Tenho um banco em txt, separado por ponto e vírgula, sem "header". Como é a melhor forma de trabalhar esse banco no R? Obrigada
Em 19 de abril de 2013 18:21, Leandro Marino < leandromarino@leandromarino.com.br> escreveu:
Em um número deste tamanho consideraria transformar para character.
Fatalmente é um código de município.
Já tive problemas em números inteiros largos na hora de fazer o merge uma vez que eles são interpretados como pontos flutuantes....
Tive dois números que apesar de serem diferentes na hora do merge eram juntados.... Em 19/04/2013 17:24, "Fátima Lima Paula" <fatima.lima.paula@gmail.com> escreveu:
Prezados meus números estão aparecendo dessa forma: 3.31000e+12 Como faço para que fique 3310008457687 Alguém pode me ajudar, por favor? Obrigada
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Manoel Galdino https://sites.google.com/site/galdinomcz/

Pessoal, acho que resolvi. Quando salvo o txt em csv, preciso dizer que a coluna desse sódigo é número e não geral. Assim parece que deu certo. Obrigada a todos. Em 19 de abril de 2013 19:30, Manoel Galdino <mcz.fea@gmail.com> escreveu:
Se você puder dar mais informações sobre o banco e o que quer dizer essa variável, pode ajudar.
abç M
2013/4/19 Fátima Lima Paula <fatima.lima.paula@gmail.com>
Acabei de descobrir que quando eu leio o banco esse número "perde o final". É um código. Ele tem os primeiros dígitos depois vem vários zeros e depois mais alguns dígitos. Estou em desespero. Perdi horas e horas de trabalho. Vi que é um problema de importação do banco. Nunca havia trabalhado com bancos grandes. Quando eu peguei o banco, ele veio em txt. Deve ter sido na hora que fui abrir no excel. Alguém pode me dar uma luz em relação a isso? Tenho um banco em txt, separado por ponto e vírgula, sem "header". Como é a melhor forma de trabalhar esse banco no R? Obrigada
Em 19 de abril de 2013 18:21, Leandro Marino < leandromarino@leandromarino.com.br> escreveu:
Em um número deste tamanho consideraria transformar para character.
Fatalmente é um código de município.
Já tive problemas em números inteiros largos na hora de fazer o merge uma vez que eles são interpretados como pontos flutuantes....
Tive dois números que apesar de serem diferentes na hora do merge eram juntados.... Em 19/04/2013 17:24, "Fátima Lima Paula" <fatima.lima.paula@gmail.com> escreveu:
Prezados meus números estão aparecendo dessa forma: 3.31000e+12 Como faço para que fique 3310008457687 Alguém pode me ajudar, por favor? Obrigada
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Manoel Galdino https://sites.google.com/site/galdinomcz/
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

En se tratando de uma variável ID, eu manteria ela como factor ou character, evitando assim o problema de encolhimento como já dito. 2013/4/19 Fátima Lima Paula <fatima.lima.paula@gmail.com>
Pessoal, acho que resolvi. Quando salvo o txt em csv, preciso dizer que a coluna desse sódigo é número e não geral. Assim parece que deu certo. Obrigada a todos.
Em 19 de abril de 2013 19:30, Manoel Galdino <mcz.fea@gmail.com> escreveu:
Se você puder dar mais informações sobre o banco e o que quer dizer essa
variável, pode ajudar.
abç M
2013/4/19 Fátima Lima Paula <fatima.lima.paula@gmail.com>
Acabei de descobrir que quando eu leio o banco esse número "perde o final". É um código. Ele tem os primeiros dígitos depois vem vários zeros e depois mais alguns dígitos. Estou em desespero. Perdi horas e horas de trabalho. Vi que é um problema de importação do banco. Nunca havia trabalhado com bancos grandes. Quando eu peguei o banco, ele veio em txt. Deve ter sido na hora que fui abrir no excel. Alguém pode me dar uma luz em relação a isso? Tenho um banco em txt, separado por ponto e vírgula, sem "header". Como é a melhor forma de trabalhar esse banco no R? Obrigada
Em 19 de abril de 2013 18:21, Leandro Marino < leandromarino@leandromarino.com.br> escreveu:
Em um número deste tamanho consideraria transformar para character.
Fatalmente é um código de município.
Já tive problemas em números inteiros largos na hora de fazer o merge uma vez que eles são interpretados como pontos flutuantes....
Tive dois números que apesar de serem diferentes na hora do merge eram juntados.... Em 19/04/2013 17:24, "Fátima Lima Paula" <fatima.lima.paula@gmail.com> escreveu:
Prezados meus números estão aparecendo dessa forma: 3.31000e+12 Como faço para que fique 3310008457687 Alguém pode me ajudar, por favor? Obrigada
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Manoel Galdino https://sites.google.com/site/galdinomcz/
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- \begin{signature} Daniel Marcelino ☁ dm.silva@umontreal.ca ☎ (514) 343 6111 #3799 Skype: d.marcelino ✎ 3200 Jean Brillant, Office C5071 Montreal, QC; H3T 1N8 Canada \end{signature} "Small steps toward a much better world"

Pessoal, tentei abrir com o pacote xlsx. Deu erro:
data=read.xlsx("sih2008.xlsx",1) Erro em .jcall("RJavaTools", "Ljava/lang/Object;", "invokeMethod", cl, : java.lang.OutOfMemoryError: Java heap space
Em 20 de abril de 2013 00:28, Daniel Marcelino <dmarcelino@live.com>escreveu:
En se tratando de uma variável ID, eu manteria ela como factor ou character, evitando assim o problema de encolhimento como já dito.
2013/4/19 Fátima Lima Paula <fatima.lima.paula@gmail.com>
Pessoal, acho que resolvi. Quando salvo o txt em csv, preciso dizer que a coluna desse sódigo é número e não geral. Assim parece que deu certo. Obrigada a todos.
Em 19 de abril de 2013 19:30, Manoel Galdino <mcz.fea@gmail.com>escreveu:
Se você puder dar mais informações sobre o banco e o que quer dizer essa
variável, pode ajudar.
abç M
2013/4/19 Fátima Lima Paula <fatima.lima.paula@gmail.com>
Acabei de descobrir que quando eu leio o banco esse número "perde o final". É um código. Ele tem os primeiros dígitos depois vem vários zeros e depois mais alguns dígitos. Estou em desespero. Perdi horas e horas de trabalho. Vi que é um problema de importação do banco. Nunca havia trabalhado com bancos grandes. Quando eu peguei o banco, ele veio em txt. Deve ter sido na hora que fui abrir no excel. Alguém pode me dar uma luz em relação a isso? Tenho um banco em txt, separado por ponto e vírgula, sem "header". Como é a melhor forma de trabalhar esse banco no R? Obrigada
Em 19 de abril de 2013 18:21, Leandro Marino < leandromarino@leandromarino.com.br> escreveu:
Em um número deste tamanho consideraria transformar para character.
Fatalmente é um código de município.
Já tive problemas em números inteiros largos na hora de fazer o merge uma vez que eles são interpretados como pontos flutuantes....
Tive dois números que apesar de serem diferentes na hora do merge eram juntados.... Em 19/04/2013 17:24, "Fátima Lima Paula" <fatima.lima.paula@gmail.com> escreveu:
Prezados meus números estão aparecendo dessa forma: 3.31000e+12 Como faço para que fique 3310008457687 Alguém pode me ajudar, por favor? Obrigada
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Manoel Galdino https://sites.google.com/site/galdinomcz/
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- \begin{signature} Daniel Marcelino ☁ dm.silva@umontreal.ca ☎ (514) 343 6111 #3799 Skype: d.marcelino ✎ 3200 Jean Brillant, Office C5071 Montreal, QC; H3T 1N8 Canada \end{signature}
"Small steps toward a much better world"
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

é problema da memória virtual do java. Tem que setar a memória virtual do java. Tive esse problema uns tempos atrás, mas não lembro como fiz (e foi em linux, não windows). Mas não deveria ser necessário ler direto do excel. Tente salvar o arquivo como txt ao invés de csv. E quando usar read.table, use o argumento colclasses. Sete tudo para character e aí, depois no R, você converte pra numeric se necessário. Lembrabndo que um número 3.05e12 é só uma forma de imprimir na tela. Na memória o número está salvo corretamente. Mas a questão principal é: quantos algarismos têm seus números e que operações você precisa fazer nele? Sem isso e um exemplo reproduzível fica difícil ajudar. abç M 2013/4/20 Fátima Lima Paula <fatima.lima.paula@gmail.com>
Pessoal, tentei abrir com o pacote xlsx. Deu erro:
data=read.xlsx("sih2008.xlsx",1) Erro em .jcall("RJavaTools", "Ljava/lang/Object;", "invokeMethod", cl, : java.lang.OutOfMemoryError: Java heap space
Em 20 de abril de 2013 00:28, Daniel Marcelino <dmarcelino@live.com>escreveu:
En se tratando de uma variável ID, eu manteria ela como factor ou
character, evitando assim o problema de encolhimento como já dito.
2013/4/19 Fátima Lima Paula <fatima.lima.paula@gmail.com>
Pessoal, acho que resolvi. Quando salvo o txt em csv, preciso dizer que a coluna desse sódigo é número e não geral. Assim parece que deu certo. Obrigada a todos.
Em 19 de abril de 2013 19:30, Manoel Galdino <mcz.fea@gmail.com>escreveu:
Se você puder dar mais informações sobre o banco e o que quer dizer essa
variável, pode ajudar.
abç M
2013/4/19 Fátima Lima Paula <fatima.lima.paula@gmail.com>
Acabei de descobrir que quando eu leio o banco esse número "perde o final". É um código. Ele tem os primeiros dígitos depois vem vários zeros e depois mais alguns dígitos. Estou em desespero. Perdi horas e horas de trabalho. Vi que é um problema de importação do banco. Nunca havia trabalhado com bancos grandes. Quando eu peguei o banco, ele veio em txt. Deve ter sido na hora que fui abrir no excel. Alguém pode me dar uma luz em relação a isso? Tenho um banco em txt, separado por ponto e vírgula, sem "header". Como é a melhor forma de trabalhar esse banco no R? Obrigada
Em 19 de abril de 2013 18:21, Leandro Marino < leandromarino@leandromarino.com.br> escreveu:
Em um número deste tamanho consideraria transformar para character.
Fatalmente é um código de município.
Já tive problemas em números inteiros largos na hora de fazer o merge uma vez que eles são interpretados como pontos flutuantes....
Tive dois números que apesar de serem diferentes na hora do merge eram juntados.... Em 19/04/2013 17:24, "Fátima Lima Paula" <fatima.lima.paula@gmail.com> escreveu:
> Prezados meus números estão aparecendo dessa forma: > 3.31000e+12 > Como faço para que fique > 3310008457687 > Alguém pode me ajudar, por favor? > Obrigada > > _______________________________________________ > R-br mailing list > R-br@listas.c3sl.ufpr.br > https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br > Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e > forneça código mínimo reproduzível. >
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Manoel Galdino https://sites.google.com/site/galdinomcz/
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- \begin{signature} Daniel Marcelino ☁ dm.silva@umontreal.ca ☎ (514) 343 6111 #3799 Skype: d.marcelino ✎ 3200 Jean Brillant, Office C5071 Montreal, QC; H3T 1N8 Canada \end{signature}
"Small steps toward a much better world"
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Manoel Galdino https://sites.google.com/site/galdinomcz/

De fato, existe uma limitação da memória, se sua planilha for muito grande o java não conseguira concluir a leitura. A dica do Manoel é a mais sensata e vai evitar todos esses problemas de leitura e etc. Tudo o que você precisa criar é um workflow de como abrir e salvar os seus dados no R. Abaixo vou postar uma solução, mas isso vai depender da sua máquina:
options(java.parameters = "-Xmx1000m")
Você também pode usar gc() depois de cada leitura, casa há várias. Daniel 2013/4/20 Manoel Galdino <mcz.fea@gmail.com>
é problema da memória virtual do java. Tem que setar a memória virtual do java. Tive esse problema uns tempos atrás, mas não lembro como fiz (e foi em linux, não windows).
Mas não deveria ser necessário ler direto do excel. Tente salvar o arquivo como txt ao invés de csv. E quando usar read.table, use o argumento colclasses. Sete tudo para character e aí, depois no R, você converte pra numeric se necessário. Lembrabndo que um número 3.05e12 é só uma forma de imprimir na tela. Na memória o número está salvo corretamente.
Mas a questão principal é: quantos algarismos têm seus números e que operações você precisa fazer nele?
Sem isso e um exemplo reproduzível fica difícil ajudar. abç M
2013/4/20 Fátima Lima Paula <fatima.lima.paula@gmail.com>
Pessoal, tentei abrir com o pacote xlsx. Deu erro:
data=read.xlsx("sih2008.xlsx",1) Erro em .jcall("RJavaTools", "Ljava/lang/Object;", "invokeMethod", cl, : java.lang.OutOfMemoryError: Java heap space
Em 20 de abril de 2013 00:28, Daniel Marcelino <dmarcelino@live.com>escreveu:
En se tratando de uma variável ID, eu manteria ela como factor ou
character, evitando assim o problema de encolhimento como já dito.
2013/4/19 Fátima Lima Paula <fatima.lima.paula@gmail.com>
Pessoal, acho que resolvi. Quando salvo o txt em csv, preciso dizer que a coluna desse sódigo é número e não geral. Assim parece que deu certo. Obrigada a todos.
Em 19 de abril de 2013 19:30, Manoel Galdino <mcz.fea@gmail.com>escreveu:
Se você puder dar mais informações sobre o banco e o que quer dizer
essa variável, pode ajudar.
abç M
2013/4/19 Fátima Lima Paula <fatima.lima.paula@gmail.com>
Acabei de descobrir que quando eu leio o banco esse número "perde o final". É um código. Ele tem os primeiros dígitos depois vem vários zeros e depois mais alguns dígitos. Estou em desespero. Perdi horas e horas de trabalho. Vi que é um problema de importação do banco. Nunca havia trabalhado com bancos grandes. Quando eu peguei o banco, ele veio em txt. Deve ter sido na hora que fui abrir no excel. Alguém pode me dar uma luz em relação a isso? Tenho um banco em txt, separado por ponto e vírgula, sem "header". Como é a melhor forma de trabalhar esse banco no R? Obrigada
Em 19 de abril de 2013 18:21, Leandro Marino < leandromarino@leandromarino.com.br> escreveu:
Em um número deste tamanho consideraria transformar para character. > Fatalmente é um código de município. > > Já tive problemas em números inteiros largos na hora de fazer o > merge uma vez que eles são interpretados como pontos flutuantes.... > > Tive dois números que apesar de serem diferentes na hora do merge > eram juntados.... > Em 19/04/2013 17:24, "Fátima Lima Paula" < > fatima.lima.paula@gmail.com> escreveu: > >> Prezados meus números estão aparecendo dessa forma: >> 3.31000e+12 >> Como faço para que fique >> 3310008457687 >> Alguém pode me ajudar, por favor? >> Obrigada >> >> _______________________________________________ >> R-br mailing list >> R-br@listas.c3sl.ufpr.br >> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br >> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e >> forneça código mínimo reproduzível. >> > > _______________________________________________ > R-br mailing list > R-br@listas.c3sl.ufpr.br > https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br > Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e > forneça código mínimo reproduzível. >
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Manoel Galdino https://sites.google.com/site/galdinomcz/
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- \begin{signature} Daniel Marcelino ☁ dm.silva@umontreal.ca ☎ (514) 343 6111 #3799 Skype: d.marcelino ✎ 3200 Jean Brillant, Office C5071 Montreal, QC; H3T 1N8 Canada \end{signature}
"Small steps toward a much better world"
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Manoel Galdino https://sites.google.com/site/galdinomcz/
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- \begin{signature} Daniel Marcelino ☁ dm.silva@umontreal.ca ☎ (514) 343 6111 #3799 Skype: d.marcelino ✎ 3200 Jean Brillant, Office C5071 Montreal, QC; H3T 1N8 Canada \end{signature} "Small steps toward a much better world"

Pessoal, acho que contornei o problema. Quando eu importo o txt em xlsx e só depois passo para o csv aparentemente fica tudo ok. Salvei a coluna do código como texto e quando abro no R, salvo como factor como o Daniel me sugeriu. Vou tentar levar assim. Do jeito que estão as coisas por aqui não vou defender nunca. Muito obrigada a todos. Sem vocês minha tese iria para o lodo. Abs Fátima Em 20 de abril de 2013 14:08, Daniel Marcelino <dmarcelino@live.com>escreveu:
De fato, existe uma limitação da memória, se sua planilha for muito grande o java não conseguira concluir a leitura. A dica do Manoel é a mais sensata e vai evitar todos esses problemas de leitura e etc. Tudo o que você precisa criar é um workflow de como abrir e salvar os seus dados no R.
Abaixo vou postar uma solução, mas isso vai depender da sua máquina:
options(java.parameters = "-Xmx1000m")
Você também pode usar gc() depois de cada leitura, casa há várias.
Daniel
2013/4/20 Manoel Galdino <mcz.fea@gmail.com>
é problema da memória virtual do java. Tem que setar a memória virtual do java. Tive esse problema uns tempos atrás, mas não lembro como fiz (e foi em linux, não windows).
Mas não deveria ser necessário ler direto do excel. Tente salvar o arquivo como txt ao invés de csv. E quando usar read.table, use o argumento colclasses. Sete tudo para character e aí, depois no R, você converte pra numeric se necessário. Lembrabndo que um número 3.05e12 é só uma forma de imprimir na tela. Na memória o número está salvo corretamente.
Mas a questão principal é: quantos algarismos têm seus números e que operações você precisa fazer nele?
Sem isso e um exemplo reproduzível fica difícil ajudar. abç M
2013/4/20 Fátima Lima Paula <fatima.lima.paula@gmail.com>
Pessoal, tentei abrir com o pacote xlsx. Deu erro:
data=read.xlsx("sih2008.xlsx",1) Erro em .jcall("RJavaTools", "Ljava/lang/Object;", "invokeMethod", cl, : java.lang.OutOfMemoryError: Java heap space
Em 20 de abril de 2013 00:28, Daniel Marcelino <dmarcelino@live.com>escreveu:
En se tratando de uma variável ID, eu manteria ela como factor ou
character, evitando assim o problema de encolhimento como já dito.
2013/4/19 Fátima Lima Paula <fatima.lima.paula@gmail.com>
Pessoal, acho que resolvi. Quando salvo o txt em csv, preciso dizer que a coluna desse sódigo é número e não geral. Assim parece que deu certo. Obrigada a todos.
Em 19 de abril de 2013 19:30, Manoel Galdino <mcz.fea@gmail.com>escreveu:
Se você puder dar mais informações sobre o banco e o que quer dizer
essa variável, pode ajudar.
abç M
2013/4/19 Fátima Lima Paula <fatima.lima.paula@gmail.com>
> Acabei de descobrir que quando eu leio o banco esse número "perde o > final". É um código. Ele tem os primeiros dígitos depois vem vários zeros e > depois mais alguns dígitos. Estou em desespero. Perdi horas e horas de > trabalho. Vi que é um problema de importação do banco. Nunca havia > trabalhado com bancos grandes. Quando eu peguei o banco, ele veio em txt. > Deve ter sido na hora que fui abrir no excel. Alguém pode me dar uma luz em > relação a isso? > Tenho um banco em txt, separado por ponto e vírgula, sem "header". > Como é a melhor forma de trabalhar esse banco no R? > Obrigada > > > Em 19 de abril de 2013 18:21, Leandro Marino < > leandromarino@leandromarino.com.br> escreveu: > > Em um número deste tamanho consideraria transformar para character. >> Fatalmente é um código de município. >> >> Já tive problemas em números inteiros largos na hora de fazer o >> merge uma vez que eles são interpretados como pontos flutuantes.... >> >> Tive dois números que apesar de serem diferentes na hora do merge >> eram juntados.... >> Em 19/04/2013 17:24, "Fátima Lima Paula" < >> fatima.lima.paula@gmail.com> escreveu: >> >>> Prezados meus números estão aparecendo dessa forma: >>> 3.31000e+12 >>> Como faço para que fique >>> 3310008457687 >>> Alguém pode me ajudar, por favor? >>> Obrigada >>> >>> _______________________________________________ >>> R-br mailing list >>> R-br@listas.c3sl.ufpr.br >>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br >>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e >>> forneça código mínimo reproduzível. >>> >> >> _______________________________________________ >> R-br mailing list >> R-br@listas.c3sl.ufpr.br >> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br >> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e >> forneça código mínimo reproduzível. >> > > > _______________________________________________ > R-br mailing list > R-br@listas.c3sl.ufpr.br > https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br > Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e > forneça código mínimo reproduzível. >
-- Manoel Galdino https://sites.google.com/site/galdinomcz/
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- \begin{signature} Daniel Marcelino ☁ dm.silva@umontreal.ca ☎ (514) 343 6111 #3799 Skype: d.marcelino ✎ 3200 Jean Brillant, Office C5071 Montreal, QC; H3T 1N8 Canada \end{signature}
"Small steps toward a much better world"
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Manoel Galdino https://sites.google.com/site/galdinomcz/
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- \begin{signature} Daniel Marcelino ☁ dm.silva@umontreal.ca ☎ (514) 343 6111 #3799 Skype: d.marcelino ✎ 3200 Jean Brillant, Office C5071 Montreal, QC; H3T 1N8 Canada \end{signature}
"Small steps toward a much better world"
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
participantes (3)
-
Daniel Marcelino
-
Fátima Lima Paula
-
Manoel Galdino