[R-br] mudar de decimal para inteiro

Fátima Lima Paula fatima.lima.paula em gmail.com
Sábado Abril 20 14:56:15 BRT 2013


Pessoal, acho que contornei o problema. Quando eu importo o txt em xlsx e
só depois passo para o csv aparentemente fica tudo ok. Salvei a coluna do
código como texto e quando abro no R, salvo como factor como o Daniel me
sugeriu.
Vou tentar levar assim. Do jeito que estão as coisas por aqui não vou
defender nunca.
Muito obrigada a todos.
Sem vocês minha tese iria para o lodo.
Abs
Fátima


Em 20 de abril de 2013 14:08, Daniel Marcelino <dmarcelino em live.com>escreveu:

> De fato, existe uma limitação da memória, se sua planilha for muito grande
> o java não conseguira concluir a leitura.
> A dica do Manoel é a mais sensata e vai evitar todos esses problemas de
> leitura e  etc. Tudo o que você precisa criar é um workflow de como abrir e
> salvar os seus dados no R.
>
> Abaixo vou postar uma solução, mas isso vai depender da sua máquina:
>
> > options(java.parameters = "-Xmx1000m")
>
> Você também pode usar gc() depois de cada leitura, casa há várias.
>
> Daniel
>
>
> 2013/4/20 Manoel Galdino <mcz.fea em gmail.com>
>
>> é problema da memória virtual do java. Tem que setar a memória virtual do
>> java. Tive esse problema uns tempos atrás, mas não lembro como fiz (e foi
>> em linux, não windows).
>>
>> Mas não deveria ser necessário ler direto do excel. Tente salvar o
>> arquivo como txt ao invés de csv. E quando usar read.table, use o argumento
>> colclasses. Sete tudo para character e aí, depois no R, você converte pra
>> numeric se necessário.
>> Lembrabndo que um número 3.05e12 é só uma forma de imprimir na tela. Na
>> memória o número está salvo corretamente.
>>
>> Mas a questão principal é: quantos algarismos têm seus números e que
>> operações você precisa fazer nele?
>>
>> Sem isso e um exemplo reproduzível fica difícil ajudar.
>> abç
>> M
>>
>>
>>
>> 2013/4/20 Fátima Lima Paula <fatima.lima.paula em gmail.com>
>>
>>> Pessoal, tentei abrir com o pacote xlsx. Deu erro:
>>> > data=read.xlsx("sih2008.xlsx",1)
>>> Erro em .jcall("RJavaTools", "Ljava/lang/Object;", "invokeMethod", cl,
>>>  :
>>>   java.lang.OutOfMemoryError: Java heap space
>>>
>>>
>>>
>>> Em 20 de abril de 2013 00:28, Daniel Marcelino <dmarcelino em live.com>escreveu:
>>>
>>> En se tratando de uma variável ID, eu manteria ela como factor ou
>>>> character, evitando assim o problema de encolhimento como já dito.
>>>>
>>>>
>>>>
>>>> 2013/4/19 Fátima Lima Paula <fatima.lima.paula em gmail.com>
>>>>
>>>>> Pessoal, acho que resolvi. Quando salvo o txt em csv, preciso dizer
>>>>> que a coluna desse sódigo é número e não geral. Assim parece que deu certo.
>>>>> Obrigada a todos.
>>>>>
>>>>>
>>>>> Em 19 de abril de 2013 19:30, Manoel Galdino <mcz.fea em gmail.com>escreveu:
>>>>>
>>>>> Se você puder dar mais informações sobre o banco e o que quer dizer
>>>>>> essa variável, pode ajudar.
>>>>>>
>>>>>> abç
>>>>>> M
>>>>>>
>>>>>>
>>>>>> 2013/4/19 Fátima Lima Paula <fatima.lima.paula em gmail.com>
>>>>>>
>>>>>>> Acabei de descobrir que quando eu leio o banco esse número "perde o
>>>>>>> final". É um código. Ele tem os primeiros dígitos depois vem vários zeros e
>>>>>>> depois mais alguns dígitos. Estou em desespero. Perdi horas e horas de
>>>>>>> trabalho. Vi que é um problema de importação do banco. Nunca havia
>>>>>>> trabalhado com bancos grandes. Quando eu peguei o banco, ele veio em txt.
>>>>>>> Deve ter sido na hora que fui abrir no excel. Alguém pode me dar uma luz em
>>>>>>> relação a isso?
>>>>>>> Tenho um banco em txt, separado por ponto e vírgula, sem "header".
>>>>>>> Como é a melhor forma de trabalhar esse banco no R?
>>>>>>> Obrigada
>>>>>>>
>>>>>>>
>>>>>>> Em 19 de abril de 2013 18:21, Leandro Marino <
>>>>>>> leandromarino em leandromarino.com.br> escreveu:
>>>>>>>
>>>>>>> Em um número deste tamanho consideraria transformar para character.
>>>>>>>> Fatalmente é um código de município.
>>>>>>>>
>>>>>>>> Já tive problemas em números inteiros largos na hora de fazer o
>>>>>>>> merge uma vez que eles são interpretados como pontos flutuantes....
>>>>>>>>
>>>>>>>> Tive dois números que apesar de serem diferentes na hora do merge
>>>>>>>> eram juntados....
>>>>>>>> Em 19/04/2013 17:24, "Fátima Lima Paula" <
>>>>>>>> fatima.lima.paula em gmail.com> escreveu:
>>>>>>>>
>>>>>>>>>  Prezados meus números estão aparecendo dessa forma:
>>>>>>>>> 3.31000e+12
>>>>>>>>> Como faço para que fique
>>>>>>>>> 3310008457687
>>>>>>>>> Alguém pode me ajudar, por favor?
>>>>>>>>> Obrigada
>>>>>>>>>
>>>>>>>>> _______________________________________________
>>>>>>>>> R-br mailing list
>>>>>>>>> R-br em listas.c3sl.ufpr.br
>>>>>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>>>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e
>>>>>>>>> forneça código mínimo reproduzível.
>>>>>>>>>
>>>>>>>>
>>>>>>>> _______________________________________________
>>>>>>>> R-br mailing list
>>>>>>>> R-br em listas.c3sl.ufpr.br
>>>>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e
>>>>>>>> forneça código mínimo reproduzível.
>>>>>>>>
>>>>>>>
>>>>>>>
>>>>>>> _______________________________________________
>>>>>>> R-br mailing list
>>>>>>> R-br em listas.c3sl.ufpr.br
>>>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e
>>>>>>> forneça código mínimo reproduzível.
>>>>>>>
>>>>>>
>>>>>>
>>>>>>
>>>>>> --
>>>>>> Manoel Galdino
>>>>>> https://sites.google.com/site/galdinomcz/
>>>>>>
>>>>>> _______________________________________________
>>>>>> R-br mailing list
>>>>>> R-br em listas.c3sl.ufpr.br
>>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>>>>> código mínimo reproduzível.
>>>>>>
>>>>>
>>>>>
>>>>> _______________________________________________
>>>>> R-br mailing list
>>>>> R-br em listas.c3sl.ufpr.br
>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>>>> código mínimo reproduzível.
>>>>>
>>>>
>>>>
>>>>
>>>> --
>>>> \begin{signature}
>>>> Daniel Marcelino
>>>>dm.silva em umontreal.ca
>>>> ☎ (514) 343 6111 #3799
>>>> Skype: d.marcelino
>>>> ✎ 3200 Jean Brillant,  Office C5071
>>>> Montreal, QC; H3T 1N8
>>>> Canada
>>>> \end{signature}
>>>>
>>>> "Small steps toward a much better world"
>>>>
>>>> _______________________________________________
>>>> R-br mailing list
>>>> R-br em listas.c3sl.ufpr.br
>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>>> código mínimo reproduzível.
>>>>
>>>
>>>
>>> _______________________________________________
>>> R-br mailing list
>>> R-br em listas.c3sl.ufpr.br
>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>> código mínimo reproduzível.
>>>
>>
>>
>>
>> --
>> Manoel Galdino
>> https://sites.google.com/site/galdinomcz/
>>
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>>
>
>
>
> --
> \begin{signature}
> Daniel Marcelino
>dm.silva em umontreal.ca
> ☎ (514) 343 6111 #3799
> Skype: d.marcelino
> ✎ 3200 Jean Brillant,  Office C5071
> Montreal, QC; H3T 1N8
> Canada
> \end{signature}
>
> "Small steps toward a much better world"
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20130420/5a9536a3/attachment.html>


Mais detalhes sobre a lista de discussão R-br