[R-br] mudar de decimal para inteiro
Daniel Marcelino
dmarcelino em live.com
Sábado Abril 20 14:08:56 BRT 2013
De fato, existe uma limitação da memória, se sua planilha for muito grande
o java não conseguira concluir a leitura.
A dica do Manoel é a mais sensata e vai evitar todos esses problemas de
leitura e etc. Tudo o que você precisa criar é um workflow de como abrir e
salvar os seus dados no R.
Abaixo vou postar uma solução, mas isso vai depender da sua máquina:
> options(java.parameters = "-Xmx1000m")
Você também pode usar gc() depois de cada leitura, casa há várias.
Daniel
2013/4/20 Manoel Galdino <mcz.fea em gmail.com>
> é problema da memória virtual do java. Tem que setar a memória virtual do
> java. Tive esse problema uns tempos atrás, mas não lembro como fiz (e foi
> em linux, não windows).
>
> Mas não deveria ser necessário ler direto do excel. Tente salvar o arquivo
> como txt ao invés de csv. E quando usar read.table, use o argumento
> colclasses. Sete tudo para character e aí, depois no R, você converte pra
> numeric se necessário.
> Lembrabndo que um número 3.05e12 é só uma forma de imprimir na tela. Na
> memória o número está salvo corretamente.
>
> Mas a questão principal é: quantos algarismos têm seus números e que
> operações você precisa fazer nele?
>
> Sem isso e um exemplo reproduzível fica difícil ajudar.
> abç
> M
>
>
>
> 2013/4/20 Fátima Lima Paula <fatima.lima.paula em gmail.com>
>
>> Pessoal, tentei abrir com o pacote xlsx. Deu erro:
>> > data=read.xlsx("sih2008.xlsx",1)
>> Erro em .jcall("RJavaTools", "Ljava/lang/Object;", "invokeMethod", cl, :
>> java.lang.OutOfMemoryError: Java heap space
>>
>>
>>
>> Em 20 de abril de 2013 00:28, Daniel Marcelino <dmarcelino em live.com>escreveu:
>>
>> En se tratando de uma variável ID, eu manteria ela como factor ou
>>> character, evitando assim o problema de encolhimento como já dito.
>>>
>>>
>>>
>>> 2013/4/19 Fátima Lima Paula <fatima.lima.paula em gmail.com>
>>>
>>>> Pessoal, acho que resolvi. Quando salvo o txt em csv, preciso dizer que
>>>> a coluna desse sódigo é número e não geral. Assim parece que deu certo.
>>>> Obrigada a todos.
>>>>
>>>>
>>>> Em 19 de abril de 2013 19:30, Manoel Galdino <mcz.fea em gmail.com>escreveu:
>>>>
>>>> Se você puder dar mais informações sobre o banco e o que quer dizer
>>>>> essa variável, pode ajudar.
>>>>>
>>>>> abç
>>>>> M
>>>>>
>>>>>
>>>>> 2013/4/19 Fátima Lima Paula <fatima.lima.paula em gmail.com>
>>>>>
>>>>>> Acabei de descobrir que quando eu leio o banco esse número "perde o
>>>>>> final". É um código. Ele tem os primeiros dígitos depois vem vários zeros e
>>>>>> depois mais alguns dígitos. Estou em desespero. Perdi horas e horas de
>>>>>> trabalho. Vi que é um problema de importação do banco. Nunca havia
>>>>>> trabalhado com bancos grandes. Quando eu peguei o banco, ele veio em txt.
>>>>>> Deve ter sido na hora que fui abrir no excel. Alguém pode me dar uma luz em
>>>>>> relação a isso?
>>>>>> Tenho um banco em txt, separado por ponto e vírgula, sem "header".
>>>>>> Como é a melhor forma de trabalhar esse banco no R?
>>>>>> Obrigada
>>>>>>
>>>>>>
>>>>>> Em 19 de abril de 2013 18:21, Leandro Marino <
>>>>>> leandromarino em leandromarino.com.br> escreveu:
>>>>>>
>>>>>> Em um número deste tamanho consideraria transformar para character.
>>>>>>> Fatalmente é um código de município.
>>>>>>>
>>>>>>> Já tive problemas em números inteiros largos na hora de fazer o
>>>>>>> merge uma vez que eles são interpretados como pontos flutuantes....
>>>>>>>
>>>>>>> Tive dois números que apesar de serem diferentes na hora do merge
>>>>>>> eram juntados....
>>>>>>> Em 19/04/2013 17:24, "Fátima Lima Paula" <
>>>>>>> fatima.lima.paula em gmail.com> escreveu:
>>>>>>>
>>>>>>>> Prezados meus números estão aparecendo dessa forma:
>>>>>>>> 3.31000e+12
>>>>>>>> Como faço para que fique
>>>>>>>> 3310008457687
>>>>>>>> Alguém pode me ajudar, por favor?
>>>>>>>> Obrigada
>>>>>>>>
>>>>>>>> _______________________________________________
>>>>>>>> R-br mailing list
>>>>>>>> R-br em listas.c3sl.ufpr.br
>>>>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e
>>>>>>>> forneça código mínimo reproduzível.
>>>>>>>>
>>>>>>>
>>>>>>> _______________________________________________
>>>>>>> R-br mailing list
>>>>>>> R-br em listas.c3sl.ufpr.br
>>>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e
>>>>>>> forneça código mínimo reproduzível.
>>>>>>>
>>>>>>
>>>>>>
>>>>>> _______________________________________________
>>>>>> R-br mailing list
>>>>>> R-br em listas.c3sl.ufpr.br
>>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>>>>> código mínimo reproduzível.
>>>>>>
>>>>>
>>>>>
>>>>>
>>>>> --
>>>>> Manoel Galdino
>>>>> https://sites.google.com/site/galdinomcz/
>>>>>
>>>>> _______________________________________________
>>>>> R-br mailing list
>>>>> R-br em listas.c3sl.ufpr.br
>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>>>> código mínimo reproduzível.
>>>>>
>>>>
>>>>
>>>> _______________________________________________
>>>> R-br mailing list
>>>> R-br em listas.c3sl.ufpr.br
>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>>> código mínimo reproduzível.
>>>>
>>>
>>>
>>>
>>> --
>>> \begin{signature}
>>> Daniel Marcelino
>>> ☁ dm.silva em umontreal.ca
>>> ☎ (514) 343 6111 #3799
>>> Skype: d.marcelino
>>> ✎ 3200 Jean Brillant, Office C5071
>>> Montreal, QC; H3T 1N8
>>> Canada
>>> \end{signature}
>>>
>>> "Small steps toward a much better world"
>>>
>>> _______________________________________________
>>> R-br mailing list
>>> R-br em listas.c3sl.ufpr.br
>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>> código mínimo reproduzível.
>>>
>>
>>
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>>
>
>
>
> --
> Manoel Galdino
> https://sites.google.com/site/galdinomcz/
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
--
\begin{signature}
Daniel Marcelino
☁ dm.silva em umontreal.ca
☎ (514) 343 6111 #3799
Skype: d.marcelino
✎ 3200 Jean Brillant, Office C5071
Montreal, QC; H3T 1N8
Canada
\end{signature}
"Small steps toward a much better world"
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20130420/8dc6f129/attachment.html>
Mais detalhes sobre a lista de discussão R-br