[R-br] Fwd: Sua mensagem para a lista R-br aguarda aprovação

Fátima Lima Paula fatima.lima.paula em gmail.com
Sábado Abril 20 21:05:58 BRT 2013


Leandro, limpar um banco no R é mais complicado.
Acho que precisa ter domínio das funções.
As pessoas que lidam com bancos grandes dizem que é melhor fazer de outra
forma.


Em 20 de abril de 2013 19:57, Leandro Marino <
leandromarino em leandromarino.com.br> escreveu:

> Fatima e qual o motivo para você nao fazer toda a manipulacao no r?
> ainda nao entendi isto direito.
>
> assim voce poderia importar diretamente o arquivo.
>
>   <http://www.showmetech.com.br>
>
> *LEANDRO MARINO* | Showmetech
> Estatístico | Fotógrafo
> Mobile: 55 21 9845-7707
> Email: contato em leandromarino.com.br
> Profiles SMT: facebook <http://www.facebook.com/showmetech> | twitter<http://www.twitter.com/showmetech>
>  | Google+ <https://plus.google.com/115440786884851522659>
>
> <http://www.leandromarino.com.br>
>
>
>
> Em 20 de abril de 2013 16:20, Fátima Lima Paula <
> fatima.lima.paula em gmail.com> escreveu:
>
> Valeu. Estou trabalhando e recuperando o tempo perdido e por enquanto está
>> tudo bem.
>> Muito obrigada.
>>
>>
>>
>> Em 20 de abril de 2013 16:05, Daniel Marcelino <dmarcelino em live.com>escreveu:
>>
>> O problema não é enviar e rotornar o arquivo várias vezes. Se você tiver
>>> um workflow dos procedimentos e se assegurar que o realize todas as vezes,
>>> não terá problemas, em tese.
>>>
>>> O não saberia te dizer precisamente como fazer isso, mas tente salvar o
>>> arquivo do excel em com um separador ";" que é o padrão do csv brasileiro.
>>> Mas veja se você consegue ler direto do xlsx com incremento da memoria,
>>> isso não é o melhor, mas te pouparia alguma coisa.
>>>
>>> Voce precisa verificar também se o ambiente do R é mesmo do Excel em
>>> termos de configuração do idioma etc. Isso ajuda.
>>> No R você você obtem essas infos assim:
>>>
>>> sessionInfo()
>>>
>>>
>>>
>>> 2013/4/20 Fátima Lima Paula <fatima.lima.paula em gmail.com>
>>>
>>>> Pois é, é isso que está acontecendo. Ele vem do sistema de saúde em
>>>> txt, com separador ";". Eu tenho que fazer algumas buscas nele para
>>>> limpá-lo e depois lê-lo no R. Qual a forma que você me sugere. Abro para
>>>> trabalhar nele onde? Abri no excel, faço as mudanças e limpezas e salvo no
>>>> csv porque essa é a única forma que consigo fazer para abrir o banco. Mas é
>>>> que às vezes aparece alguma coisa para ser vista e eu tenho que enviá-lo do
>>>> R para o excel e retornar.
>>>> Obrigada
>>>>
>>>>
>>>> Em 20 de abril de 2013 13:52, Daniel Marcelino <dmarcelino em live.com>escreveu:
>>>>
>>>> Fátima, eu não sei o porquê você está salvando em xlx, xlsx, csv.
>>>>> Qual é o formato original dos seus dados?
>>>>> Observe que seus dados podem conter virgulas no meio do texto o que
>>>>> pode levar à erros na hora da leitura. Então, o jeito é especificar ao
>>>>> máximo, trocando o delimitador "," por ";" e talvez incluindo "" para
>>>>> identificar o campo da coluna. Tudo isso pode ser feito automaticamente no
>>>>> excel, basta marcar lá.
>>>>>
>>>>> *Tente reduzir ao máximo esse troca-troca de formatos. Isso sempre
>>>>> causa problemas (eu já tive vários).
>>>>>
>>>>>
>>>>>
>>>>> 2013/4/20 Fátima Lima Paula <fatima.lima.paula em gmail.com>
>>>>>
>>>>>> Vou tentar. A conclusão em que cheguei ontem à noite é que eu não
>>>>>> estou importando direito na hora que abro esse banco txt no excel. Estou
>>>>>> utilizando, no assistente de importação os seguintes parâmetros: tipo de
>>>>>> campo: delimitado, origem do arquivo: unicode(utf-8), delimitadores:
>>>>>> tabulação e ponto e vírgula, formato dos dados: a princípio deixei tudo
>>>>>> geral, depois coloquei para essa coluna texto. Também não sei se é porque
>>>>>> eu salvo em csv. Quando vou salvar em xls ele não aguenta o número de
>>>>>> linhas. Em xlsx, ele salva. Vou tentar evitar o csv e tentar abrir o banco
>>>>>> no R direto do xlsx.
>>>>>> Se alguém tem experiência com isso, por favor, me ajude. Estou em
>>>>>> desespero. Descobri que perdi um trabalhão por conta disso. Estou tentando
>>>>>> verificar o momento em que ele detona o número.
>>>>>> Muito obrigada a todos.
>>>>>>
>>>>>>
>>>>>> Em 20 de abril de 2013 01:26, Daniel Marcelino <dmarcelino em live.com>escreveu:
>>>>>>
>>>>>> Mauro,
>>>>>>>
>>>>>>> para ser franco, eu não sou usuário de excel e portanto quase nunca
>>>>>>> utilizo a função read.xlsx. Contudo, tenho quase certeza que a mesma função
>>>>>>> funciona para arquivos xlsx e para xls.
>>>>>>>
>>>>>>> Eu todo caso, você poderia usar também a função read.xls do pacote
>>>>>>> gdata:
>>>>>>>
>>>>>>> library(gdata)
>>>>>>> help(read.xls)
>>>>>>> dados = read.xls("banco.xls")
>>>>>>>
>>>>>>> Daniel
>>>>>>>
>>>>>>>
>>>>>>>
>>>>>>> 2013/4/20 Mauro Sznelwar <sznelwar em uol.com.br>
>>>>>>>
>>>>>>>>  **
>>>>>>>> *Tem só para o xlsx? E para o xls?*
>>>>>>>>
>>>>>>>>
>>>>>>>> O sheetIndex é a posição da folha de dados na planilha. Traduzindo,
>>>>>>>> se os dados que você quer importar estão na plan1 (o que normalmente o
>>>>>>>> caso) você coloca o número 1, como no exemplo que eu passei. Se os dados
>>>>>>>> estiverem na segunda,  terceira, etc, é só indicar lá a posição (2, 3,
>>>>>>>> etc).
>>>>>>>>
>>>>>>>>  library(xlsx)
>>>>>>>> dados <- read.xlsx("banco.xlsx", 1)
>>>>>>>>
>>>>>>>> Daniel
>>>>>>>>
>>>>>>>>
>>>>>>>>
>>>>>>>>
>>>>>>>> _______________________________________________
>>>>>>>> R-br mailing list
>>>>>>>> R-br em listas.c3sl.ufpr.br
>>>>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e
>>>>>>>> forneça código mínimo reproduzível.
>>>>>>>>
>>>>>>>
>>>>>>>
>>>>>>>
>>>>>>> --
>>>>>>> \begin{signature}
>>>>>>> Daniel Marcelino
>>>>>>>dm.silva em umontreal.ca
>>>>>>> ☎ (514) 343 6111 #3799
>>>>>>> Skype: d.marcelino
>>>>>>> ✎ 3200 Jean Brillant,  Office C5071
>>>>>>> Montreal, QC; H3T 1N8
>>>>>>> Canada
>>>>>>> \end{signature}
>>>>>>>
>>>>>>> "Small steps toward a much better world"
>>>>>>>
>>>>>>> _______________________________________________
>>>>>>> R-br mailing list
>>>>>>> R-br em listas.c3sl.ufpr.br
>>>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e
>>>>>>> forneça código mínimo reproduzível.
>>>>>>>
>>>>>>
>>>>>>
>>>>>> _______________________________________________
>>>>>> R-br mailing list
>>>>>> R-br em listas.c3sl.ufpr.br
>>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>>>>> código mínimo reproduzível.
>>>>>>
>>>>>
>>>>>
>>>>>
>>>>> --
>>>>> \begin{signature}
>>>>> Daniel Marcelino
>>>>>dm.silva em umontreal.ca
>>>>> ☎ (514) 343 6111 #3799
>>>>> Skype: d.marcelino
>>>>> ✎ 3200 Jean Brillant,  Office C5071
>>>>> Montreal, QC; H3T 1N8
>>>>> Canada
>>>>> \end{signature}
>>>>>
>>>>> "Small steps toward a much better world"
>>>>>
>>>>> _______________________________________________
>>>>> R-br mailing list
>>>>> R-br em listas.c3sl.ufpr.br
>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>>>> código mínimo reproduzível.
>>>>>
>>>>
>>>>
>>>> _______________________________________________
>>>> R-br mailing list
>>>> R-br em listas.c3sl.ufpr.br
>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>>> código mínimo reproduzível.
>>>>
>>>
>>>
>>>
>>> --
>>> \begin{signature}
>>> Daniel Marcelino
>>>dm.silva em umontreal.ca
>>> ☎ (514) 343 6111 #3799
>>> Skype: d.marcelino
>>> ✎ 3200 Jean Brillant,  Office C5071
>>> Montreal, QC; H3T 1N8
>>> Canada
>>> \end{signature}
>>>
>>> "Small steps toward a much better world"
>>>
>>> _______________________________________________
>>> R-br mailing list
>>> R-br em listas.c3sl.ufpr.br
>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>> código mínimo reproduzível.
>>>
>>
>>
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20130420/c6cb0f91/attachment.html>


Mais detalhes sobre a lista de discussão R-br