[R-br] Resolvido: Tirar o cabeçalho do txt

Simone D. Sartorio sisartorio em yahoo.com.br
Sábado Novembro 5 11:49:58 BRST 2011



 Pessoal, muito obrigada pela ajuda! Deu certo!
bjos
  
Simone Daniela Sartorio
Licenciada em Matemática - UNESP (Rio Claro);
Mestre e atualmente Doutoranda em Estatística e Experimentação Agronômica - ESALQ/USP.
Cel: (19)9105-9032 - Claro
      (19)8182-0586 - Tim
 
 ******************************************************************* 
       "Gostaria de te desejar tantas coisas.
          Mas nada seria suficiente.
          Então, desejo apenas que você tenha muitos desejos.    
          Desejos grandes.
          E que eles possam te mover a cada minuto, ao rumo da sua felicidade!" 
                                                                (Carlos Drummond de Andrade) 
   ******************************************************************* 
                                            Tenha um Bom Dia!!! 



________________________________
De: Jônatan <jdtatsch em gmail.com>
Para: Simone D. Sartorio <sisartorio em yahoo.com.br>
Enviadas: Sexta-feira, 4 de Novembro de 2011 17:22
Assunto: Re: [R-br] Tirar o cabeçalho do txt


Olá Simone,

os argumentos usados na funcao grep são "Expressões Regulares (ERs)" e são comumente usadas em linhas de comandos de sistemas unix. Como vi que se tratava de dados de saída do DSSAT imaginei que estariam usando SO Windows, por isso enviei como fazer no R.
No exemplo que te enviei a ER  "^ [0-9]|^@" significa "procura por todas linhas que comecarem ("^") com um espaço seguido de qualquer número ("[0-9]"), ou ("|") linhas que comecarem com @. A função grep retorna as posicoes das linhas com esse padrão.

Fora do assunto da questão, eu fiquei pensando depois disso, como vcs vão diferenciar uma simulação da outra? Não verifiquei se há nos seus dados uma coluna que diferencie uma simulação da outra. Acho que teria que por um identificador (p.ex. 1 pra primeira simulação, 2 pra segunda, ...). Se todas simulações tiverem o mesmo numero de linhas é fácil fazer isso com o comando "rep" do R. Do contrário já teria que pensar um pouco mais.

Se quiseres saber mais sobre regex veja ?regex (no R)  e tem esse link http://aurelio.net/regex/.

Gostaria de te pedir para responder a lista r-br que a questão foi resolvida. Quando te respondi não tinha certeza se era isso mesmo que tu queria, que bom que serviu. 

[ ]'s




2011/11/4 Simone D. Sartorio <sisartorio em yahoo.com.br>

Oi Jonatan!
>
>Muito obrigada resolveu.... por tentativa e erro consegui tirar as linhas q eu queria, mas quebrei a cabeça aqui e nao entendi a logica da programação:
>"^ [0-9]|^@"
>Vc pode me explicar?! Nunca vi, ou melhor, não fui apresentada a esta notação!
>Desde já muito obrigada!
>abraços
>Simone
>
>
>
>
>________________________________
>De: Jônatan <jdtatsch em gmail.com>
>Para: r-br em listas.c3sl.ufpr.br; Simone D. Sartorio <sisartorio em yahoo.com.br>
>Enviadas: Quinta-feira, 3 de Novembro de 2011 16:13
>Assunto: Re: [R-br] Tirar o cabeçalho do txt
>
>
>
>Se infelizmente não estiveres usando linux use o R mesmo.
>
>d <- readLines("~/Desktop/jandaia.txt")
>writeLines(d[grep("^ [0-9]|^@", d)],"teste.txt")
>
>
>
>[  ]'s
>
>-- 
>#------------------------------------------------------------------------------#
># Jônatan Dupont Tatsch                                                           #
># Climate and Biosphere Laboratory                                           #
># Department of Atmospheric Sciences                                      #
># Institute of Astronomy, Geophysics and Atmospheric Sciences #
># University of São Paulo                                                          #
># Rua do Matão, 1226                                                               #
># Cid. Universitária, São Paulo, SP, Brazil, CEP: 05508-090       #
># Phone:+55 11 3091-4772, Fax:+55 11 3091-4714                    #
># http://jonatandupont.weebly.com/index.html          #
>#------------------------------------------------------------------------------#
>
>
>2011/11/3 Simone D. Sartorio <sisartorio em yahoo.com.br>
>
> 
>>Pessoal, boa tarde!
>>
>>Gente, estou com o seguinte problema, apareceu um rapaz aqui com um banco de dados com o formato que eu deixei disponivel no site:
>>http://www.datafilehost.com/download-b2091792.html
>>
>>O programa que ele usa, pelo que ele me disse, solta esse cabeçalho, que não tem como tirar pelo programa:
>>
>>------------------------------------------------------------------------------------------------
>>*GROWTH ASPECTS OUTPUT FILE
>>*DSSAT Cropping System Model Ver. 4.5.0.047               APR 11, 2011; 16:16:38
>>                                                                                
>>*RUN   1        : nov_01_DAS                MZCER045 GOJD1105    1              
>> MODEL          : MZCER045 - Maize                                              
>> EXPERIMENT     : GOJD1105 SN MILHO_SAFRA_JANDAIA                               
>> DATA PATH      : C:\DSSAT45\Seasonal\                                          
>> TREATMENT  1   : nov_01_DAS                MZCER045 
>>------------------------------------------------------------------------------------------------
>>
>>Mas isto ele solta para cada amostra obtida, ou seja, nesse arquivo q deixei no site, que eu salvei em '.txt', tem vários deste tipo, identificando a amostra, mas o cabeçalho é meio q padrão.
>>Alguem sabe se é possível apagar este cabeçalho deste arquivo de uma maneira inteligente, sem ser manualmente?! Pq o cara tem 30 anos de informações, dai pensa no trabalho....
>>Deletar linha, coluna, ou celula é facil de uma matriz, mas coisa assim eu desconheço se dá p fazer no R. 
>>Alguém tem alguma ideia?! Pode ser em outro programa tb!
>>
>>desde já muito obrigada!
>>Simone
>>
>>
>>  
>>Simone Daniela Sartorio
>>Licenciada em Matemática - UNESP (Rio Claro);
>>Mestre e atualmente Doutoranda em Estatística e Experimentação Agronômica - ESALQ/USP.
>>Cel: (19)9105-9032 - Claro
>>      (19)8182-0586 - Tim
>> 
>> ******************************************************************* 
>>       "Gostaria de te desejar tantas coisas.
>>          Mas nada seria suficiente.
>>          Então, desejo apenas que você tenha muitos desejos.    
>>          Desejos grandes.
>>          E que eles possam te mover a cada minuto, ao rumo da sua felicidade!" 
>>                                                                (Carlos Drummond de Andrade) 
>>   ******************************************************************* 
>>                                            Tenha um Bom Dia!!! 
>>
>>
>>
>>_______________________________________________
>>R-br mailing list
>>R-br em listas.c3sl.ufpr.br
>>https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
>>
>
>
>
>
>
>


-- 
#------------------------------------------------------------------------------#
# Jônatan Dupont Tatsch                                                           #
# Climate and Biosphere Laboratory                                           #
# Department of Atmospheric Sciences                                      #
# Institute of Astronomy, Geophysics and Atmospheric Sciences #
# University of São Paulo                                                          #
# Rua do Matão, 1226                                                               #
# Cid. Universitária, São Paulo, SP, Brazil, CEP: 05508-090       #
# Phone:+55 11 3091-4772, Fax:+55 11 3091-4714                    #
# http://jonatandupont.weebly.com/index.html          #
#------------------------------------------------------------------------------#
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20111105/e2fe5286/attachment.html>


Mais detalhes sobre a lista de discussão R-br