[R-br] Médias diárias em série de 10 anos

Thiago V. dos Santos thi_veloso em yahoo.com.br
Domingo Novembro 17 05:49:01 BRST 2013


Problema chato, pessoal:

Tenho um data.frame com quatro colunas: variable, date, value e unit. O data.frame foi construído com medidas diárias de 10 anos de cada variável, portanto a data vai de 1 de janeiro de 1980 a aproximadamente 31 de dezembro de 1989 para cada variável.

Aqui vai uma amostra do df:


> tsvars[1:20,]
        variable       date    value  unit
2  toa radiation 1980-01-01 258.8793 W/m^2
3  toa radiation 1980-01-02 289.1413 W/m^2
4  toa radiation 1980-01-03 264.9647 W/m^2
5  toa radiation 1980-01-04 291.8841 W/m^2
6  toa radiation 1980-01-05 269.4446 W/m^2
7  toa radiation 1980-01-06 286.0237 W/m^2
8  toa radiation 1980-01-07 274.6440 W/m^2
9  toa radiation 1980-01-08 277.9688 W/m^2
10 toa radiation 1980-01-09 272.6379 W/m^2
11 toa radiation 1980-01-10 273.0654 W/m^2
12 toa radiation 1980-01-11 278.9035 W/m^2
13 toa radiation 1980-01-12 267.1813 W/m^2
14 toa radiation 1980-01-13 270.5033 W/m^2
15 toa radiation 1980-01-14 279.6346 W/m^2
16 toa radiation 1980-01-15 262.5689 W/m^2
17 toa radiation 1980-01-16 267.4670 W/m^2
18 toa radiation 1980-01-17 273.8332 W/m^2
19 toa radiation 1980-01-18 271.3236 W/m^2
20 toa radiation 1980-01-19 271.2731 W/m^2
21 toa radiation 1980-01-20 269.9610 W/m^2

Ao todo eu tenho quatro variáveis e pra cada uma delas há 365 valores (um para cada dia do ano). O dataframe é muito longo e não vou postá-lo completo aqui, mas vejam a saída do str():


> str(tsvars)
'data.frame':18290 obs. of  4 variables:
 $ variable: Factor w/ 5 levels "latent","sensible",..: 4 4 4 4 4 4 4 4 4 4 ...
 $ date    : Date, format: "1980-01-01" "1980-01-02" "1980-01-03" ...
 $ value   : num  259 289 265 292 269 ...
 $ unit    : chr  "W/m^2" "W/m^2" "W/m^2" "W/m^2" ...

O que eu preciso fazer é criar a média de cada dia individual dos 10 anos. Ou seja, preciso de uma média para o dia 01/jan, que vai ser a média de todos os 01/jan da série, 02/jan, 03/jan e assim por diante. O detalhe é que a coluna "date" está de fato formatada como data, o que talvez complique as coisas. E eu preciso que ela continue assim, pois facilita na hora de plotar a série temporal.

Na sua opinião, qual é a melhor abordagem para tirar a média de cada dia da série, como descrito acima?
 
Saudações,
--
Thiago V. dos Santos
PhD student
Land and Atmospheric Science
University of Minnesota
http://www.laas.umn.edu/CurrentStudents/MeettheStudents/ThiagodosSantos/index.htm
Phone: (612) 323 9898
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20131116/37ac6700/attachment.html>


Mais detalhes sobre a lista de discussão R-br