[OFF-Topic] Dados climáticos de Paris durante maratona de 20 km

Saudações à todos, Nos meus cursos para motivar os alunos estou considerando dados reais e maiores que os dados disponíveis nos livros. Dessa vez pedi para que trabalhassem com os dados da maratona de paris cujas planilhas dos últimos anos estão disponíveis em http://www.20kmparis.com/web/resultats_precedents.asp Muito conhecimento se adquire da análise desses dados. É muito gostoso trabalhar esses dados em sala de aula. São infinitas possibilidades de gráficos. Para ver alguns gráficos baixe descompacte o arquivo e rode a aula10.R http://dl.dropboxusercontent.com/u/48140237/ce083.zip No entanto eu gostaria de verificar o efeito do clima sobre os resultados das corridas (no tempo médio, no tempo recorde, nos homens e mulheres, etc). Para isso eu preciso de séries climáticas (ou valores pontuais) de Paris no dia da prova. As datas das provas estão nos panfletos de divulgação da mesma em http://www.20kmparis.com/web/affiches.asp Alguém saberia indicar um site de onde eu pudesse pegar dados climáticos (temperatura e umidade relativa) nessas datas? A idéia e fazer merge de bases de dados, e inclusive testes de hipótese simples envolvendo às variáveis. Muitos maratonistas participam vários anos e tem como ver o desempenho individual. Fiz uma busca no google mas nada que me desse séries históricas. Talvez seja do conhecimento dos que trabalham com séries temporais a origem de dados assim. Quem souber fontes de dados assim, por gentileza me indique. A maratona acontece novamente agora dia 13 de outubro. Quero que os alunos façam uma previsão do tempo recorde por meio da temperatura prevista para Paris ou coisas do tipo. É uma forma de estimulá-los a conhecer os dados. Grato à todos. Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 skype: walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================

2013/10/3 walmes . <walmeszeviani@gmail.com>:
Alguém saberia indicar um site de onde eu pudesse pegar dados climáticos (temperatura e umidade relativa) nessas datas?
wundergdound.com Exemplo: http://www.wunderground.com/history/airport/LFPB/2004/10/3/MonthlyHistory.ht... Existe a opção de baixar "comma delimited file" da tabela.

Jackson, Excelente. Com suas dicas eu consegui tirar os dados que eu precisava. Abaixo segue um CMR, para quem se sentir curioso, que lê as tabelas por meio da url correspondente aos dias da maratona e no final calcula algumas estatísticas canditadas à relacionar com o desempenho dos atletas. Grato. Walmes. #----------------------------------------------------------------------------- # Lê tabelas de clima nos dias da maratona de Paris. ini <- "http://www.wunderground.com/history/airport/LFPB/" fim <- "/DailyHistory.html??format=1&format=1" dia <- c("2012/10/14") # padrão do endereço das tabelas url <- paste(ini, dia, fim, sep="") da <- read.table(url, sep=",", header=TRUE, na.string=c("N/A","-","","-9999")) str(da) #---------------------------------------------------------------------------- ## Datas do evento. ## http://www.20kmparis.com/web/affiches.asp dias <- c("2012/10/14","2011/10/9","2010/10/10", "2009/10/11","2008/10/12","2007/10/17", "2006/10/15","2005/10/16","2004/10/17") lercada <- function(dia){ ini <- "http://www.wunderground.com/history/airport/LFPB/" fim <- "/DailyHistory.html??format=1&format=1" url <- paste(ini, dia, fim, sep="") da <- read.table(url, sep=",", header=TRUE, na.string=c("N/A","-","","-9999")) cat(dia, "\t ok!\n") return(da) } L <- lapply(dias, lercada) sapply(L, class) sapply(L, dim) sapply(L, names) names(L) <- 2012:2004 #----------------------------------------------------------------------------- require(plyr) M <- ldply(L) str(M) names(M)[1] <- "ano" aggregate(cbind(TemperatureC,Humidity)~ano, data=M, max) aggregate(cbind(TemperatureC,Humidity)~ano, data=M, mean) aggregate(cbind(TemperatureC,Humidity)~ano, data=M, median) #----------------------------------------------------------------------------- ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 skype: walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================

Achei a idéia muito criativa! Seria possivel incentivar os alunos com os melhores scripts postar as análises no RPubs e publicar os links na lista para podermos aprender um pouco mais? Conheço colegas (eu inclusive) que também gostariam de ver os possíveis resultados Walmes Abs André Rutz “We need to follow the data just like the yellow brick road, to the truth.” Samuel Klein Em 04/10/2013 15:10, "walmes ." <walmeszeviani@gmail.com> escreveu:
Jackson,
Excelente. Com suas dicas eu consegui tirar os dados que eu precisava. Abaixo segue um CMR, para quem se sentir curioso, que lê as tabelas por meio da url correspondente aos dias da maratona e no final calcula algumas estatísticas canditadas à relacionar com o desempenho dos atletas.
Grato. Walmes.
#----------------------------------------------------------------------------- # Lê tabelas de clima nos dias da maratona de Paris.
ini <- "http://www.wunderground.com/history/airport/LFPB/" fim <- "/DailyHistory.html??format=1&format=1" dia <- c("2012/10/14")
# padrão do endereço das tabelas url <- paste(ini, dia, fim, sep="")
da <- read.table(url, sep=",", header=TRUE, na.string=c("N/A","-","","-9999")) str(da)
#---------------------------------------------------------------------------- ## Datas do evento.
## http://www.20kmparis.com/web/affiches.asp
dias <- c("2012/10/14","2011/10/9","2010/10/10", "2009/10/11","2008/10/12","2007/10/17", "2006/10/15","2005/10/16","2004/10/17")
lercada <- function(dia){ ini <- "http://www.wunderground.com/history/airport/LFPB/" fim <- "/DailyHistory.html??format=1&format=1" url <- paste(ini, dia, fim, sep="") da <- read.table(url, sep=",", header=TRUE, na.string=c("N/A","-","","-9999")) cat(dia, "\t ok!\n") return(da) }
L <- lapply(dias, lercada) sapply(L, class) sapply(L, dim) sapply(L, names)
names(L) <- 2012:2004
#-----------------------------------------------------------------------------
require(plyr)
M <- ldply(L) str(M) names(M)[1] <- "ano"
aggregate(cbind(TemperatureC,Humidity)~ano, data=M, max) aggregate(cbind(TemperatureC,Humidity)~ano, data=M, mean) aggregate(cbind(TemperatureC,Humidity)~ano, data=M, median)
#-----------------------------------------------------------------------------
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 skype: walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Walmes, Encontrei um problema no seu CRM na linha 'M <- ldply(L)':
require(plyr) M <- ldply(L) Mensagens de aviso perdidas: 1: In `[<-.factor`(`*tmp*`, rng, value = c(8L, 5L, 1L, 5L, 5L, 9L, : invalid factor level, NA generated 2: In `[<-.factor`(`*tmp*`, rng, value = c(8L, 5L, 1L, 5L, 5L, 9L, : invalid factor level, NA generated 3: In `[<-.factor`(`*tmp*`, rng, value = c(8L, 5L, 1L, 5L, 5L, 9L, : invalid factor level, NA generated 4: In `[<-.factor`(`*tmp*`, rng, value = c(8L, 5L, 1L, 5L, 5L, 9L, : invalid factor level, NA generated 5: In `[<-.factor`(`*tmp*`, rng, value = c(8L, 5L, 1L, 5L, 5L, 9L, : invalid factor level, NA generated
Estou com os seguintes software:
version _ platform x86_64-w64-mingw32 arch x86_64 os mingw32 system x86_64, mingw32 status Patched major 3 minor 0.2 year 2013 month 10 day 08 svn rev 64039 language R version.string R version 3.0.2 Patched (2013-10-08 r64039) nickname Frisbee Sailing
packageVersion('plyr') [1] ‘1.8’
Ab, -- ///\\\///\\\///\\\///\\\///\\\///\\\///\\\///\\\ Jose Claudio Faria Estatistica UESC/DCET/Brasil joseclaudio.faria at gmail.com Telefones: 55(73)3680.5545 - UESC 55(73)9100.7351 - TIM 55(73)8817.6159 - OI ///\\\///\\\///\\\///\\\///\\\///\\\///\\\///\\\

Faria, Essas mensagens de aviso também aparecem para mim em todas as máquinas que uso. Para ser sincero eu não sei a causa delas mas não comprometeram os resultados. Eu uso a ldply() com frequência e mensagens de aviso são comuns. Sempre que chequei os resultados não vi problema. A apesar do uso frequente não descobri a causa ainda.
sessionInfo() R version 3.0.1 (2013-05-16) Platform: i686-pc-linux-gnu (32-bit)
locale: [1] LC_CTYPE=pt_BR.UTF-8 LC_NUMERIC=C [3] LC_TIME=pt_BR.UTF-8 LC_COLLATE=pt_BR.UTF-8 [5] LC_MONETARY=pt_BR.UTF-8 LC_MESSAGES=pt_BR.UTF-8 [7] LC_PAPER=C LC_NAME=C [9] LC_ADDRESS=C LC_TELEPHONE=C [11] LC_MEASUREMENT=pt_BR.UTF-8 LC_IDENTIFICATION=C attached base packages: [1] stats graphics grDevices utils datasets methods base other attached packages: [1] plyr_1.8
À disposição. Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 skype: walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================

Walmes, Ok, obrigado! Achei que poderia ser um bug no meu R novo (instalei hoje) ou no pacote. (Vou tentar verificar a origem um hora dessas...) Achei muito bom seu script! Tenho apenas algumas observações quanto a forma da apresentação, já que e finalidade é didática. Tenho feito esforços junto aos meus estudantes e colegas para que os scripts em R sejam scritos o mais indentados possível para facilitar a leitura e a compreensão apenas com a leitura, sem rodar no R. Veja observação no final do script em anexo. Sei que não é elegante anexar scripts em listas, mas não gostaria que esse perdesse a forma, por isso estou anexando. Ab, 2013/10/12 walmes . <walmeszeviani@gmail.com>:
Faria,
Essas mensagens de aviso também aparecem para mim em todas as máquinas que uso. Para ser sincero eu não sei a causa delas mas não comprometeram os resultados. Eu uso a ldply() com frequência e mensagens de aviso são comuns. Sempre que chequei os resultados não vi problema. A apesar do uso frequente não descobri a causa ainda.
sessionInfo() R version 3.0.1 (2013-05-16) Platform: i686-pc-linux-gnu (32-bit)
locale: [1] LC_CTYPE=pt_BR.UTF-8 LC_NUMERIC=C [3] LC_TIME=pt_BR.UTF-8 LC_COLLATE=pt_BR.UTF-8 [5] LC_MONETARY=pt_BR.UTF-8 LC_MESSAGES=pt_BR.UTF-8 [7] LC_PAPER=C LC_NAME=C [9] LC_ADDRESS=C LC_TELEPHONE=C [11] LC_MEASUREMENT=pt_BR.UTF-8 LC_IDENTIFICATION=C
attached base packages: [1] stats graphics grDevices utils datasets methods base
other attached packages: [1] plyr_1.8
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 skype: walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- ///\\\///\\\///\\\///\\\///\\\///\\\///\\\///\\\ Jose Claudio Faria Estatistica UESC/DCET/Brasil joseclaudio.faria at gmail.com Telefones: 55(73)3680.5545 - UESC 55(73)9100.7351 - TIM 55(73)8817.6159 - OI ///\\\///\\\///\\\///\\\///\\\///\\\///\\\///\\\

Olá pessoal boa tarde estou com uma série de dados da seguinte forma: Como faço a transformação para série temporal variando o eixo x de 2008 a 2010? tentei o seguinte comando : Porém a escala do eixo x não é satisfatório, como faço para resolver isso ? co <- ts(cocar, start=c(2008,1), frequency=12) Obrigado desde já date cocar 1 1/1/2008 0.17386886 2 2/1/2008 0.36511588 3 3/1/2008 0.46197414 4 4/1/2008 0.35033163 5 5/1/2008 0.27367459 6 6/1/2008 0.44995511 7 7/1/2008 0.64064563 8 8/1/2008 0.42046097 9 9/1/2008 0.42910289 10 10/1/2008 0.44375899 11 11/1/2008 0.39205230 12 12/1/2008 0.33392796 13 13/1/2008 0.27588982 14 14/1/2008 0.54095445 15 15/1/2008 0.69634419 16 16/1/2008 0.39713316 17 17/1/2008 0.33948242 18 18/1/2008 0.40497270 19 19/1/2008 0.32547623 20 20/1/2008 0.47162734 21 21/1/2008 0.67660774 22 22/1/2008 0.48601001 ________________________________

o parâmetro frequency é a quantidade de observações em um 'ciclo', no caso seria 365,25 (365 dos anos normais +1/4 do ano bissexto). 12 é para observações mensais... isso deve resolver 2013/10/8 geovane barbosa <geovanecb@yahoo.com.br>
Olá pessoal boa tarde estou com uma série de dados da seguinte forma:
Como faço a transformação para série temporal variando o eixo x de 2008 a 2010? tentei o seguinte comando :
Porém a escala do eixo x não é satisfatório, como faço para resolver isso ?
co <- ts(cocar, start=c(2008,1), frequency=12)
Obrigado desde já
date cocar 1 1/1/2008 0.17386886 2 2/1/2008 0.36511588 3 3/1/2008 0.46197414 4 4/1/2008 0.35033163 5 5/1/2008 0.27367459 6 6/1/2008 0.44995511 7 7/1/2008 0.64064563 8 8/1/2008 0.42046097 9 9/1/2008 0.42910289 10 10/1/2008 0.44375899 11 11/1/2008 0.39205230 12 12/1/2008 0.33392796 13 13/1/2008 0.27588982 14 14/1/2008 0.54095445 15 15/1/2008 0.69634419 16 16/1/2008 0.39713316 17 17/1/2008 0.33948242 18 18/1/2008 0.40497270 19 19/1/2008 0.32547623 20 20/1/2008 0.47162734 21 21/1/2008 0.67660774 22 22/1/2008 0.48601001
------------------------------
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
participantes (6)
-
André Figueiras Rutz
-
geovane barbosa
-
Jakson Alves de Aquino
-
Jose Claudio Faria
-
Rodrigo Coster
-
walmes .