[R-br] Séries Temporais dividir dados em teste e treino

Lucas Cusinato lucasbcr em gmail.com
Quinta Setembro 6 18:10:32 BRT 2012


Hugo,

Não sei se eu entendi bem seu objetivo, mas se você quer extrair 20% das
linhas de um data.frame é só indexar ele (pelas linhas) com um vetor
sorteado com a função sample().

Ex.:


dados = read.table('http://robjhyndman.com/tsdldata/data/cola.dat')

str(dados)

amostra.um.quinto = sample(1:36, round(36*0.20)) #gera um vetor de indices
que corresponde a 20% dos 36

amostra.um.quinto = sort( amostra.um.quinto ) #frescura pra ficar na mesma
ordem do inicial

um.quinto = dados[amostra.um.quinto,] #extrai as linhas amostradas

quatro.quintos = dados[-amostra.um.quinto,] #extrai as restantes


É isso que você queria mesmo?



Em 5 de setembro de 2012 09:06, Hugo Sena <hugosena em gmail.com> escreveu:

> Obrigado Alisson<http://r-br.2285057.n4.nabble.com/template/NamlServlet.jtp?macro=user_nodes&user=374633>
>
> Já tentei aplicar e não consigo. Alguém pode ajudar como se faz neste
> caso, tipo (80% de teste 20% de treino).
> Será que posso e/ou é mais fácil se dividir os dados manualmente em 2
> ficheiros?
>
> O exemplo poderá ser com estes dados.
> http://robjhyndman.com/tsdldata/data/cola.dat
>
> Já googlei e não consigo aplicar.
>
> Cumps.
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20120906/ed9f9ef5/attachment.html>


Mais detalhes sobre a lista de discussão R-br