Re: [R-br] Séries Temporais dividir dados em teste e treino

Obrigado Alisson<http://r-br.2285057.n4.nabble.com/template/NamlServlet.jtp?macro=user_nodes&user=374633> Já tentei aplicar e não consigo. Alguém pode ajudar como se faz neste caso, tipo (80% de teste 20% de treino). Será que posso e/ou é mais fácil se dividir os dados manualmente em 2 ficheiros? O exemplo poderá ser com estes dados. http://robjhyndman.com/tsdldata/data/cola.dat Já googlei e não consigo aplicar. Cumps.

Hugo, Não sei se eu entendi bem seu objetivo, mas se você quer extrair 20% das linhas de um data.frame é só indexar ele (pelas linhas) com um vetor sorteado com a função sample(). Ex.: dados = read.table('http://robjhyndman.com/tsdldata/data/cola.dat') str(dados) amostra.um.quinto = sample(1:36, round(36*0.20)) #gera um vetor de indices que corresponde a 20% dos 36 amostra.um.quinto = sort( amostra.um.quinto ) #frescura pra ficar na mesma ordem do inicial um.quinto = dados[amostra.um.quinto,] #extrai as linhas amostradas quatro.quintos = dados[-amostra.um.quinto,] #extrai as restantes É isso que você queria mesmo? Em 5 de setembro de 2012 09:06, Hugo Sena <hugosena@gmail.com> escreveu:
Obrigado Alisson<http://r-br.2285057.n4.nabble.com/template/NamlServlet.jtp?macro=user_nodes&user=374633>
Já tentei aplicar e não consigo. Alguém pode ajudar como se faz neste caso, tipo (80% de teste 20% de treino). Será que posso e/ou é mais fácil se dividir os dados manualmente em 2 ficheiros?
O exemplo poderá ser com estes dados. http://robjhyndman.com/tsdldata/data/cola.dat
Já googlei e não consigo aplicar.
Cumps.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
participantes (2)
-
Hugo Sena
-
Lucas Cusinato