Hugo,
Não sei se eu entendi bem seu objetivo, mas se você quer extrair 20% das linhas de um data.frame é só indexar ele (pelas linhas) com um vetor sorteado com a função sample().
Ex.:
dados = read.table('http://robjhyndman.com/tsdldata/data/cola.dat')
str(dados)
amostra.um.quinto = sample(1:36, round(36*0.20)) #gera um vetor de indices que corresponde a 20% dos 36
amostra.um.quinto = sort( amostra.um.quinto ) #frescura pra ficar na mesma ordem do inicial
um.quinto = dados[amostra.um.quinto,] #extrai as linhas amostradas
quatro.quintos = dados[-amostra.um.quinto,] #extrai as restantes
É isso que você queria mesmo?
Obrigado Alisson
Já tentei aplicar e não consigo. Alguém pode ajudar como se faz neste caso, tipo (80% de teste 20% de treino).
Será que posso e/ou é mais fácil se dividir os dados manualmente em 2 ficheiros?
O exemplo poderá ser com estes dados.
http://robjhyndman.com/tsdldata/data/cola.dat
Já googlei e não consigo aplicar.
Cumps.
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.