Hugo,

Não sei se eu entendi bem seu objetivo, mas se você quer extrair 20% das linhas de um data.frame é só indexar ele (pelas linhas) com um vetor sorteado com a função sample().

Ex.:


dados = read.table('http://robjhyndman.com/tsdldata/data/cola.dat')

str(dados)

amostra.um.quinto = sample(1:36, round(36*0.20)) #gera um vetor de indices que corresponde a 20% dos 36

amostra.um.quinto = sort( amostra.um.quinto ) #frescura pra ficar na mesma ordem do inicial

um.quinto = dados[amostra.um.quinto,] #extrai as linhas amostradas

quatro.quintos = dados[-amostra.um.quinto,] #extrai as restantes


É isso que você queria mesmo?



Em 5 de setembro de 2012 09:06, Hugo Sena <hugosena@gmail.com> escreveu:
Obrigado Alisson

Já tentei aplicar e não consigo. Alguém pode ajudar como se faz neste caso, tipo (80% de teste 20% de treino).
Será que posso e/ou é mais fácil se dividir os dados manualmente em 2 ficheiros?

O exemplo poderá ser com estes dados.
http://robjhyndman.com/tsdldata/data/cola.dat

Já googlei e não consigo aplicar.

Cumps.

_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.