
Prezados, Peço desculpas de antemão se meu problema é de extrema trivialidade ou se o tema já fora aqui debatido. No entanto, pesquisei os arquivos do fórum e não encontrei, dessa vez, uma solução. Gerei um código simplificado de meu problema. Meu intuito é extrair uma sub-amostra de uma amostra de dados já coletados para fins de análise com melhor equilíbrio entre os grupos observados. Assim, elaborei algo semelhante com o abaixo. Id <- 1:20 X <- c("A","B","A","C","A","A","B","A","C","A","A","B","A","C","A","A","B","A","C","A") Dados <- data.frame(Id,X) IdDados <- sample(Dados$Id,5,replace = FALSE) DadosAm <- Dados[id==IdDados[1],] for (i in 2:5) DadosAm <- rbind(DadosAm,Dados[id==IdDados[i],]) DadosAm Este código funciona, e consigo extrair uma sub-amostra aleatória de n1=5 a partir de uma amostra inicial de n=20 em data.frame. No entanto, meu real problema é gerar uma sub-amostra de n1=88 em uma amostra inicial de n=1668. Mas, quando tento fazer com tais dimensões a sub-amostra gera uma série de NA's, que não existem na amostra original. Chequei o funcionamento na amostra real e maior, e percebi que o primeiro Id de IdDados não corresponde ao Id de Dados adicionado já no primeiro comando de criação de DadosAm. Creio que seja algum erro meu de implementação, mas cheguei a fazer testes com simulações de n e n1 maiores e deram certo. Mas quando vou para o meu banco real permanece o problema. Desde já, agradeço qualquer ajuda, e reitero minhas desculpas pela possível trivialidade da dúvida. Saudações acadêmicas, -- MARCOS BISSOLI Faculdade de Nutrição Universidade Federal de Alfenas Blog: bocademiamaldita.blogspot.com/ E-mail: mbissoli@gmail.com Twitter: #mbissoli Alfenas, Minas Gerais, Brasil *****Pense na Natureza antes de Imprimir***** Divulgue ON-LINE Eu apoio a ENEN "na luta por um Brasil sem fome" "por ĉiu popolo ties propran lingvon, por ĉiuj popoloj la esperantan" (para cada povo sua própria língua, para todos os povos o Esperanto) E nunca votarei no PSDB/DEM!