[R-br] Sorteio aleatório de valores e substituir por NA
ASANTOS
alexandresantosbr em yahoo.com.br
Quarta Outubro 7 18:48:31 BRT 2015
Caros Listeiros,
Estou tentando criar uma rotina para primeiro sortear 20%
de linhas de um data frame com 10 variáveis e n=100, e com o resultado
desse sorteio eu gostaria de sortear 10% dos valores independente da
variável e substituir por NA. No entanto, estou com dois problemas para
realizar isso: 1) O objeto sampl.data.10 criado que corresponde ao
sorteio de 10% dos valores não corresponde ao objeto que originou o
sorteio (sampl.n.20); e 2) Quando faço o sorteio de 10% dos valores e
substituo por NA, perco a informação do identificador da amostra ou seja
meu dados$ID, segue CRM abaixo, alguém poderia me dar um help?
#Variáveis artificiais
dados<-runif(1000)
dados<-(dados*100)+c(1:500, 500:1)
dados<-matrix(dados,nrow=50,ncol=10)
dados<-as.data.frame(dados)
names(dados)<-c("var1",
"var2","var3","var4","var5","var6","var7","var8","var9","var10")
dados$ID<-1:length(dados[,1])
dados<-as.data.frame(dados)
#Pacote
require(dplyr)
## Seleciono 20% das linhas do objeto dados
sampl.n.20<-sample_frac(dados, 0.2)
sampl.n.20
##Seleciono 10% de valores independente da variável
n.data<-0.1*(length(sampl.20[,1])*length(sampl.20[1,]))
sampl.data.10<-matrix(sample(c(NA,
sampl.20[,1]),length(sampl.20[,1])*length(sampl.20[1,]), replace =
TRUE), n.data)
sampl.data.10
Obrigado,
--
======================================================================
Alexandre dos Santos
Proteção Florestal
IFMT - Instituto Federal de Educação, Ciência e Tecnologia de Mato Grosso
Campus Cáceres
Caixa Postal 244
Avenida dos Ramires, s/n
Bairro: Distrito Industrial
Cáceres - MT CEP: 78.200-000
Fone: (+55) 65 8132-8112 (TIM) (+55) 65 9686-6970 (VIVO)
e-mails:alexandresantosbr em yahoo.com.br
alexandre.santos em cas.ifmt.edu.br
Lattes: http://lattes.cnpq.br/1360403201088680
======================================================================
Mais detalhes sobre a lista de discussão R-br