Re: [R-br] Sub-amostragem

29 Ago 2016

      Muito legal! Já passei por essa necessidade e não soube como resolver.

Aí, gostaria de fazer uma pergunta em cima dessa. Como fazer para repetir
essa sub-amostragem automaticamente? Tipo fazer 300,500,... sub-amostras?

Em 29 de agosto de 2016 07:50, Marcos Bissoli via R-br <
r-br@listas.c3sl.ufpr.br> escreveu:
...
Bom dia,
Muito obrigado. Simples e suficiente para resolver meu problema.
Ainda fico na dúvida do porquê daquele meu código dar erro no banco de
1600 observações e não em amostras menores.
Algo mais sobre o assunto encontrei em:
http://www.statmethods.net/management/subset.html
Saudações,
Marcos
Em 28 de agosto de 2016 21:40, salah <salah3.1416@gmail.com> escreveu:
...
Caro,
segue sugestão:
Id <- 1:20
X <- c("A","B","A","C","A","A","B","A","C","A","A","B","A","C","A
","A","B","A","C","A")
Dados <- data.frame(Id,X)
IdDados <- sample(Dados$Id,5,replace = FALSE)
DadosAm = subset(Dados, Id %in% IdDados)
DadosAm
saudações
Em Dom, Ago 28, 2016 em 8:29 , Marcos Bissoli via R-br <
r-br@listas.c3sl.ufpr.br> escreveu:
Prezados,
Peço desculpas de antemão se meu problema é de extrema trivialidade ou se
o tema já fora aqui debatido. No entanto, pesquisei os arquivos do fórum e
não encontrei, dessa vez, uma solução.
Gerei um código simplificado de meu problema. Meu intuito é extrair uma
sub-amostra de uma amostra de dados já coletados para fins de análise com
melhor equilíbrio entre os grupos observados. Assim, elaborei algo
semelhante com o abaixo.
Id <- 1:20
X <- c("A","B","A","C","A","A","B","A","C","A","A","B","A","C","A
","A","B","A","C","A")
Dados <- data.frame(Id,X)
IdDados <- sample(Dados$Id,5,replace = FALSE)
DadosAm <- Dados[id==IdDados[1],]
for (i in 2:5) DadosAm <- rbind(DadosAm,Dados[id==IdDados[i],])
DadosAm
Este código funciona, e consigo extrair uma sub-amostra aleatória de n1=5
a partir de uma amostra inicial de n=20 em data.frame.
No entanto, meu real problema é gerar uma sub-amostra de n1=88 em uma
amostra inicial de n=1668. Mas, quando tento fazer com tais dimensões a
sub-amostra gera uma série de NA's, que não existem na amostra original.
Chequei o funcionamento na amostra real e maior, e percebi que o primeiro
Id de IdDados não corresponde ao Id de Dados adicionado já no primeiro
comando de criação de DadosAm.
Creio que seja algum erro meu de implementação, mas cheguei a fazer
testes com simulações de n e n1 maiores e deram certo. Mas quando vou para
o meu banco real permanece o problema.
Desde já, agradeço qualquer ajuda, e reitero minhas desculpas pela
possível trivialidade da dúvida.
Saudações acadêmicas,
--
MARCOS BISSOLI
Faculdade de Nutrição
Universidade Federal de Alfenas
Blog: bocademiamaldita.blogspot.com/
E-mail: mbissoli@gmail.com
Twitter: #mbissoli
Alfenas, Minas Gerais, Brasil
*****Pense na Natureza antes de Imprimir*****
Divulgue ON-LINE
Eu apoio a ENEN "na luta por um Brasil sem fome"
"por ĉiu popolo ties propran lingvon, por ĉiuj popoloj la esperantan"
(para cada povo sua própria língua, para todos os povos o Esperanto)
E nunca votarei no PSDB/DEM!
--
MARCOS BISSOLI
Faculdade de Nutrição
Universidade Federal de Alfenas
Blog: bocademiamaldita.blogspot.com/
E-mail: mbissoli@gmail.com
Twitter: #mbissoli
Alfenas, Minas Gerais, Brasil
*****Pense na Natureza antes de Imprimir*****
Divulgue ON-LINE
Eu apoio a ENEN "na luta por um Brasil sem fome"
"por ĉiu popolo ties propran lingvon, por ĉiuj popoloj la esperantan"
(para cada povo sua própria língua, para todos os povos o Esperanto)
E nunca votarei no PSDB/DEM!
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
código mínimo reproduzível.
-- 
Graciliano Galdino A. dos Santos
Biólogo
Doutorando em Ciências Florestais - PPGCF
Universidade Federal Rural da Amazônia - UFRA