[R-br] Sub-amostragem

Graciliano Galdino ggaldino em gmail.com
Segunda Agosto 29 09:47:54 BRT 2016


Muito legal! Já passei por essa necessidade e não soube como resolver.

Aí, gostaria de fazer uma pergunta em cima dessa. Como fazer para repetir
essa sub-amostragem automaticamente? Tipo fazer 300,500,... sub-amostras?

Em 29 de agosto de 2016 07:50, Marcos Bissoli via R-br <
r-br em listas.c3sl.ufpr.br> escreveu:

> Bom dia,
>
> Muito obrigado. Simples e suficiente para resolver meu problema.
>
> Ainda fico na dúvida do porquê daquele meu código dar erro no banco de
> 1600 observações e não em amostras menores.
>
> Algo mais sobre o assunto encontrei em:
>
> http://www.statmethods.net/management/subset.html
>
> Saudações,
>
> Marcos
>
> Em 28 de agosto de 2016 21:40, salah <salah3.1416 em gmail.com> escreveu:
>
>> Caro,
>>
>> segue sugestão:
>>
>> Id <- 1:20
>> X <- c("A","B","A","C","A","A","B","A","C","A","A","B","A","C","A
>> ","A","B","A","C","A")
>> Dados <- data.frame(Id,X)
>> IdDados <- sample(Dados$Id,5,replace = FALSE)
>>
>> DadosAm = subset(Dados, Id %in% IdDados)
>> DadosAm
>>
>> saudações
>>
>> Em Dom, Ago 28, 2016 em 8:29 , Marcos Bissoli via R-br <
>> r-br em listas.c3sl.ufpr.br> escreveu:
>>
>> Prezados,
>>
>> Peço desculpas de antemão se meu problema é de extrema trivialidade ou se
>> o tema já fora aqui debatido. No entanto, pesquisei os arquivos do fórum e
>> não encontrei, dessa vez, uma solução.
>>
>> Gerei um código simplificado de meu problema. Meu intuito é extrair uma
>> sub-amostra de uma amostra de dados já coletados para fins de análise com
>> melhor equilíbrio entre os grupos observados. Assim, elaborei algo
>> semelhante com o abaixo.
>>
>> Id <- 1:20
>> X <- c("A","B","A","C","A","A","B","A","C","A","A","B","A","C","A
>> ","A","B","A","C","A")
>> Dados <- data.frame(Id,X)
>> IdDados <- sample(Dados$Id,5,replace = FALSE)
>> DadosAm <- Dados[id==IdDados[1],]
>> for (i in 2:5) DadosAm <- rbind(DadosAm,Dados[id==IdDados[i],])
>> DadosAm
>>
>> Este código funciona, e consigo extrair uma sub-amostra aleatória de n1=5
>> a partir de uma amostra inicial de n=20 em data.frame.
>>
>> No entanto, meu real problema é gerar uma sub-amostra de n1=88 em uma
>> amostra inicial de n=1668. Mas, quando tento fazer com tais dimensões a
>> sub-amostra gera uma série de NA's, que não existem na amostra original.
>>
>> Chequei o funcionamento na amostra real e maior, e percebi que o primeiro
>> Id de IdDados não corresponde ao Id de Dados adicionado já no primeiro
>> comando de criação de DadosAm.
>>
>> Creio que seja algum erro meu de implementação, mas cheguei a fazer
>> testes com simulações de n e n1 maiores e deram certo. Mas quando vou para
>> o meu banco real permanece o problema.
>>
>> Desde já, agradeço qualquer ajuda, e reitero minhas desculpas pela
>> possível trivialidade da dúvida.
>>
>> Saudações acadêmicas,
>>
>>
>> --
>> MARCOS BISSOLI
>>
>> Faculdade de Nutrição
>> Universidade Federal de Alfenas
>>
>> Blog: bocademiamaldita.blogspot.com/
>> E-mail: mbissoli em gmail.com
>> Twitter: #mbissoli
>>
>> Alfenas, Minas Gerais, Brasil
>>
>>
>> *****Pense na Natureza antes de Imprimir*****
>> Divulgue ON-LINE
>>
>> Eu apoio a ENEN "na luta por um Brasil sem fome"
>>
>> "por ĉiu popolo ties propran lingvon, por ĉiuj popoloj la esperantan"
>> (para cada povo sua própria língua, para todos os povos o Esperanto)
>>
>> E nunca votarei no PSDB/DEM!
>>
>>
>
>
> --
> MARCOS BISSOLI
>
> Faculdade de Nutrição
> Universidade Federal de Alfenas
>
> Blog: bocademiamaldita.blogspot.com/
> E-mail: mbissoli em gmail.com
> Twitter: #mbissoli
>
> Alfenas, Minas Gerais, Brasil
>
>
> *****Pense na Natureza antes de Imprimir*****
> Divulgue ON-LINE
>
> Eu apoio a ENEN "na luta por um Brasil sem fome"
>
> "por ĉiu popolo ties propran lingvon, por ĉiuj popoloj la esperantan"
> (para cada povo sua própria língua, para todos os povos o Esperanto)
>
> E nunca votarei no PSDB/DEM!
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>



-- 
Graciliano Galdino A. dos Santos
Biólogo
Doutorando em Ciências Florestais - PPGCF
Universidade Federal Rural da Amazônia - UFRA
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20160829/b5b0afa1/attachment.html>


Mais detalhes sobre a lista de discussão R-br