[R-br] Sub-amostragem

Leonardo Fontenelle leonardof em leonardof.med.br
Segunda Agosto 29 09:54:22 BRT 2016


Com ou sem reposição?

De qualquer forma, vai envolver um loop com o cálculo e armazenamento
de alguma estimativa para depois analisar tudo. Você pode usar um
único comando sample antes do loop, ou então usá-lo novamente a cada
iteração do loop.

Leonardo Ferreira Fontenelle[1]


Em Seg 29 ago. 2016, às 09:47, Graciliano Galdino via R-br escreveu:
> Muito legal! Já passei por essa necessidade e não soube como resolver.
>
> Aí, gostaria de fazer uma pergunta em cima dessa. Como fazer para
> repetir essa sub-amostragem automaticamente? Tipo fazer 300,500,...
> sub-amostras?
>
> Em 29 de agosto de 2016 07:50, Marcos Bissoli via R-br <r-
> br em listas.c3sl.ufpr.br> escreveu:
>> Bom dia,
>>
>> Muito obrigado. Simples e suficiente para resolver meu problema.
>>
>> Ainda fico na dúvida do porquê daquele meu código dar erro no banco
>> de 1600 observações e não em amostras menores.
>>
>> Algo mais sobre o assunto encontrei em:
>>
>> http://www.statmethods.net/management/subset.html
>>
>> Saudações,
>>
>> Marcos
>>
>> Em 28 de agosto de 2016 21:40, salah <salah3.1416 em gmail.com>
>> escreveu:
>>> Caro,
>>>
>>> segue sugestão:
>>>
>>>
>>> Id <- 1:20
>>> X <- c("A","B","A","C","A","A","B","A","C","A","A","B","A","C","A",-
>>> "A","B","A","C","A")
>>> Dados <- data.frame(Id,X)
>>> IdDados <- sample(Dados$Id,5,replace = FALSE)
>>>
>>>
>>> DadosAm = subset(Dados, Id %in% IdDados)
>>> DadosAm
>>>
>>> saudações
>>>
>>> Em Dom, Ago 28, 2016 em 8:29 , Marcos Bissoli via R-br <r-
>>> br em listas.c3sl.ufpr.br> escreveu:
>>>
>>>> Prezados,
>>>>
>>>> Peço desculpas de antemão se meu problema é de extrema trivialidade
>>>> ou se o tema já fora aqui debatido. No entanto, pesquisei os
>>>> arquivos do fórum e não encontrei, dessa vez, uma solução.
>>>>
>>>> Gerei um código simplificado de meu problema. Meu intuito é extrair
>>>> uma sub-amostra de uma amostra de dados já coletados para fins de
>>>> análise com melhor equilíbrio entre os grupos observados. Assim,
>>>> elaborei algo semelhante com o abaixo.
>>>>
>>>> Id <- 1:20
>>>> X <- c("A","B","A","C","A","A","B","A","C","A","A","B","A","C","A"-
>>>> ,"A","B","A","C","A")
>>>> Dados <- data.frame(Id,X)
>>>> IdDados <- sample(Dados$Id,5,replace = FALSE)
>>>> DadosAm <- Dados[id==IdDados[1],]
>>>> for (i in 2:5) DadosAm <- rbind(DadosAm,Dados[id==IdDados[i],])
>>>> DadosAm
>>>>
>>>> Este código funciona, e consigo extrair uma sub-amostra aleatória
>>>> de n1=5 a partir de uma amostra inicial de n=20 em data.frame.
>>>>
>>>> No entanto, meu real problema é gerar uma sub-amostra de n1=88 em
>>>> uma amostra inicial de n=1668. Mas, quando tento fazer com tais
>>>> dimensões a sub-amostra gera uma série de NA's, que não existem na
>>>> amostra original.
>>>>
>>>> Chequei o funcionamento na amostra real e maior, e percebi que o
>>>> primeiro Id de IdDados não corresponde ao Id de Dados adicionado já
>>>> no primeiro comando de criação de DadosAm.
>>>>
>>>> Creio que seja algum erro meu de implementação, mas cheguei a fazer
>>>> testes com simulações de n e n1 maiores e deram certo. Mas quando
>>>> vou para o meu banco real permanece o problema.
>>>>
>>>> Desde já, agradeço qualquer ajuda, e reitero minhas desculpas pela
>>>> possível trivialidade da dúvida.
>>>>
>>>> Saudações acadêmicas,
>>>>
>>>>
>>>> --
>>>> MARCOS BISSOLI
>>>> Faculdade de Nutrição
>>>> Universidade Federal de Alfenas
>>>>
>>>> Blog: bocademiamaldita.blogspot.com/
>>>> E-mail: mbissoli em gmail.com
>>>> Twitter: #mbissoli
>>>>
>>>> Alfenas, Minas Gerais, Brasil
>>>>
>>>>
>>>> *****Pense na Natureza antes de Imprimir*****
>>>> Divulgue ON-LINE
>>>>
>>>> Eu apoio a ENEN "na luta por um Brasil sem fome"
>>>>
>>>> "por ĉiu popolo ties propran lingvon, por ĉiuj popoloj la
>>>> esperantan"
>>>> (para cada povo sua própria língua, para todos os povos o
>>>> Esperanto)
>>>>
>>>> E nunca votarei no PSDB/DEM!
>>
>>
>>
>> --
>> MARCOS BISSOLI
>> Faculdade de Nutrição
>> Universidade Federal de Alfenas
>>
>> Blog: bocademiamaldita.blogspot.com/
>> E-mail: mbissoli em gmail.com
>> Twitter: #mbissoli
>>
>> Alfenas, Minas Gerais, Brasil
>>
>>
>> *****Pense na Natureza antes de Imprimir*****
>> Divulgue ON-LINE
>>
>> Eu apoio a ENEN "na luta por um Brasil sem fome"
>>
>> "por ĉiu popolo ties propran lingvon, por ĉiuj popoloj la esperantan"
>> (para cada povo sua própria língua, para todos os povos o Esperanto)
>>
>> E nunca votarei no PSDB/DEM!
>>
>> _______________________________________________
>>  R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>  Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>  código mínimo reproduzível.
>
>
>
> --
> Graciliano Galdino A. dos Santos Biólogo
> Doutorando em Ciências Florestais - PPGCF
> Universidade Federal Rural da Amazônia - UFRA
> _________________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.

Links:

  1. http://lattes.cnpq.br/9234772336296638
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20160829/6bb3da88/attachment.html>


Mais detalhes sobre a lista de discussão R-br