Re: [R-br] Teste para decisão do número ótimo de amostra [RESOLVIDO]

Caros Alexandre e Walmes. Estou usando este teste de decisão de número de amostras para ver se minha amostragem está ok. Mas fiquei na dúvida sobre o valor 10000 da linha pop.total <- rnorm(10000, mean=20, sd=15) Vou exemplificar com dados de previsão de safra em café, no caso, são relativos a altura da planta de café. Estas medidas referem a coleta em 3 pontos da lavoura, cada ponto é composto por 5 plantas, então sd e mean são de 15 plantas. Estes 3 pontos amostrais estão dentro de uma área de 1.42 ha com 1775 plantas. sd=0.2587516 mean= 3.013333 assim acho que o valor 10000 seria 1775, ok? Posso determinar o numero de amostras para para uma área de 20 ha com 37085 plantas? Grato Hélio Em 27 de março de 2013 12:30, Hélio Gallo Rocha <heliogallorocha@gmail.com>escreveu:
Caros Alexandre e Walmes.
Estou usando este teste de decisão de número de amostras para ver se minha amostragem está ok.
Mas fiquei na dúvida sobre o valor 10000 da linha
pop.total <- rnorm(10000, mean=20, sd=15)
Vou exemplificar com dados de previsão de safra em café, no caso, são relativos a altura da planta de café. Estas medidas referem a coleta em 3 pontos da lavoura, cada ponto é composto por 5 plantas, então sd e mean são de 15 plantas. Estes 3 pontos amostrais estão dentro de uma área de 1.42 ha com 1775 plantas.
sd=0.2587516 mean= 3.013333
assim acho que o valor 10000 seria 1775, ok?
Posso determinar o numero de amostras para para uma área de 20 ha com 37085 plantas?
Grato
Hélio
Em 20 de março de 2013 18:49, ASANTOS [via R-br] < ml-node+s2285057n4658689h27@n4.nabble.com> escreveu:
Perfeito Walmes,
Era isto mesmo que eu buscava,
Abraço,
Alexandre
Em 20/03/2013 17:31, Walmes Zeviani escreveu:
Alexandre,
Segue um CMR simples:
# tamanho de amostra para medida de interesse que # é o erro absoluto ao estimar a média da população # erro = abs(média_estimada-média_verdadeira)
pop.total <- rnorm(10000, mean=20, sd=15) # população m <- mean(20) # média verdadeira i <- unique(floor(2^seq(1, 12, by=0.5))); i # tamanhos de amostra nr <- 100 # número de execuções de reamostragem fun <- function(size, pop, m){ # função que calcula o erro a partir de uma amostra x <- sample(pop, size, replace=TRUE) # retorna a diferença entre estimado e real abs(mean(x)-m) }
results1 <- sapply(i, function(j){ replicate(nr, fun(size=j, pop=pop.total, m=m)) }) str(results1) # matriz: colunas correspondem à i results2 <- colMeans(results1) # tira a média para cada i results2
plot(results2~i) plot(results2~log2(i))
# qual o tamanho de amostra para ter um erro no ponto # médio entre o máximo (quando n=1) e o mínimo (n->infinito, erro=0)
n0 <- nls(results2~A*B^(-log2(i)+1), start=list(A=1, B=1)) coef(n0)
perc <- 0.3 # erro tolerado de 30% do máximo (usuário define) xi <- -log(perc)/log(coef(n0)["B"])+1 # tamanho de amostra correspondente
plot(results2~log2(i), xlim=c(1, max(log2(i))), ylim=c(0,max(results2, coef(n0)["A"])), xlab="Tamanho da amostra (log2 unidades)", ylab="Erro absoluto médio ao estimar a média") abline(v=1, lty=2) with(as.list(coef(n0)), curve(A*B^(-x+1), add=TRUE)) with(as.list(coef(n0)), abline(h=A*c(1,perc), v=xi, lty=2, col=2))
ceiling(2^xi) # tamanho de amostra à ser considerado
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: [hidden email]<http://user/SendEmail.jtp?type=node&node=4658689&i=0> skype: walmeszeviani twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
_______________________________________________ R-br mailing list[hidden email] <http://user/SendEmail.jtp?type=node&node=4658689&i=1>https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- ====================================================================== Alexandre dos Santos Proteção Florestal Coordenador do curso Técnico em Florestas Vice Coordenador do curso de Engenharia Florestal IFMT - Instituto Federal de Educação, Ciência e Tecnologia de Mato Grosso Campus Cáceres Caixa Postal 244 Avenida dos Ramires, s/n Bairro: Distrito Industrial Cáceres - MT CEP: 78.200-000 Fone: (+55) 65 8132-8112 (TIM) (+55) 65 9686-6970 (VIVO)[hidden email] <http://user/SendEmail.jtp?type=node&node=4658689&i=2> [hidden email] <http://user/SendEmail.jtp?type=node&node=4658689&i=3> ======================================================================
_______________________________________________ R-br mailing list [hidden email] <http://user/SendEmail.jtp?type=node&node=4658689&i=4> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
------------------------------ If you reply to this email, your message will be added to the discussion below:
http://r-br.2285057.n4.nabble.com/R-br-Teste-para-decisao-do-numero-otimo-de... To unsubscribe from R-br, click here<http://r-br.2285057.n4.nabble.com/template/NamlServlet.jtp?macro=unsubscribe_by_code&node=3357982&code=aGVsaW9nYWxsb3JvY2hhQGdtYWlsLmNvbXwzMzU3OTgyfC0xMzQ3NTkwMDY4> . NAML<http://r-br.2285057.n4.nabble.com/template/NamlServlet.jtp?macro=macro_viewer&id=instant_html%21nabble%3Aemail.naml&base=nabble.naml.namespaces.BasicNamespace-nabble.view.web.template.NabbleNamespace-nabble.view.web.template.NodeNamespace&breadcrumbs=notify_subscribers%21nabble%3Aemail.naml-instant_emails%21nabble%3Aemail.naml-send_instant_email%21nabble%3Aemail.naml>
-- Hélio Gallo Rocha IFSULDEMINAS - Câmpus Muzambinho
-- Hélio Gallo Rocha IFSULDEMINAS - Câmpus Muzambinho

Depende do tipo de simulação que você vai fazer. Veja que temos basicamente 2 tipos: 1) simular baseado em reamostragem dos dados observados. No seu caso a amostra é pequena, de 15 plantas, de onde você faria um sample() com n variando. O tamanho da população é finito. 2) simular a partir da distribuição teórica considerada para a variável de interesse. No seu caso você pode simular de uma normal com n variando usando a média e variância amostral como valores paramétricos. A população seria infinita. Simular 1775 valores, que corresponde ao número de plantas, baseado no conhecimento das 15 e fazer reamostragem desses valores não é nenhum dos dois que descrevi pois 1) os 1775 não são os valores observados e 2) você vai tá simulando da distribuição teórica uma grande amostra uma única vez (finito) o que é diferente de simular várias vezes dela (infinito). À disposição. Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br skype: walmeszeviani twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================

Caro Walmes, boa tarde. Como eu já havia comentado, estou trabalhando com previsão de safra em café. Ao final do experimento iria apenas verificar qual modelo matemático melhor se ajusta, o que dá melhor correlação entre o méodo de previsão e o colhido. Mas como a variabilidade da cultura é muito grande, (CV de 50% é normal), quero verificar se minha amostragem é suficiente. Minha intenção é estudar mais a fundo amostragem, tenho como referencia o livro do COCHRAN, W. G. "Técnicas de amostragem", esgotado, terei de ir na UFLA pra xerocar. Comprei um usado do Joel Augusto Muniz (UFLA), vamos ver. Então meu conhecimento do assunto é quase zero. Li sua ultima msg, e desesperadamente não entendi quase nada do que tenho de fazer, se puder me ajudar ótimo. Mas já ajudaria me dizer se o 10000 que citei pop.total <- rnorm(10000, mean=20, sd=15) seria exatamente oque? numero de plantas da área total que quero amostrar? Pois é essa a minha preocupação, faço uma amostragem por hectare ou duas? Na realidade tenho muito mais que 15 plantas. Numa propriedade de 35 ha, amostrei 86 pontos com 5 plantas por ponto, o que dá +/- 1 ponto/ 4000m2, totalizando 430 plantas. Como ainda farei o lentamento em mais 3 propriedades, num total de 70 ha, e a variabiliadde vai ser parecida, quero otimizar minha amostragem. Fico de antemão grato pela ajuda da lista... abraço Hélio Em 27 de março de 2013 13:47, Walmes Zeviani 2 [via R-br] < ml-node+s2285057n4658754h42@n4.nabble.com> escreveu:
Depende do tipo de simulação que você vai fazer. Veja que temos basicamente 2 tipos: 1) simular baseado em reamostragem dos dados observados. No seu caso a amostra é pequena, de 15 plantas, de onde você faria um sample() com n variando. O tamanho da população é finito. 2) simular a partir da distribuição teórica considerada para a variável de interesse. No seu caso você pode simular de uma normal com n variando usando a média e variância amostral como valores paramétricos. A população seria infinita. Simular 1775 valores, que corresponde ao número de plantas, baseado no conhecimento das 15 e fazer reamostragem desses valores não é nenhum dos dois que descrevi pois 1) os 1775 não são os valores observados e 2) você vai tá simulando da distribuição teórica uma grande amostra uma única vez (finito) o que é diferente de simular várias vezes dela (infinito).
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: [hidden email]<http://user/SendEmail.jtp?type=node&node=4658754&i=0> skype: walmeszeviani twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
_______________________________________________ R-br mailing list [hidden email] <http://user/SendEmail.jtp?type=node&node=4658754&i=1> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
------------------------------ If you reply to this email, your message will be added to the discussion below:
http://r-br.2285057.n4.nabble.com/R-br-Teste-para-decisao-do-numero-otimo-de... To unsubscribe from R-br, click here<http://r-br.2285057.n4.nabble.com/template/NamlServlet.jtp?macro=unsubscribe_by_code&node=3357982&code=aGVsaW9nYWxsb3JvY2hhQGdtYWlsLmNvbXwzMzU3OTgyfC0xMzQ3NTkwMDY4> . NAML<http://r-br.2285057.n4.nabble.com/template/NamlServlet.jtp?macro=macro_viewer&id=instant_html%21nabble%3Aemail.naml&base=nabble.naml.namespaces.BasicNamespace-nabble.view.web.template.NabbleNamespace-nabble.view.web.template.NodeNamespace&breadcrumbs=notify_subscribers%21nabble%3Aemail.naml-instant_emails%21nabble%3Aemail.naml-send_instant_email%21nabble%3Aemail.naml>
-- Hélio Gallo Rocha IFSULDEMINAS - Câmpus Muzambinho
participantes (2)
-
Hélio Gallo Rocha
-
Walmes Zeviani