[R-br] tamanho da amostra em experimentos com 4 tratamentos (proporção)

Manoel Galdino mcz.fea em gmail.com
Quinta Agosto 27 13:39:34 BRT 2015


Caros,

alguém sabe como faço para calcular o tamanho de uma amostra para um
experimento com 3 tratamentos e um controle, rodados em paralelo, para um
nível de significância de 5% e poder do teste de 80%?

A variável é uma proporção (taxa de usuários que se cadastraram num site).
Eu sei calcular o tamanho da amostra para um teste de duas proporções, mas
aqui eu quero testar quatro proporções e escolher a maior das quatro.

Eu tenho a proporção esperada de cada um dos tratamentos e controle (seja
p1 o controle, e p2, p3 e p4 o tratamento, p1 = .2, p2= .22, p3=.24 e p4 =
.3).

O caminho mais simples é calcular o tamanho da amostra para duas
proporções, considerando p1 e p4 (maior e menor, sendo que o menor é também
o controle). Mas parece que assim estou subestimando a variabilidade em p2
e p3 e a possibilidade de que eles sejam maiores que p4 e p1. Além disso,
parece haver o problema de múltiplas comparações.

Li um pouco e eu poderia tentar a correção de Bonferroni para múltiplos
experimentos, e calcular o tamanho da amostra para duas propoções com p1 e
p4, e usar alhpa_novo = alpha/m, em que alpha é o nível de significância
original (5%) e m é o número de tratamentos (4... ou seria 3?). Porém esse
método não leva em conta os valores esperados de p2 e p3, apenas p1 e p4, e
isso nåo parece certo.

Por fim, vale mebrar que o que quero é descobrir o melhor tratamento
(conversão), e nåo testar se as propoções são iguais (eu já sei que não são
exatamente iguais).

Eu fiz um script simulando para o meu caso particular vários tamanhos de
amostra, e qual a probabilidade de eu escolher o melhor tratamento [ ou
seja, prob(escolher p4| dados e que p4 é o melhor). Mas não estou seguro
nem que meu script está certo e, mais do que isso, qual a relação entre o
número de tratamtnos, e as diferenças esperadas no efeito de cada
tratamento sobre o tamanho da amostra (no caso de duas propoções, é fåcil
estabelecer quanto minha amostra aumenta pela diferença esperada entre p1 e
p2, para um dado alpha e beta).

Se alguém tiver também referência na litertatura, já ajuda.
Obrigado.

Manoel

segue o script:

n.sim <-2000 # número de simulações
mat <- matrix( nrow=n.sim, ncol=4)
n.sample <- seq(500, 5500, by=1000) # tamanho de amostras para ver taxa de
acerto para cada tamanho

## proporção de cada tratamento

## vou criar 10 combinações de proporção para 4 tratamentos

## a primeira todos os tratamentos têm a mesma proporção, igual a 20%

## me ajuda a ter uma base do resultado da simulação.

set.seed(2) # fixa a semente, para resultados serem reproduíveis

p1 <- c(.2, runif(9, .15, .3))
p2 <- c(.2, runif(9, .15, .3))
p3 <- c(.2, runif(9, .15, .3))
p4 <- c(.2, runif(9, .15, .3))

mat.p <- matrix(c(p1, p2, p3, p4), nrow=10, ncol=4, byrow=F)

# para armazenar qual é o melhor tratamento, entre 10 combinações de
efeitos diferentes dos tratamentos

maior <- numeric()

# simulação

for ( i in 1:10) maior[i] <- which.max(mat.p[i,])

mat.true.max <- matrix(nrow=length(n.sample), ncol=10)
num.true.max  <- 0

for (h in 1:6) {
  for ( k in 1:10) {
    for ( i in 1:n.sim) {
      for ( j in 1:4) {
        mat[i,j] <- sum(rbinom(n.sample[h], 1, mat.p[k,j]))
      }
      num.true.max <- num.true.max + as.numeric(which.max(mat[i,]) ==
maior[k])
    }
    mat.true.max[h,k] <- num.true.max/n.sim
    num.true.max <- 0
  }
}

# verifito taxa de acerto para cada um dos tamanhos da amostra. Acerto é
escolher a maior proporção.

mat.true.max

2015-08-24 19:04 GMT-03:00 Andre Oliveira <andreolsouza em yahoo.com.br>:

> Pessoal boa noite,
> seria de grande valia divulgar as próximas transmissões no grupo rbr.
>
> André Oliveira Souza. Graduação em Matemática, mestrado em estatística
> aplicada.Instituto Federal de Educação, Ciência e Tecnologia do Espirito
> Santo.  IFES
>
>
>
> Em Sábado, 22 de Agosto de 2015 21:26, David Feitosa <
> contato em davidfeitosa.com> escreveu:
>
>
> Eu tb achei muito boa.
>
> Sabia nem que o ShareLatex estava com integração com o R.
> Fico usando o knitr local no RStudio mesmo.
>
> Aqui em Fortaleza não há muitos usuários de R.
> Só conheço duas pessoas por aqui e uma delas sou eu. Hahaha
>
> Python tem recebido mais destaque por aqui do que o R.
> Java ainda domina desenvolvimento e pesquisa na região.
>
>
> Atenciosamente,
>
> David F.
>
> Em 22 de agosto de 2015 17:45, Luis Benites Sánchez <
> lbenitesanchez em gmail.com> escreveu:
>
> Prezado Jobenil,
>
> Muito obrigado, temos ainda mais palestras no Meetup de usuários de R em
> São Paulo, ainda temos 13 palestras mais. Em todos os meetup (se os
> palestrantes concordam) teremos as filmações das reuniões e estarão
> disponíveis no canal de YouTube do Meetup.
>
> Não esqueçam de junstar-se ao Meetup de usuários de R em São Paulo em
> nosso site www.meetup.com/pt/useR-SP/ para que possa conhecer mais
> detalhes sobre as futuras reuniões  que estão sendo realizadas no IME-USP
> (Auditório Jacy Monteiro e que são transmitidas ao vivo).
>
> A palestra do 4 e 18 de setembro que minha colega e esposa Rocío Maehara
> comentou em seu e-mail serão de 14 a 16 horas (sextas).
>
> Um abraço
>
> Luis Benites Sánchez
> Organizador del Meetup de usuários de R em São Paulo
>
>
> 2015-08-22 17:26 GMT-03:00 Jobenil - Gmail <pjobenil em gmail.com>:
>
> Prezados,
>
> Acabei de assistir à apresentação dos Professores Paulo, Walmes e
> Fernando. Parabéns pelo evento e aos organizadores do Meetup pela
> iniciativa.
> Este é uma grande oportunidade para quem trabalha isolado em alguns
> rincões do país a fora.
> Abraços
> Jobenil Júnior
>
>
> *De:* R-br [mailto:r-br-bounces em listas.c3sl.ufpr.br] *Em nome de *Luiz
> Roberto Martins Pinto
> *Enviada em:* sexta-feira, 21 de agosto de 2015 19:27
> *Para:* r-br em listas.c3sl.ufpr.br
> *Assunto:* Re: [R-br] (Transmissão ao vivo) Meetup R São Paulo Users
> Group (IME-USP) Sexta 21 de agosto do 2015
>
> Walmes,
>
> Agradeço o link.
>
> Tive dificuldades para acessar. E ainda não entendi o que aconteceu.
>
> Luiz Roberto.
>
> Luiz Roberto Martins Pinto
> Prof. Pleno/DCET/UESC
> Laboratório de Estatística Computacional
> Universidade Estadual de Santa Cruz
> Ilhéus-Bahia-Brasil
>
> luizroberto.uesc em gmail.com
> skype: lrmpinto
> http://lattes.cnpq.br/2732314327604831
>
>
> Em 21 de agosto de 2015 16:54, Walmes Zeviani <walmeszeviani em gmail.com>
> escreveu:
>
> Para os que não estiveram presentes, passaram por dificuldades ou querer
> rever, o vídeo também está disponível em
> https://www.youtube.com/watch?v=UgPX49gkby4. Caso interessar, o endereço
> memorizável do canal é http://www.leg.ufpr.br/youtube, e o perfil na
> Google+ é http://www.leg.ufpr.br/g+.
> À disposição.
> Walmes.
>>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
>
>
>
> --
>
> Luis B. Sánchez
> Ph.D Candidate
> Dept. of Statistics-IME, University at São Paulo (USP)
> São Paulo, BRAZIL
> lsanchez em ime.usp.br
> Skype: lbenitesanchez
> Twitter: @lbenitesanchez
> www.luis-benites.com/
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>



-- 
Manoel Galdino
https://sites.google.com/site/galdinomcz/
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20150827/333ef22e/attachment.html>


Mais detalhes sobre a lista de discussão R-br