
Em 31/10/2011 18:32, Jose Claudio Faria escreveu:
Em 31 de outubro de 2011 15:39, Cesar Rabak<cesar.rabak@gmail.com> escreveu:
José Cláudio,
O texto que você cita não abona o uso do teste de qui-quadrado para freqüências relativas.
Foi exatamente a minha interpretação!
Se você pensar bem, isso vem da própria natureza do teste que usa a distribuição qui-quadrado.
Imagine o famoso exemplo do número de nascimentos de crianças em dois hospitais: um de uma cidade pequena com dez nascimentos por semana e um de uma grande metrópole com cem nascimentos por semana.
O exemplo é muito bom!
No caso da cidade pequena, numa certa semana houve seis nascimentos de meninas e quatro de meninos;
No caso da cidade grande numa certa semana houve sessenta nascimentos de meninas e quarenta de meninos.
embora as proporções sejam iguais, o p-valor do teste para o 1º caso é 0,52 e para o segundo 0,045!!
No meu entendimento os testes feitos assim significam coisas diferentes: 1. Com os valores aobsolutos, testa a independência de linhas e colunas.
Na verdade, você pode testar mais do que a independência. Se você tiver uma distribuição de frequências esperadas você pode testar as suas observações contra ela. Dois exemplos são a distribuição de resultados do jogo simultâneo de dois dados (onde o sete passa a ser o número mais frequente) ou a distribuição dos tipos de sangue de uma determinada população.
2. Com os dados em proporção testa a similaridade dos hospitais, ou seja, se o nacimento de meninos e meninas independe do tamanho da cidade.
Lamento: sem o "tamanho da cidade" == população, você estará brincando de cabra cega com o intervalo de confiança das suas proporções. Imagine o problema das proporções como as pesquisas de intenção de voto: para determinar o erro padrão você precisa do tamanho da amostra...
Conclusão: Se proporções fossem usadas, você poderia escolher o seu p-valor bastando escolher a base da proporção!
Não entendi muito bem a frase acima... poderia explanar de outra forma?
Dado que as proporções podem ser feitas em cima de uma base arbitrária, duas avaliações sobre as mesmas proporções podem dar p-valores diferentes, ora ultimadamente a escolha da base permitiria "decidir" qual p-valor obter...
meus 0,0199....
Nas esquinas da vida qualquer contribuição já alegra o dia...
Ivan,
Aproveitando o gancho do Cesar: Acho que é mais por ai: o objetivo é testar a distribuição dos estágios vegetativos de 4 ambientes (2 hospitais no exemplo do cesar) (que são muito diferentes em termos de tamanho e abundância absoluta) em relação a 4 variáveis preditoras (os estágios vegetativos). Ou seja, o que importa é saber, independente do tamanho do ambiente (cidade no exemplo do Cesar), se a distribuição dos estágios (meninos e meninas no exemplo do Cesar) diferem ou não.
Ab,
-- Cesar Rabak GNU/Linux User 52247. Get counted: http://counter.li.org/