[R-br] Tabela de contingẽncia com freq. relativa: dúvida sobre validade teste qui-quadrado
Cesar Rabak
cesar.rabak em gmail.com
Terça Novembro 1 12:00:22 BRST 2011
Em 31/10/2011 18:32, Jose Claudio Faria escreveu:
> Em 31 de outubro de 2011 15:39, Cesar Rabak<cesar.rabak em gmail.com> escreveu:
>> José Cláudio,
>>
>> O texto que você cita não abona o uso do teste de qui-quadrado para
>> freqüências relativas.
>
> Foi exatamente a minha interpretação!
>
>> Se você pensar bem, isso vem da própria natureza do teste que usa a
>> distribuição qui-quadrado.
>>
>> Imagine o famoso exemplo do número de nascimentos de crianças em dois
>> hospitais: um de uma cidade pequena com dez nascimentos por semana e um de
>> uma grande metrópole com cem nascimentos por semana.
>
> O exemplo é muito bom!
>
>> No caso da cidade pequena, numa certa semana houve seis nascimentos de
>> meninas e quatro de meninos;
>>
>> No caso da cidade grande numa certa semana houve sessenta nascimentos de
>> meninas e quarenta de meninos.
>>
>> embora as proporções sejam iguais, o p-valor do teste para o 1º caso é 0,52
>> e para o segundo 0,045!!
>
> No meu entendimento os testes feitos assim significam coisas diferentes:
> 1. Com os valores aobsolutos, testa a independência de linhas e colunas.
Na verdade, você pode testar mais do que a independência. Se você tiver
uma distribuição de frequências esperadas você pode testar as suas
observações contra ela.
Dois exemplos são a distribuição de resultados do jogo simultâneo de
dois dados (onde o sete passa a ser o número mais frequente) ou a
distribuição dos tipos de sangue de uma determinada população.
> 2. Com os dados em proporção testa a similaridade dos hospitais, ou
> seja, se o nacimento de meninos e meninas independe do tamanho da
> cidade.
Lamento: sem o "tamanho da cidade" == população, você estará brincando
de cabra cega com o intervalo de confiança das suas proporções.
Imagine o problema das proporções como as pesquisas de intenção de voto:
para determinar o erro padrão você precisa do tamanho da amostra...
>
>> Conclusão: Se proporções fossem usadas, você poderia escolher o seu p-valor
>> bastando escolher a base da proporção!
>
> Não entendi muito bem a frase acima... poderia explanar de outra forma?
Dado que as proporções podem ser feitas em cima de uma base arbitrária,
duas avaliações sobre as mesmas proporções podem dar p-valores
diferentes, ora ultimadamente a escolha da base permitiria "decidir"
qual p-valor obter...
>
>> meus 0,0199....
>
> Nas esquinas da vida qualquer contribuição já alegra o dia...
>
> Ivan,
>
> Aproveitando o gancho do Cesar:
> Acho que é mais por ai: o objetivo é testar a distribuição dos
> estágios vegetativos de 4 ambientes (2 hospitais no exemplo do cesar)
> (que são muito diferentes em termos de tamanho e abundância absoluta)
> em relação a 4 variáveis preditoras (os estágios vegetativos). Ou
> seja, o que importa é saber, independente do tamanho do ambiente
> (cidade no exemplo do Cesar), se a distribuição dos estágios (meninos
> e meninas no exemplo do Cesar) diferem ou não.
>
> Ab,
--
Cesar Rabak
GNU/Linux User 52247.
Get counted: http://counter.li.org/
Mais detalhes sobre a lista de discussão R-br