Discretizando uma variável contínua no chisq.test

Caros Listeiros, Gostaria de comparar valores entre parcelas observadas e estimadas para saber a similaridade ou não entre dados estimados vs observados. No entanto, as variáveis observadas são dados de contagem e os dados estimados são variáveis contínuas, então minha dúvida é se violo algum pressuposto estatístico ao discretizar os dados estimados com a função round() para realizar o teste de Chi-quadrado? Segue CRM: ## Comparação entre parcelas estimadas e observadas # #Dados das parcelas observadas - Dados de contagem data.obs<-c(11, 8, 8, 8, 7, 14) # #Medias estimadas para as parcelas observadas - Dados contínuos data.est<-c(14.6,16.0, 19.1, 3.4, 9.4, 15.8) # #Distretizando as médias estimadas tr.data.est<-round(data.est) # #Comparando parcelas observadas e estimadas chisq.test(x=tr.data.est, y=data.obs, simulate.p.value=TRUE) Obrigado, -- ====================================================================== Alexandre dos Santos Proteção Florestal IFMT - Instituto Federal de Educação, Ciência e Tecnologia de Mato Grosso Campus Cáceres Caixa Postal 244 Avenida dos Ramires, s/n Bairro: Distrito Industrial Cáceres - MT CEP: 78.200-000 Fone: (+55) 65 8132-8112 (TIM) (+55) 65 9686-6970 (VIVO) e-mails:alexandresantosbr@yahoo.com.br alexandre.santos@cas.ifmt.edu.br Lattes: http://lattes.cnpq.br/1360403201088680 ====================================================================== --- Este email foi escaneado pelo Avast antivírus. http://www.avast.com

Alexandre, Você nos dá poucos detalhes para entender porque as "médias" estimadas são denominadas assim e o qu 2014-12-17 22:57 GMT-02:00 ASANTOS <alexandresantosbr@yahoo.com.br>:
Caros Listeiros,
Gostaria de comparar valores entre parcelas observadas e estimadas para saber a similaridade ou não entre dados estimados vs observados. No entanto, as variáveis observadas são dados de contagem e os dados estimados são variáveis contínuas, então minha dúvida é se violo algum pressuposto estatístico ao discretizar os dados estimados com a função round() para realizar o teste de Chi-quadrado? Segue CRM:
## Comparação entre parcelas estimadas e observadas # #Dados das parcelas observadas - Dados de contagem data.obs<-c(11, 8, 8, 8, 7, 14) # #Medias estimadas para as parcelas observadas - Dados contínuos data.est<-c(14.6,16.0, 19.1, 3.4, 9.4, 15.8) # #Distretizando as médias estimadas tr.data.est<-round(data.est) # #Comparando parcelas observadas e estimadas chisq.test(x=tr.data.est, y=data.obs, simulate.p.value=TRUE)
Obrigado,
-- ====================================================================== Alexandre dos Santos Proteção Florestal IFMT - Instituto Federal de Educação, Ciência e Tecnologia de Mato Grosso Campus Cáceres Caixa Postal 244 Avenida dos Ramires, s/n Bairro: Distrito Industrial Cáceres - MT CEP: 78.200-000 Fone: (+55) 65 8132-8112 (TIM) (+55) 65 9686-6970 (VIVO) e-mails:alexandresantosbr@yahoo.com.br alexandre.santos@cas.ifmt.edu.br Lattes: http://lattes.cnpq.br/1360403201088680 ======================================================================
--- Este email foi escaneado pelo Avast antivírus. http://www.avast.com
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Você nos dá poucos detalhes para entender porque as "médias" estimadas são denominadas assim e o quê exatamente você deseja testar. O teste que você quer empregar parte de uma premissa que a distribuição (tabela de contingência) das contagens deveria ser igual a algum "modelo" ou experimento parecido, e portanto cada uma das contagens deveria ter uma razão para ser contada em separado. HTH -- Cesar Rabak Por essa razão, me parece que seu experimento poderia ser melhor avaliado com um GLM considerando os dados de contagem com a distribuição apropriada (provavelmente Poisson, mas YMMV). 2014-12-17 22:57 GMT-02:00 ASANTOS <alexandresantosbr@yahoo.com.br>:
Caros Listeiros,
Gostaria de comparar valores entre parcelas observadas e estimadas para saber a similaridade ou não entre dados estimados vs observados. No entanto, as variáveis observadas são dados de contagem e os dados estimados são variáveis contínuas, então minha dúvida é se violo algum pressuposto estatístico ao discretizar os dados estimados com a função round() para realizar o teste de Chi-quadrado? Segue CRM:
## Comparação entre parcelas estimadas e observadas # #Dados das parcelas observadas - Dados de contagem data.obs<-c(11, 8, 8, 8, 7, 14) # #Medias estimadas para as parcelas observadas - Dados contínuos data.est<-c(14.6,16.0, 19.1, 3.4, 9.4, 15.8) # #Distretizando as médias estimadas tr.data.est<-round(data.est) # #Comparando parcelas observadas e estimadas chisq.test(x=tr.data.est, y=data.obs, simulate.p.value=TRUE)
Obrigado,
-- ====================================================================== Alexandre dos Santos Proteção Florestal IFMT - Instituto Federal de Educação, Ciência e Tecnologia de Mato Grosso Campus Cáceres Caixa Postal 244 Avenida dos Ramires, s/n Bairro: Distrito Industrial Cáceres - MT CEP: 78.200-000 Fone: (+55) 65 8132-8112 (TIM) (+55) 65 9686-6970 (VIVO) e-mails:alexandresantosbr@yahoo.com.br alexandre.santos@cas.ifmt.edu.br Lattes: http://lattes.cnpq.br/1360403201088680 ======================================================================
--- Este email foi escaneado pelo Avast antivírus. http://www.avast.com
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Bom dia Cesar, Ajustei um modelo de Poisson e gostaria de ver a qualidade de predição deste modelo, para isso tentei predizer em áreas não utilizadas para o ajuste do modelo o erro, então fiz: # Valores observados em campo que foram 11, 8, 8, 8, 7, 14 # Valores estimados pelo modelo para as mesmas parcelas de cima 14.6,16.0, 19.1, 3.4, 9.4, 15.8 Para comparar fiz: # Objetos para os valores observados e estimados trat<-c("obs","obs","obs","obs","obs","obs","est","est","est","est","est","est") res<-c(11, 8, 8, 8, 7, 14,14.6,16.0, 19.1, 3.4, 9.4, 15.8) ## Comparação pelo modelo GLM de Poisson mod<-glm(res~trat, family="poisson") anova(mod, test="Chi") Então encontrei que não existe diferença entre observados e estimados, mas não estou bem certo se a abordagem empregada esta correta, Obrigado, Alexandre On 06/01/2015 22:44, Cesar Rabak wrote:
#Dados das parcelas observadas - Dados de contagem data.obs<-c(11, 8, 8, 8, 7, 14) # #Medias estimadas para as parcelas observadas - Dados contínuos data.est<-c(14.6,16.0, 19.1, 3.4, 9.4, 15.8)
-- ====================================================================== Alexandre dos Santos Proteção Florestal IFMT - Instituto Federal de Educação, Ciência e Tecnologia de Mato Grosso Campus Cáceres Caixa Postal 244 Avenida dos Ramires, s/n Bairro: Distrito Industrial Cáceres - MT CEP: 78.200-000 Fone: (+55) 65 8132-8112 (TIM) (+55) 65 9686-6970 (VIVO) e-mails:alexandresantosbr@yahoo.com.br alexandre.santos@cas.ifmt.edu.br Lattes: http://lattes.cnpq.br/1360403201088680 ====================================================================== --- Este email foi escaneado pelo Avast antivírus. http://www.avast.com
participantes (2)
-
ASANTOS
-
Cesar Rabak