
Boa tarde! Estou desenvolvendo um Modelo Linear Generalizado no R, e uma das minhas variáveis é categórica: Evento. Nela, são encontrados 8 níveis de eventos climáticos e, ao executar o glm com distribuição Gama, apenas algumas categorias de dentro dessa variável são significativas ao modelo. Porém, uma das categorias não é significativa e mesmo aplicando o método backward, ela não foi retirada da análise. Como posso proceder para retirá-la da análise? Desde já agradeço Eduarda Guarnieri

Ola Eduarda Quando usamos uma variável categórica em um modelo no R, o glm () automaticamente cria *dummies* (variáveis indicadoras) para cada nível da categoria, usando um nível como referência. Se você percebe que *uma das categorias de Evento não é significativa* e o processo *backward* não a remove, isso provavelmente ocorre porque a variável inteira (Evento) é tratada como *um bloco único de variáveis dummy*, e o step () (método backward) trabalha removendo variáveis *inteiras*, e não níveis individuais de fatores. Soluções possíveis*1. Remover manualmente o nível indesejado da variável categórica* *Se você tem certeza de que um dos níveis (por exemplo, “Seca”) não tem efeito relevante e deseja excluí-lo da modelagem, você pode: - Filtrar os dados para remover os casos com esse evento;- Ou, melhor ainda, redefinir os níveis da variável para que esse nível seja absorvido por outro (como referência).**2. Utilizar dummies manuais e incluir apenas os níveis desejados* Se quiser controlar exatamente quais níveis entram no modelo. *3. Utilizar contrastes personalizados* Você também pode redefinir os contrastes para tratar certos níveis como equivalentes ou excluí-los da comparação Resumo: O método step() não remove níveis individuais de fatores. Para excluir um nível específico de uma variável categórica, você deve manipular a variável diretamente. Avalie se a exclusão do nível é estatisticamente justificada (com base em p-valor, VIF, ou impacto prático). Caso o nível represente uma pequena fração dos dados, ele pode gerar ruído ou instabilidade — remover pode melhorar o modelo. * Wecsley O. Prates* *Phd in Statistics and **Senior Data Scientist* On Tue, Apr 8, 2025 at 16:45 Eduarda Guarnieri por (R-br) < r-br@listas.c3sl.ufpr.br> wrote:
Boa tarde!
Estou desenvolvendo um Modelo Linear Generalizado no R, e uma das minhas variáveis é categórica: Evento. Nela, são encontrados 8 níveis de eventos climáticos e, ao executar o glm com distribuição Gama, apenas algumas categorias de dentro dessa variável são significativas ao modelo. Porém, uma das categorias não é significativa e mesmo aplicando o método backward, ela não foi retirada da análise. Como posso proceder para retirá-la da análise?
Desde já agradeço
Eduarda Guarnieri _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Eduarda, O fato de um *nível* da variável que foi considerada na GLM ser tachada como "não significante" é apenas o jeito que a matemática da regressão tem de dizer que nessa categoria a média dela não se distingue da média geral, e portanto dever-se-ia examinar a cousa como um todo antes de querer descartá-la. O uso de técnicas automatizadas, incluindo a *backward* tem sido mais e mais criticada por diversos autores que nos avisam que elas podem não levar em conta aspectos do domínio do problema. A sugestão indicada por Wecsley, tecnicamente correta, fará com se perca os casos desse nível, diminuindo os graus de liberdade da regressão. Portanto é um compromisso a ser feito. Outrossim, do ponto de vista do processo físico (não matemático) a ser modelado a sua retirada fará com que a análise não leve em conta ("desconheça") essa realidade fática dos fenômenos que se está estudando. HTH -- Cesar Rabak On Tue, Apr 8, 2025 at 5:45 PM Eduarda Guarnieri por (R-br) < r-br@listas.c3sl.ufpr.br> wrote:
Boa tarde!
Estou desenvolvendo um Modelo Linear Generalizado no R, e uma das minhas variáveis é categórica: Evento. Nela, são encontrados 8 níveis de eventos climáticos e, ao executar o glm com distribuição Gama, apenas algumas categorias de dentro dessa variável são significativas ao modelo. Porém, uma das categorias não é significativa e mesmo aplicando o método backward, ela não foi retirada da análise. Como posso proceder para retirá-la da análise?
Desde já agradeço
Eduarda Guarnieri _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
participantes (3)
-
Cesar Rabak
-
Eduarda Guarnieri
-
Wecsley Prates