[R-br] Dúvida sobre variáveis categóricas

Wecsley Prates woprates em gmail.com
Ter Abr 8 18:12:25 -03 2025


Ola Eduarda

Quando usamos uma variável categórica em um modelo no R, o glm ()
automaticamente
cria *dummies* (variáveis indicadoras) para cada nível da categoria, usando
um nível como referência.

Se você percebe que *uma das categorias de Evento não é significativa* e o
processo *backward* não a remove, isso provavelmente ocorre porque a
variável inteira (Evento) é tratada como *um bloco único de variáveis dummy*,
e o step  () (método backward) trabalha removendo variáveis *inteiras*, e
não níveis individuais de fatores.
Soluções possíveis*1. Remover manualmente o nível indesejado da variável
categórica*



*Se você tem certeza de que um dos níveis (por exemplo, “Seca”) não tem
efeito relevante e deseja excluí-lo da modelagem, você pode: - Filtrar os
dados para remover os casos com esse evento;- Ou, melhor ainda, redefinir
os níveis da variável para que esse nível seja absorvido por outro (como
referência).**2. Utilizar dummies manuais e incluir apenas os níveis
desejados*

Se quiser controlar exatamente quais níveis entram no modelo.

*3. Utilizar contrastes personalizados*

Você também pode redefinir os contrastes para tratar certos níveis como
equivalentes ou excluí-los da comparação
Resumo: O método step() não remove níveis individuais de fatores. Para
excluir um nível específico de uma variável categórica, você deve manipular
a variável diretamente. Avalie se a exclusão do nível é estatisticamente
justificada (com base em p-valor, VIF, ou impacto prático). Caso o nível
represente uma pequena fração dos dados, ele pode gerar ruído ou
instabilidade — remover pode melhorar o modelo.

*                       Wecsley O. Prates*

*Phd in Statistics and **Senior Data Scientist*




On Tue, Apr 8, 2025 at 16:45 Eduarda Guarnieri por (R-br) <
r-br em listas.c3sl.ufpr.br> wrote:

> Boa tarde!
>
> Estou desenvolvendo um Modelo Linear Generalizado no R, e uma das minhas
> variáveis é categórica: Evento. Nela, são encontrados 8 níveis de eventos
> climáticos e, ao executar o glm com distribuição Gama, apenas algumas
> categorias de dentro dessa variável são significativas ao modelo. Porém,
> uma das categorias não é significativa e mesmo aplicando o método backward,
> ela não foi retirada da análise. Como posso proceder para retirá-la da
> análise?
>
> Desde já agradeço
>
> Eduarda Guarnieri
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20250408/e984739b/attachment.htm>


Mais detalhes sobre a lista de discussão R-br