[R-br] regressão logística com wls

Andre Guimaraes alsguimaraes em gmail.com
Terça Abril 26 19:09:26 BRT 2011


Prezados,

Busco referências sobre regressão logística binária com mínimos
quadrados ponderados (usando lrm com weights) no seguinte cenário:

1) amostra desbalanceada (n0=10000, n1=700);
2) pesos (sampling weights) para reequilibrar a amostra (w0=1, w1=14.2857); e
3) após a modelagem, ajuste do intercepto para refletir a % esperada
de 1’s na população (ex. 7% e não 50%).

Já localizei referências que tratam do último ponto, mas não
identifiquei nenhum artigo mais conclusivo, quanto ao uso dos pesos em
amostras desbalanceadas.

A área sob a curva ROC = 0.70, e a probabilidade estimada é próxima à
frequência de 1’s em diferentes faixas, o que parece satisfatório. O
teste de Hosmer & Lemeshow é não significativo, como esperado.

Alguém pode comentar a estratégia adotada, ou sugerir alguma
bibliografia específica para a questão do peso e amostra
desbalanceada?

Obrigado,

André Guimarães


Mais detalhes sobre a lista de discussão R-br