[R-br] regressão logística com wls
Andre Guimaraes
alsguimaraes em gmail.com
Terça Abril 26 19:09:26 BRT 2011
Prezados,
Busco referências sobre regressão logística binária com mínimos
quadrados ponderados (usando lrm com weights) no seguinte cenário:
1) amostra desbalanceada (n0=10000, n1=700);
2) pesos (sampling weights) para reequilibrar a amostra (w0=1, w1=14.2857); e
3) após a modelagem, ajuste do intercepto para refletir a % esperada
de 1’s na população (ex. 7% e não 50%).
Já localizei referências que tratam do último ponto, mas não
identifiquei nenhum artigo mais conclusivo, quanto ao uso dos pesos em
amostras desbalanceadas.
A área sob a curva ROC = 0.70, e a probabilidade estimada é próxima à
frequência de 1’s em diferentes faixas, o que parece satisfatório. O
teste de Hosmer & Lemeshow é não significativo, como esperado.
Alguém pode comentar a estratégia adotada, ou sugerir alguma
bibliografia específica para a questão do peso e amostra
desbalanceada?
Obrigado,
André Guimarães
Mais detalhes sobre a lista de discussão R-br