Search button

Models for the probability of mortgage deafults

Aluno: Mariana Dos Santos Ribeiro Dias


Resumo
A previsão de incumprimento de crédito hipotecário é uma tarefa crítica para as instituições financeiras, sendo essencial identificar com precisão os mutuários de alto risco para mitigar perdas financeiras e garantir práticas de concessão de crédito responsáveis. Modelos tradicionais de scoring de crédito, como a regressão logística, são amplamente utilizados, mas frequentemente falham em capturar padrões complexos no comportamento dos mutuários, especialmente quando os dados estão fortemente desbalanceados. Esta tese aplica Regressão Logística, Random Forest, Extreme Gradient Boosting (XGBoost) e Light Gradient-Boosting Machine (LightGBM) a dados de incumprimento de crédito hipotecário, utilizando várias técnicas de seleção de variáveis, e estratégias para lidar com o desbalanceamento dos dados. A calibração é também aplicada através de Platt Scaling e Isotonic Regression, sendo posteriormente avaliados os respetivos desempenhos. Adicionalmente, é investigado o comportamento do Model-Agnostic Prediction Interval Estimation (MAPIE), no contexto da previsão de incumprimento hipotecário. Através da utilização do MAPIE, este estudo avalia a sua capacidade de fornecer estimativas de incerteza robustas e intervalos preditivos fiáveis para a classificação de incumprimento. Os resultados obtidos demonstram que, para este conjunto de dados, os modelos de boosting, em particular o XGBoost, superam a Regressão Logística na previsão de incumprimento hipotecário. As técnicas híbridas de reamostragem revelaram-se mais benéficas para o modelo Random Forest, enquanto que os métodos de boosting lidam melhor com este problema através de parâmetros internos. A Regressão Isotónica revelou-se eficaz para algoritmos tree-based, enquanto o Platt Scaling apresentou melhores resultados com a Regressão Logística. Na utilização do Model-Agnostic Prediction Interval Estimation (MAPIE), o equilíbrio entre a cobertura e a largura do intervalo revelou-se um desafio, tornando necessária a utilização de outra métrica que considerasse ambos os aspetos: Exact Match Rate. Estes resultados destacam a importância de combinar técnicas avançadas de machine learning com calibração e quantificação de incerteza, de modo a melhorar a avaliação de risco nas instituições financeiras, oferecendo uma abordagem mais fiável e data-driven na tomada de decisões relativas à cedência de crédito.


Trabalho final de Mestrado