|
Актуальность разработки, внедрения и использования модели цифровой системы скоринга клиентов для управления кредитными рисками сегодня не вызывает сомнения. Современные информационные технологии для реализации кредитного скоринга клиентов позволяют сконцентрировать на себе большую часть технической работы по сбору и обработке исходных данных и реализации алгоритмов машинного обучения. Объемы банковской информации о клиентах в ближайшие несколько лет будут возрастать, а требования к качеству и скорости ее обработки ужесточаться.
В этом исследовании проводится сравнительная оценка производительности ансамблевых алгоритмов, то есть случайного леса, XGBoost, LightGBM, CatBoost и Stacking, с точки зрения площади под кривой (AUC), рейтинга Бриера (BS) и времени работы модели. Кроме того, анализ трёх популярных базовых классификаторов, то есть, дерево решений (DT), логистическая регрессия (LR) и линейный дискриминантный анализ (LDA), которые считаются эталонами в кредитном скоринге.
Экспериментальные данные показывают, что ансамблевое обучение лучше, чем базовые классификаторы. Кроме того, Stacking выделяется среди остальных моделей.
Ключевые слова:ансамблевые методы, стекинг, кредитный скоринг, классификация
|