Автор Анна Евкова
Преподаватель который помогает студентам и школьникам в учёбе.

Сегментация клиентов на основе скоринговой модели

Скоринг – используемая банками система оценки клиентов, в основе которой заложены статистические методы. Как правило, это компьютерная программа, куда вводятся данные потенциального заёмщика. В ответ выдается результат – стоит ли предоставлять ему кредит. Название скоринг происходит от английского слова score, то есть «счет».

В рамках скорингового моделирования используются такие понятия как: «характеристика», «признак» (то значение, которое принимает характеристика), «весовой коэффициент» и др. В результате функционирования скоринговой модели получается некий показатель, представляющий собой взвешенную сумму определенных признаков. По уровню данного значения можно оценить надежность (платежеспосбность) клиента.

В качестве рассматриваемой модели возьмём [1].

  1. Описание модели скоринга клиентов

В качестве алгоритма часто используется случайный лес. Это множество решающих деревьев. В задаче регрессии их ответы усредняются, в задаче классификации принимается решение голосованием по большинству. Все деревья строятся независимо по следующей схеме[2]:

Выбирается подвыборка обучающей выборки размера samplesize (м.б. с возвращением) – по ней строится дерево (для каждого дерева — своя подвыборка).

Для построения каждого расщепления в дереве просматриваем max_features случайных признаков (для каждого нового расщепления — свои случайные признаки).

Выбираем наилучшие признак и расщепление по нему (по заранее заданному критерию). Дерево строится, как правило, до исчерпания выборки (пока в листьях не останутся представители только одного класса), но в современных реализациях есть параметры, которые ограничивают высоту дерева, число объектов в листьях и число объектов в подвыборке, при котором проводится расщепление.

  1. Применение алгоритма

В качестве примера можно привести применение модели на данных банка Home Credit[1]. На вход модель получает список всех взятых кредитов и информация о них. Модель должна разделить клиентов по вероятности выплаты кредита. Объектом исследования является множество клиентов банка, предметом исследования является разделение клиентов банка на две группы, по вероятности выплатить кредит.

Применение данной модели на данных банка позволяет достичь точности ROC AUG - 0.678. Применение такой модели позволяет разделять клиентов на несколько групп. Применение технологий машинного обучения в управлении рисками кредитования позволяет снизить потери от невыплаты кредита и снизить объем необходимых резервов.

Так же применение более точной модели позволяет предлагать индивидуальные кредитные предложения, с более привлекательной процентной ставкой.

Заключение

Кредитный скоринг может обеспечить банку значительные конкурентные преимущества, сократить операционные расходы и увеличить прибыль, в том числе за счет снижения рисков [3]. Для его эффективного использования необходимо помнить о преимуществах и ограничениях моделей и алгоритмов и уметь использовать их, отвечая на требования бизнес условий. Важно осваивать лучшие из существующих подходы к кредитному скорингу и участвовать в разработке новых, чтобы обеспечить оптимальное качество оказываемых кредитных услуг и положение банка в отрасли

Литература

  1. https://www.kaggle.com/willkoehrsen/start-here-a-gentle-introduction/notebook
  2. https://alexanderdyakonov.wordpress.com/2016/11/14/%D1%81%D0%BB%D1%83%D1%87%D0%B0%D0%B9%D0%BD%D1%8B%D0%B9-%D0%BB%D0%B5%D1%81-random-forest/
  3. Саитова С.Т. Использование скоринговой модели при управлении кредитным риском //Молодой ученый. 2013. №12. С.342-344