2.3 Построение методики оценки кредитоспособности заёмщиков на основе модели логистической регрессии
Логистическая регрессия или логит-регрессия (англ. logit model) — это статистическая модель бинарного выбора, используемая для предсказания вероятности возникновения некоторого события путём подгонки данных к логистической кривой.
Логистическая регрессияприменяется для предсказания вероятности возникновения некоторого события по значениям множества признаков. Для этого вводится так называемаязависимая переменная , принимающая лишь одно из двух значений — как правило, это числа 0 (событие не произошло) и 1 (событие произошло), и множествонезависимых переменных (также называемых признаками, предикторами или регрессорами) — вещественных, на основе значений которых требуется вычислить вероятность принятия того или иного значения зависимой переменной.
На основе исходных данных была построена модель логистической регрессии, предсказывающая платежёспособность клиента на основе группы показателей.
Зависимая переменная: Результат оплаты кредита
Признанные значимыми факторы:
%Первоначального взноса
Срок кредита
Общая сумма иных действующих кредитов
Кредитная история
Возраст
Стаж работы
Оценка кредитного специалиста
Построение модели с помощью программы Statgraphics дало следующую оценку значимым параметрам:
Таблица 2. Оценка весов значимых параметров модели
|
| Стандартное |
Параметр | Математическое ожидание | отклонение |
Константа | -1,56828 | 0,764033 |
%Первоначального взноса | 3,88202 | 1,88959 |
Срок кредита | -0,0900969 | 0,0459715 |
Общая сумма иных действующих кредитов | -0,000109985 | 0,0000395655 |
Кредитная история | 0,808062 | 0,244296 |
Возраст | 0,0907054 | 0,0204367 |
Стаж работы | 0,0667972 | 0,0272626 |
Оценка кредитного специалиста | 1,61085 | 0,669916 |
Таким образом, исходя из полученных результатов, можно сделать следующие выводы:
Весомым показателем платёжеспособности является % первоначального взноса при оформлении кредита. Как правило, первоначальный взнос по величине близок к ежемесячному платежу. Если клиент способен в момент оформления внести необходимую сумму, вероятнее всего и в будущем он сможет это сделать, что подтверждает коэффициент модели.
Важным фактором является оценка кредитного специалиста. Несмотря на свою субъективность, экспресс-оценка специалиста банка является достаточно эффективным индикатором платёжеспособности заёмщика. Кредитный инспектор имеет возможность оценить клиента по его поведению и манерам, сделать вывод о его честности и добропорядочности. И выражением данных критериев в модели служит оценка, которую дал кредитный специалист при общении с клиентом.
Кредитная история является важнейшим индикатором платёжеспособности для банка. Наличие хорошей кредитной истории зачастую снимает необходимость глубокого анализа финансовой надёжности клиента.
Существует два значимых фактора, отрицательно влияющих на кредитоспособность заёмщика. Первый из них – срок кредита. Это объясняется большей неизвестностью и большим риском при долгосрочном кредитовании. Второй – общая сумма иных кредитов, действующих в данный момент у заёмщика. Это увеличивает риск невозврата, т.к. клиент уже несёт ответственность и издержки в связи с погашением иного кредита.
В таблице 3 приведены статистические показатели построенной модели.
Таблица 3. Показатели значимости факторов модели.
Фактор | P-Value |
%Первоначального взноса | 0,0233 |
Срок кредита | 0,0417 |
Общая сумма иных действующих кредитов | 0,0002 |
Кредитная история | 0,0004 |
Возраст | 0,0000 |
Стаж работы | 0,0143 |
Оценка кредитного специалиста | 0,0185 |
Так как значение P-Value меньше 0,05 для каждого из факторов, они признаются статистически значимыми.
Формула расчёта оценки кредитоспособности выглядит следующим образом:
Оценка кредитоспособности= exp(eta)/(1+exp(eta))
Где,
eta = -1,56828 + 3,88202*%Первоначального взноса - 0,0900969*Срок кредита(мес.) - 0,000109985* Общая сумма иных действующих кредитов(руб.) + 0,808062*(Кредитная история, -1,0,1 или 2) + 0,0907054*Возраст(лет) + 0,0667972*Стаж работы (лет) + 1,61085* Оценка кредитного специалиста (1 или 0).
Ключевым моментом в построении модели оценки кредитоспособности заёмщика является выбор порога, наиболее эффективно разделяющего надёжных и ненадёжных клиентов. Для расчёта финансовой эффективности стратегии была взята 10% бесповторная случайная выборка из общего массива данных.
В таблице 4 приведены результаты эффективности моделей с различными пороговыми значениями отказа/одобрения.
Таблица 4. Финансовые показатели работы моделей логистической регрессии с различными пороговыми значениями.
Порог | Доход | Недополученный доход | Прибыль |
0,2 | 1 325 510р. | 593 618р. | 731 892р. |
0,3 | 1 314 231р. | 567 215р. | 747 017р. |
0,4 | 1 275 210р. | 451 051р. | 824 159р. |
0,5 | 1 203 946р. | 289 759р. | 914 187р. |
0,6 | 1 076 961р. | 150 088р. | 926 872р. |
0,7 | 871 836р. | 100 821р. | 771 015р. |
0,8 | 630 772р. | 58 006р. | 572 766р. |
Рисунок 2. График изменения финансовых показателей эффективности моделей логистической регрессии в зависимости от заданного порогового значения
Таблица 5. Статистическая эффективность моделей логистической регрессии с различными порогами.
Cutoff | TRUE | FALSE | Total |
0,0 | 100,00 | 0,00 | 73,09 |
0,05 | 100,00 | 4,48 | 74,30 |
0,1 | 100,00 | 5,97 | 74,70 |
0,15 | 99,45 | 5,97 | 74,30 |
0,2 | 99,45 | 7,46 | 74,70 |
0,25 | 98,90 | 7,46 | 74,30 |
0,3 | 98,35 | 8,96 | 74,30 |
0,35 | 98,35 | 19,40 | 77,11 |
0,4 | 96,70 | 23,88 | 77,11 |
0,45 | 94,51 | 35,82 | 78,71 |
0,5 | 92,31 | 44,78 | 79,52 |
0,55 | 87,91 | 53,73 | 78,71 |
0,6 | 83,52 | 62,69 | 77,91 |
0,65 | 80,22 | 67,16 | 76,71 |
0,7 | 73,08 | 73,13 | 73,09 |
0,75 | 68,68 | 80,60 | 71,89 |
0,8 | 58,79 | 85,07 | 65,86 |
0,85 | 53,85 | 92,54 | 64,26 |
0,9 | 41,21 | 94,03 | 55,42 |
0,95 | 26,92 | 98,51 | 46,18 |
1,0 | 0,00 | 100,0 | 26,91 |
Исходя из приведённых результатов расчётов можно сделать вывод: наиболее эффективна модель с пороговым значением 0,6.
Выводы.
В таблице 6 приведены сводные данные по эффективности всех методик, рассмотренных в работе.
Рейтинг | Порог | Методика | Доход | Недополученный доход | Прибыль |
1 | 0,6 | Логист. | 1 076 961р. | -150 088р. | 926 872р. |
2 | 0,5 | Логист. | 1 203 946р. | -289 759р. | 914 187р. |
3 | 0,4 | Логист. | 1 275 210р. | -451 051р. | 824 159р. |
4 | 1,20 | Дюран | 1 219 369р. | -404 218р. | 815 151р. |
5 | 1,25 | Дюран | 1 169 788р. | -395 731р. | 774 058р. |
6 | 0,7 | Логист. | 871 836р. | -100 821р. | 771 015р. |
7 | 1,30 | Дюран | 1 147 216р. | -385 075р. | 762 142р. |
8 | 1,15 | Дюран | 1 219 369р. | -470 501р. | 748 869р. |
9 | 0,3 | Логист. | 1 314 231р. | -567 215р. | 747 017р. |
10 | 0,2 | Логист. | 1 325 510р. | -593 618р. | 731 892р. |
11 | 1,10 | Дюран | 1 219 369р. | -497 115р. | 722 254р. |
12 | 1,35 | Дюран | 1 099 569р. | -378 644р. | 720 924р. |
13 | 1,40 | Дюран | 1 050 039р. | -378 644р. | 671 395р. |
14 | 0,8 | Логист. | 630 772р. | -58 006р. | 572 766р. |
Методика Дюрана даёт более усреднённый результат, банк может применить её в случае реализации консервативной стратегии управления рисками. В случае ошибки с коэффцицентом при наихудшем сценарии прибыль составит 671 395 р., в то время как худший результат модели логистической регрессии = 572 766 р. Использование модели логистической регрессии представляется более рискованным, т.к. прибыль более чувствительна к её порогу, в сравнении с методикой Дюрана. При этом максимум, достигнутый с помощью модели логистической регрессии более чем на 100 000 руб. превосходит лучший результат по методике Дюрана.
Список литературы:
Андрей Пищулин. Кредитный скоринг. Не всё так страшно. http://factoringpro.ru/index.php/credit-scoring-statya/408-skoring-statya-kredit
О.И Пятковский, Д.В. Лепчугов, В.В. Бондаренко. Скоринговая система оценки кредитоспособности физических лиц на основе гибридных экспертных систем, Ползуновский альманах №2, 2010, с 127-129.
Финансы, денежное обращение и кредит. Учебник / Под ред. В.К. Сенчагова, А.И. Архипова. М: Проспект, 2009. – 496 с.
Understanding your credit report & credit score. Financial Consumer Agency of Canada. ISBN: 978-1-100-10209-2
Report to the Congress on Credit Scoring and Its Effects on the Availability and Affodability of Credit. Board of Governors of the Federal Reserve System. August 2011
Сергей Губенко. Как банки оценивают платёжеспособность клиентов? http://www.prostoblog.com.ua/lichnye/banki/kak_banki_otsenivayut_platezhesposobnost_potentsialnogo_zaemschika
Лукашевич Н.С. Оценка кредитоспособности физических лиц на основе теории нечётких множеств. Санкт-Петербург, 2009.
Сергей Ларин, Ирина Ходжаева. Использование деревьев решений для оценки кредитоспособности физических лиц. http://www.basegroup.ru/library/practice/solvency/
Д. Шевчук. Основы банковского дела. Конспект лекций, Ростов-на-Дону, Феникс, 2012, ISBN 978-5-222-1072
Балабанов И.Т. Банки и банковское дело. Учебное пособие. - СПБ.: Питер, 2009. – 259 с.
Бухвальд Б. Техника банковского дела.Москва, Сирии, 2012. - 256 с
Вулфел Ч.Дж. Энциклопедия банковского дела и финансов. М.: Федоров, 2010. - 1030 с.
Приложение 1. Пример расчёта кредитоспособности заёмщиков при помощи методики Дюрана
Сумма кредита (руб.) | 13214,00 | 14860,00 | 21538,00 | 14177,00 | 31484,00 | 8217,00 | 31960,00 | 24718,00 | 20232,00 | 11290,00 | 3600,00 |
П/взнос (руб.) | 1200,00 | 0,00 | 0,00 | 0,00 | 3129,00 | 913,00 | 7990,00 | 2499,00 | 0,00 | 3837,00 | 400,00 |
П/взнос % | 0,08 | 0,00 | 0,00 | 0,00 | 0,09 | 0,10 | 0,20 | 0,09 | 0,00 | 0,25 | 0,10 |
Ежем.платёж (руб.) | 1802,39 | 2430,01 | 2401,49 | 1609,74 | 3386,77 | 1225,98 | 6050,00 | 2963,69 | 2794,04 | 1363,48 | 740,23 |
% е/п от кредита | 0,14 | 0,16 | 0,11 | 0,11 | 0,11 | 0,15 | 0,19 | 0,12 | 0,14 | 0,12 | 0,21 |
Эффективная % ставка | 105,30 | 76,75 | 75,75 | 76,74 | 26,61 | 63,18 | 56,76 | 105,30 | 111,54 | 108,43 | 111,54 |
Срок (мес.) | 10,00 | 8,00 | 12,00 | 12,00 | 10,00 | 8,00 | 6,00 | 12,00 | 10,00 | 12,00 | 6,00 |
Страхование | 1,00 | 1,00 | 1,00 | 1,00 | 1,00 | 0,00 | 0,00 | 1,00 | 1,00 | 1,00 | 0,00 |
Балл за страховку | 0,19 | 0,19 | 0,19 | 0,19 | 0,19 | 0,00 | 0,00 | 0,19 | 0,19 | 0,19 | 0,00 |
З/п (руб. в мес.) | 30000,0 | 15000,0 | 15000,0 | 8000,00 | 17000,0 | 15000, | 20000,0 | 28000,0 | 15000, | 35500,0 | 22000,0 |
% ежем.платежа в з/п | 0,06 | 0,16 | 0,16 | 0,20 | 0,20 | 0,08 | 0,30 | 0,11 | 0,19 | 0,04 | 0,03 |
З/п супруга | 0,00 | 0,00 | 0,00 | 12000,00 | 27000,00 | 0,00 | 5000,00 | 0,00 | 0,00 | 0,00 | 14000,0 |
З/п супруга (% от з/п клиента) | 0,00 | 0,00 | 0,00 | 1,50 | 1,59 | 0,00 | 0,25 | 0,00 | 0,00 | 0,00 | 0,64 |
Наличие а/м | 0,00 | 0,00 | 0,00 | 0,00 | 1,00 | 1,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 |
Недвижим. | 0,00 | 1,00 | 0,00 | 1,50 | 2,00 | 1,00 | 2,00 | 0,00 | 0,00 | 1,00 | 1,00 |
Балл за собственн. | 0,00 | 0,35 | 0,00 | 0,35 | 0,35 | 0,35 | 0,35 | 0,00 | 0,00 | 0,35 | 0,35 |
Другие кредиты | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 |
Ежем.платёж по иным кредитам (руб.) | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 |
% ежем.платежа в з/п по иным кред. | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 |
Кредитная история | 0,00 | 1,00 | 0,00 | 0,00 | 0,00 | 2,00 | 1,00 | 1,00 | 0,00 | 0,00 | 1,00 |
Балл за счёт | 0,00 | 0,45 | 0,00 | 0,00 | 0,00 | 0,45 | 0,45 | 0,45 | 0,00 | 0,00 | 0,45 |
Возраст | 20,00 | 24,00 | 38,00 | 41,00 | 42,00 | 48,00 | 19,00 | 20,00 | 20,00 | 23,00 | 23,00 |
Балл за возраст | 0,00 | 0,04 | 0,18 | 0,21 | 0,22 | 0,28 | -0,01 | 0,00 | 0,00 | 0,03 | 0,03 |
Пол | 0,00 | 0,40 | 0,00 | 0,40 | 0,40 | 0,00 | 0,40 | 0,00 | 0,00 | 0,00 | 0,00 |
Сем. положение | 0,00 | 0,00 | 1,00 | 1,00 | 1,00 | 1,00 | 1,00 | 0,00 | 0,00 | 1,00 | 1,00 |
Стаж на посл. месте работы | 0,00 | 2,00 | 10,00 | 1,00 | 17,00 | 17,00 | 0,00 | 0,00 | 1,00 | 2,00 | 2,00 |
Балл за стаж | 0,00 | 0,12 | 0,59 | 0,06 | 1,00 | 1,00 | 0,00 | 0,00 | 0,06 | 0,12 | 0,12 |
Образование | 0,00 | 1,00 | 1,00 | 1,00 | 1,00 | 2,00 | 1,00 | 1,00 | 1,00 | 1,00 | 2,00 |
Кол-во детей (иждивенцев) | 0,00 | 1,00 | 1,00 | 3,00 | 2,00 | 0,00 | 1,00 | 0,00 | 0,00 | 0,00 | 0,00 |
Проф. статус | военн | военн | военн | военн | военн | военн | пенсион | рабочий | рабочий | рабочий | гос.сл. |
Отрасль работы | военн | военн | военн | военн | военн | военн | гос-во | гос-во | гос-во | гос-во | гос-во |
Балл за профессию | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,55 | 0,55 | 0,55 | 0,55 | 0,55 |
Балл за отрасль | 0,21 | 0,21 | 0,21 | 0,21 | 0,21 | 0,21 | 0,21 | 0,21 | 0,21 | 0,21 | 0,21 |
Год начала проживания в регионе | 2000,00 | 2010,00 | 2003,00 | 1995,00 | 2002,00 | 1999,00 | 1993,00 | 2010,00 | 2010,00 | 2003,00 | 2003,00 |
Балл за срок проживания в регионе | 0,42 | 0,04 | 0,34 | 0,42 | 0,38 | 0,42 | 0,42 | 0,04 | 0,04 | 0,34 | 0,34 |
Оплата | 1,00 | 0,00 | 1,00 | 1,00 | 1,00 | 1,00 | 1,00 | 0,00 | 0,00 | 1,00 | 0,00 |
Оценка Дюрана | 0,82 | 1,80 | 1,51 | 1,84 | 2,75 | 2,71 | 2,37 | 1,44 | 1,05 | 1,78 | 2,04 |
Порог = 1,20 | 0,00 | 1,00 | 1,00 | 1,00 | 1,00 | 1,00 | 1,00 | 1,00 | 0,00 | 1,00 | 1,00 |
Возм дох | 11595 | 7603 | 16315 | 1087 | 6981 | 3461 | 9070 | 26028 | 18805 | 12241, | 2007 |
Реал дох | 0,00 | 0,00 | 16315 | 10879, | 6981,58 | 3461,00 | 9070,25 | 0,00 | 0,00 | 12241 | 0,00 |
Потери | 0,00 | 22463, | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 50746, | 0,00 | 0,00 | 5607,00 |
Приложение 2. Пример расчёта кредитоспособности заёмщиков при помощи модели логистической регрессии
Summa_kredita | 3348 | 30966 | 31484 | 3343 | 30760 | 25050 | 20956 | 5480 | 12916 | 20980 |
%Pervonachal_Vznos | 0,00 | 0,20 | 0,09 | 0,10 | 0,00 | 0,38 | 0,00 | 0,08 | 0,09 | 0,00 |
%Ezhemes_Platezha_v_Kredite | 0,21 | 0,27 | 0,11 | 0,20 | 0,11 | 0,15 | 0,09 | 0,12 | 0,11 | 0,13 |
Effektiv_%stavka | 145,28 | 45,72 | 26,61 | 105,30 | 76,75 | 52,77 | 73,98 | 105,30 | 105,30 | 40,54 |
Srok_Kredita | 6 | 4 | 10 | 6 | 12 | 8 | 12 | 12 | 14 | 10 |
Strahovanie | 1 | 1 | 1 | 1 | 0 | 1 | 0 | 1 | 1 | 1 |
Zarplata | 14000 | 28000 | 17000 | 18000 | 20000 | 15000 | 11000 | 23000 | 15000 | 15000 |
Dolya_EzhemesPlat_v_ZP | 0,05 | 0,30 | 0,20 | 0,04 | 0,17 | 0,24 | 0,18 | 0,03 | 0,09 | 0,18 |
Zarplata_supruga | 0 | 20000 | 27000 | 17000 | 10000 | 6000 | 0 | 0 | 0 | 0 |
Dolya_EzhemesPlat_v_ZP_supruga | 0,00 | 0,71 | 1,59 | 0,94 | 0,50 | 0,40 | 0,00 | 0,00 | 0,00 | 0,00 |
Auto | 0,00 | 0,00 | 1,00 | 0,00 | 0,00 | 0,00 | 1,00 | 0,00 | 0,00 | 0,00 |
Sobstvennost | 1,00 | 2,00 | 2,00 | 1,00 | 1,00 | 0,00 | 2,00 | 2,00 | 0,00 | 0,00 |
Drugie_Kredity | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 |
EzhemesPlat_po_drugim_Kreditam | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 |
Dolya_EzhemesPlat_drug_kred_v_ZP | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 |
Kredit_hystory | 1 | 1 | 0 | 0 | 0 | 0 | 2 | 2 | 0 | 1 |
Vozrast | 26 | 56 | 42 | 36 | 38 | 54 | 53 | 57 | 19 | 33 |
Pol | 1 | 0 | 0 | 0 | 1 | 1 | 0 | 0 | 0 | 0 |
Semeynoe_polozhenie | 0 | 1 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 |
Stazh_raboty | 0 | 10 | 17 | 3 | 1 | 2 | 0 | 10 | 1 | 4 |
Obrazovanie | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1,5 | 2 |
Kol-vo_izhdeventsev | 0 | 0 | 2 | 1 | 6 | 0 | 0 | 0 | 0 | 0 |
Ocenka_kred_spetsialista | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
Rezultat_oplaty | 0 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 0 | 0 |
Model_Result | 0,74 | 0,98 | 0,26 | 0,79 | 0,67 | 0,98 | 0,98 | 0,98 | 0,31 | 0,74 |
CutOff 0,6 | 1 | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 1 |
Доход_возможный | 2431,99 | 4719,22 | 6981,58 | 1760,09 | 23608,30 | 8812,59 | 15503,25 | 5770,44 | 15867,31 | 7087,74 |
Доход реальный | 0,00 | 4719,22 | 0,00 | 1760,09 | 23608,30 | 8812,59 | 15503,25 | 5770,44 | 0,00 | 0,00 |
Потери | 5779,99 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 | 28067,74 |
Приложение 3. Процентное соотношение верно оцененных заёмщиков в модели логистической регрессии при различных порогах.
Приложение 4. Формирование общего процента верных оценок для разных пороговых значений логистической регрессии.
- Национальный исследовательский ядерный университет «мифи»
- Глава 1. Скоринговые системы как инструмент оценки кредитоспособности физических лиц
- Глава 2. Построение скоринговой модели оценки кредитоспособности физических лиц на примере ооо «хкф Банк».
- 1.2 Особенности внедрения систем кредитного скоринга в банках рф
- Глава 2. Построение скоринговой модели оценки кредитоспособности физических лиц на примере ооо «хкф Банк».
- 2.1 Описание исходной базы данных
- 2.2 Оценка эффективности методики Дюрана при оценке заёмщиков
- 2.3 Построение методики оценки кредитоспособности заёмщиков на основе модели логистической регрессии