6.1. Интерпретация полученных результатов
Сравним получившиеся результаты с показателями банка, которые зафиксированы на сегодняшний день.
Таблица 6.1. Основные показатели работы банка
В результате апробации алгоритм на тестовой выборке дали схожие результаты.
| 2012 | 2013 | 2014 |
Количество клиентов | 28411 | 20423 | 19763 |
Количество списанных клиентов | 301 | 220 | 174 |
Количество клиентов которым отказано в кредите | 33352 | 48780 | 36043 |
Кооэфициент одобрения | 46,00% | 29,51% | 35,41% |
Прибыль от выданных кредитов, млн$ | 620 | 555 | 318 |
Сумма потерянных денег, млн$ | 23,43 | 17,44 | 10,05 |
Коэфициент потерянных денег | 3,78% | 3,14% | 3,16% |
*на май 2015 года |
|
|
|
Таблица 6.2. Основные показатели работы банка после применения алгоритма
Результаты, полученные на модельной выборке данных, подтвердили значимость выявленных ключевых показателей на тестовом множестве данных.
Для поставленной задачи повешения надежности существующих методов оценки клиентов, необходимо проводить осторожную политику выдачи кредитов данному сегменту клиентов, наложить дополнительные ограничения на текущие параметры, соответствующие одобрению выдачи займа.
Помимо совокупного набора характеристик клиента, необходимо учитывать совокупность ранжированного первого показателя по степени поддержки.
Таблица 6.3 Выборка первого параметра ранжирования
После проведения основного эксперимента, тестовая выборка данных была использована как обучающая. Ключевые параметры, выделенные на данных клиентов за 2013 год, имеют различия по сравнению с 2012.
Сложность представляет судить о клиенте по таким параметрам как профессия и сфера деятельности. В российской федерации из-за ограниченного списка профессий, которым полагается пенсионное обеспечение, компании-работодатели указывают в трудовой книжке сотруднике общую специальность. Вследствие чего поле профессия, значение которого банк получает из анкетных данных клиента, содержит большое количество «Специалистов», «Менеджеров», «Аналитиков». Это приводит к невозможности верного анализа данных. Похожая ситуация с полем «NOB». Данная проблема проявляется на группах характеристик, которые обладают разнообразными вариантами параметров. К примеру, род занятий включает в себя 40 различных профессий, в то время как способ подтверждения дохода имеет лишь 6 вариаций. Фокус на параметре размывается, чем объясняется различие.
Проводя анализ применения полученных знаний в ходе работы алгоритма на тестовой выборке, выявлено что прибыль, которую теряет банк, не выдав людям со схожими характеристиками, но исправно выплачивающим кредитам меньше, чем расходы и потери от списанных клиентов. Это подтверждает тот факт, что была выявлена совокупность проблемных характеристик клиентов. Таким образом, на тестовой выборке банк сократил расходы и получил большую прибыль по итогам 2014 года.
Результаты этого исследования внедрены в кредитную политику банка.
Для автоматизации процесса принятия решения были сделаны следующие шаги:
Выбран сегмент кредитного портфеля для которого у банка имеются все данные. Основной проблемой банка является узнать верный доход клиента, чтобы правильно рассчитать кредитное предложение. Группа клиентов, доход которых банк знает наверняка, является группа корпоративных клиентов, находящихся на зарплатном обслуживании. На основе транзакций, производимых компанией работодателем, у банка всегда имеется актуальная заработная плата клиента. Помимо этого существует процедура автоматического списания долга с основного счета клиента, в случае если клиент уйдет в просрочку.
На основе кредитного скоринга проводимого банкам, результатах исследования формируется база данных клиентов на ближайший месяц для которых будет сформировано кредитное предложение в рамках кредитной политики. Таким образом для каждого кредитного срока будет рассчитана процентная ставка, ежемесячная выплата и максимальная сумма кредита
- Министерство образования и науки Российской Федерации
- 1 Постановка задачи
- 2 Обзор источников
- 2.1 Существующие методы
- 2.1.1 Экспертные системы оценки
- 2.1.2 Балльные системы оценки кредитоспособности клиентов
- 2.1.2.1 Application-скоринг(Оценка заявки на кредит)
- 2.1.2.2 Fraud-скоринг
- 2.1.2.3 Collection-скоринг
- 2.1.2.4 Behavioral-scoring (поведенческий скоринг)
- 2.2. Проблема существующих методов
- 3 Методика решения задачи
- 3.1 Общая структура модели
- 3.2 Основные этапы анализа данных
- 4 Формулировка задачи
- 4.1 Математическая формулировка
- 4.2. Исходные данные
- 4.2 Алгоритм расчета
- 4.2.1. Алгоритм apriori
- 5 Результаты
- 6 Анализ результатов
- 6.1. Интерпретация полученных результатов
- 6.2 Основные результаты
- Заключение
- Список использованной литературы
- Приложение а.