4.2. Исходные данные
В качестве исходных данных имеется массив (компакт в метрическом пространстве) значений случайных величин – параметров системы, представленных в приложении в таблице 1. В таблице 17 столбцов (полей, соответствующих указанным показателям,…,) и примерно 37000 записей. В терминах предметной области эти величины обозначают характеристики клиента:
- сегмент, программа по которой был привлечен клиент
- более глубокая сегментация
- способ подтверждения дохода клиентом
- код рекламной компании, по который был привлечен клиент в банк
- группа риска клиента, которая присваивается на основе его поведенческого и оценочного скоринга
- канал привлечения клиента
- категория компании работодателя
Х8 – профайл в бюро кредитных историй
Х9 - диапазон дохода
Х10 - диапазон кредитной линии
Х11 – показатель, что клиент списался
Х12 - возраст
Х13 – опыт работы
Х14 – срок кредита
Х15 – ставка кредита
Х16 - долговое бремя
Х17 – показатель является ли клиент сотрудником банка
Входные данные описывают «перформанс» - поведение клиента в рамках выданного кредитного продукта. Значения в столбцах представляют собой характеристические показатели клиента. Каждая строка представляет собой всех клиентов, которым был выдан кредит за взятый промежуток времени.
orig_segment - Сегмент, Программа, по которой был привлечен клиент
|
orig_subsegment - Сегментация на уровень глубже.
Corporate | New to payroll | Клиенты, компания работодатель которых не находится на зарплатом проекте в банке, но клиент находится на индивидуальном зарплатном обслуживании |
| Payroll pre-qualified | Клиенты, компания работодатель которых находится на зарплатом проекте в банке |
| Payroll walk-in | Клиенты, компания работодатель которых находится на зарплатом проекте в банке, но клиент испольуют другой банк для зарплатного обслуживания |
Salaried | 2-NDFL Non-Corp | Клиенты, подтверждающие доход справкой 2-ндфл |
| Xsell to inactive CC Salaried | Клиенты, принявшие условия программы перекрестных продаж на кредитную карту |
Surrogates | Auto Surrogate | Клиенты, предоставившие в качестве подтверждения дохода документы о владении автомобилем |
| Foreign Travel | Клиенты, подтвердившие свой доход заграничным паспортом с поездками за последние полгода |
| Xsell to Liabilities | Клиенты, принявшие условия программы перекрестных продаж на балансовые счета |
TopUp | 1st Regular TopUp | Клиенты, взявшие дополнительные средства у бьнка |
| 1st Top Up for Payroll | Клиенты, взявшие дополнительные средства у банка |
| 1st Top Up on Xsell | Клиенты, взявшие дополнительные средства у бьнка |
| TopUp to Former Borrowers | Клиенты, взявшие дополнительные средства у бьнка, но закрывшие свой кредит |
Xsell to CC6+ | XSell CC6+ with Line Decrease | Клиенты, принявшие условия программы перекрестных продаж на кредитную карту, с момента открытия которой прошло 6 месяцев |
| XSell to CC6+ on Demand | Клиенты, у которых открыта кредитная карта и пожелавшие взять кредит |
|
|
|
INCOME_PROOF – Способ подтверждения дохода клиентом.
Доход определяется на основании следующих документов / следующими способами:
Чистый месячный/годовой доход клиента, указанный им в заявлении, сверяется со стандартной формой № 2-НДФЛ, выдаваемой и подписываемой работодателем, а также скрепленной его печатью. В форме № 2-НДФЛ должен быть указан доход минимум за 3 последних месяца.
Доход заявителей из компаний категории «S», привлеченных через Отдел корпоративных продаж, проверяется по разделу заявки, содержащему данные о ежемесячной зарплате, заверенные уполномоченным представителем компании и печатью компании или на основании списков работников от компании (категории «А», «S»), с указанием стажа работы, типа трудового договора и размера месячного заработка, также заверенные уполномоченным представителем компании и печатью компании.
Доход клиента также может косвенно определяться по наличию заграничной поездки в последние полгода или фактом владения иностранной машиной, которая не старше 8ми лет.
2-NDFL | Справка 2-НДФЛ |
Auto Surrogate | Документы о владении автомобилеем |
Payroll Transactions | Зарплатные транзакции |
Travel Surrogate | Заграничный паспорт со штампами вьезда и выезда из страны |
W/O Documents | Без подтверждения дохода |
FRAUD_PROFILE – Имеет значение флага. Попадает ли клиент под образ мошенника. В положительном случае ему назначается дополнительная проверка данных.
CAMPAIGN_CODE - Код рекламной компании, по который был привлечен клиент в банк.
RISK_LEVEL – Группа риска клиента, которая присваивается на основе его поведенческого и оценочного скоринга
CHANNEL_OIGINATION – Канал привлечения клиента
COMPANY_CATEGORY - Категория компании работодателя
JOB_DESC - профессия
THICK_THIN – Профайл в бюро кредитных историй
Income_Range – Диапазон дохода
Credit_Line_Range - Диапазон кредитной линии
STAFF_FLAG - Флаг, что клиент является сотрудником
score_range- Диапазон скора
EMP_TIME – Опыт работы (в месяцах)
AGE_NBR - Возраст
INTEREST_RATE – Ставка кредита
TENOR – Срок кредита
Drop_flag_orig_a- Флаг, что данный тип клиента больше не подходит под текущую политику банка
DBR_RANGE – Диапазон долгового бремени
Известные компании | Категория «A» |
|
|
Категория «S»* (максимум 15000 компаний) | Отдельные компании для целевого поиска клиентов |
| |
Прочие
| Категория «B» | Зарегистрированные компании | Остальные российские юридические лица, регистрация которых в ЕГРЮЛ подтверждена. |
Категория «О» | Незарегистрированные компании | Остальные российские юридические лица, регистрация которых в ЕГРЮЛ не подтверждена. |
Стаж работы | Суммарный стаж на двух последних местах работы должен составлять не менее года и минимум 3 месяца на текущем месте работы.
3 месяца для клиентов, получающих зарплату на счет в банке, для существующих клиентов по программам Перекрестных продажи и увеличение суммы кредита по инициативе банка. |
- Министерство образования и науки Российской Федерации
- 1 Постановка задачи
- 2 Обзор источников
- 2.1 Существующие методы
- 2.1.1 Экспертные системы оценки
- 2.1.2 Балльные системы оценки кредитоспособности клиентов
- 2.1.2.1 Application-скоринг(Оценка заявки на кредит)
- 2.1.2.2 Fraud-скоринг
- 2.1.2.3 Collection-скоринг
- 2.1.2.4 Behavioral-scoring (поведенческий скоринг)
- 2.2. Проблема существующих методов
- 3 Методика решения задачи
- 3.1 Общая структура модели
- 3.2 Основные этапы анализа данных
- 4 Формулировка задачи
- 4.1 Математическая формулировка
- 4.2. Исходные данные
- 4.2 Алгоритм расчета
- 4.2.1. Алгоритм apriori
- 5 Результаты
- 6 Анализ результатов
- 6.1. Интерпретация полученных результатов
- 6.2 Основные результаты
- Заключение
- Список использованной литературы
- Приложение а.