logo
gotovyy

4.2. Решение проблемы кредитования физических лиц

В мировой практике существует ряд направлений кредитования физических лиц. Приведем краткое описание проблем, связанных с их реализацией в РФ.

Несомненно, самым перспективным является рынок ипотечного кредитования. В большинстве банков уже есть свои собственные наработки в данной области, выраженные в виде программ ипотечного кредитования. Но доходность здесь небольшая, поскольку кредитование не имеет массовый характер. Деятельность в данной области связана с большим количеством рисков, касающихся в основном длительности периода кредитования. Поэтому стоимость кредитной услуги очень велика. Для привлечения клиентов необходимо, в первую очередь, снижение процентной ставки за счет исключения из нее риска неплатежа. Для этого банки должны отсечь 'плохих' заемщиков и предупредить случаи невозврата и, соответственно, дополнительные расходы с этим связанные.

Менее всего развит рынок образовательного кредитования. Основная его идея состоит в разрыве замкнутого круга: отсутствие необходимого образования - низкий заработок - отсутствие средств на образование - отсутствие необходимого образования. Особенности же образовательного кредита состоят в низкой процентной ставке (максимально приближена к ставке рефинансирования) и большим сроком возврата кредита (до 10 лет).  Исходя из зарубежного опыта в данной области, можно сказать, что для развития этого вида кредитования необходимы:

  1. законодательная база предоставления финансовой помощи для всех желающих и способных получить образование;

  2. гарантия возврата кредита государством, позволяющая ему взять значительную часть рисков на себя. Тем самым обеспечиваются благоприятные условия кредитования.

На сегодняшний день данные условия не обеспечены, поэтому банки вынуждены завышать стоимость кредита. Т.е. банкам для снижения рисков и здесь необходима достоверная система классификации заемщиков.

Автокредитование по доходности стоит на первых позициях данного рынка. В настоящее время в России 15 - 20% всех автомобилей реализуется с помощью кредитов, а в некоторых автосалонах в кредит приобретается до 70% автомобилей. Как правило, автомобиль же и используют в качестве залога. Но даже в такой ситуации недобросовестный заемщик, ввиду отсутствия регистрации залога - движимого имущества, вполне может повторно заложить или продать автомобиль.

Кредитование товаров длительного пользования берет своей массовостью. Большинство кредитов данной области не превышают 10000 рублей. В случае же мошенничества или дефолта заемщика банк должен нести затраты соизмеримые с суммой кредита. Данная проблема возникла в начале 2004 г., где доля проблемных займов достигла 25% в портфелях потребительского кредитования. Практика перекладывания рисков на заемщиков в данном случае может помочь только на первых порах. В условиях конкуренции выиграет тот, кто минимизирует риски, опять же достоверно определив, какой клиент 'хороший', а какой 'плохой' и предложит заемщикам более выгодные условия.

К области потребительского кредитования относится и применение кредитных карт. Данное направление пока еще не имеет широкого распространения. Стоимость услуги очень высока. Она зависит от времени, которое проходит с момента получения денег заемщиком до погашения им задолженности. Основной проблемой на пути стабильного развития рынка кредитных карточек (ввиду его будущей массовости) также является вопрос достоверной классификации потенциальных заемщиков.

В рамках будущего Интернет кредитования вопрос оценки стоит еще острее, поскольку данная услуга подразумевает оформление, получение и погашение кредита посредством дистанционного доступа без личного появления в банке. Также перед банками стоит проблема гарантий сохранности данных, а также проблема оформления документов, которые должны иметь доказательную силу в суде при возникновении неблагоприятных ситуаций.

Таким образом, базовым вопросом кредитования физических лиц является достоверная классификация потенциальных заемщиков на 'хороших' и 'плохих'.

Наибольшее распространение в мире получила скоринговая система классификации. До создания скоринговых систем бремя решения вопросов кредитования лежало только на экспертах в этой области, услугами которых пользовался каждый банк. Но вторая мировая война привела к тому, что у банков возникла проблема: как в условиях отсутствия экспертов решать данные вопросы? Поэтому было принято решение: попросить их описать правила, по которым они принимают решение, чтобы в дальнейшем следовать им. Так и появились бальные оценки. Заметим, что в основе скоринга лежит принцип формализации знаний экспертов определенным способом. На тот момент ничего лучше, вероятно не было. Консервативность же банкиров донесла данный принцип оценки до наших дней. Сейчас существуют куда более прогрессивные способы добычи и формализации знаний (Data Mining). Даже если самого эксперта нет, то, основываясь не на опыте, а на статистических данных, им станет, например, дерево решений, что будет наглядно показано далее.

Данные же для построения моделей классификации берутся из огромных баз данных по заемщикам. Мировые кредитные агентства предоставляют централизованную информацию о каждом заемщике. Очевидна необходимость создания подобных организаций и у нас, но сейчас это невозможно, поскольку согласно ГК РФ существует положение о банковской тайне. Также наиболее крупные банки не захотят делиться информацией в силу следующих причин:

Подытожим проблемы в области кредитования физических лиц, стоящие перед банками на сегодняшний день:

Вообще говоря, влияние макроэкономики редко учитывается при оценке кредитного риска. Исследование влияния макроэкономических показателей на риск неплатежа с помощью средств Data Mining показало, что, к примеру, увеличение ВВП на 1% уменьшает на 1% кредитный риск, увеличение уровня безработицы на 1% увеличивает на 0.7% кредитный риск. Тем или иным образом кредитный риск зависит и от других экономических показателей (индексы деловой активности, курс рубля, уровень продаж товаров длительного пользования…).

Таким образом, на данный момент банки находятся в невыгодном положении. С одной стороны, необходимо осваивать рынок потребительского кредитования, а с другой стороны с этим процессом связаны слишком высокие риски, которые зачастую перекладываются на заемщиков, что явно не способствует стимулированию спроса на кредиты.

В такой ситуации банки, решившиеся на освоение данного рынка должны иметь несколько вещей:

  1. консолидированную информацию о клиентах, представленную в унифицированном виде. Информация должна периодически пополняться данными из всех филиалов банка. Такое хранилище будет исполнять функцию кредитного бюро;

  2. достоверный способ классификации (достоверность должна быть более 90%) потенциальных заемщиков и отсечение 'неблагонадежных'. Этот способ позволит снизить риски невозврата к минимуму, что позволит выдавать более дешевые кредиты и, соответственно, привлечет больше заемщиков. При этом значительно увеличится прибыль от кредитования физических лиц;

  3. модель классификации заемщиков должна иметь свойства тиражируемости и адаптации к состоянию рыка, к каждому филиалу банка. Т.е. построенная, основываясь на общих закономерностях, модель должна корректироваться под частные, присущие каждому филиалу особенности. Это позволит учесть местные особенности, что еще больше позволит снизить риск;

  4. модель классификации должна периодически перестраиваться, учитывая новые тенденции рынка. Этим достигается ее актуальность. Ведь не может же использоваться один и тот же подход 5 лет назад и сейчас.

На данный момент банки в той или иной степени имеют наработки по каждому из этих пунктов, но методики, заложенные в их основе либо слишком инертны, чтобы адекватно реагировать на динамику рынка, либо слишком дороги (предлагаемые зарубежные решения сопоставимы с доходами от потребительского кредитования в сегодняшнем виде). Именно поэтому так дороги кредиты и не так велик спрос на них. Увеличение же достоверности и снижение стоимости позволит отказаться от практики переноса рисков и затрат на заемщиков. Тогда в выигрыше окажутся все - и банки, сохраняя удельную прибыльность на прежнем уровне, и заемщики, привлеченные более выгодными условиями. Все это становится более актуальным в виду будущего бурного роста рынка потребительского кредитования и будущей конкуренции.

Для достижения этих целей банки привлекают высокооплачиваемых экспертов. Но их мало и им порой физически не хватает времени успевать везде. Поэтому также актуальным является вопрос формализации знаний экспертов и их тиражирование. Это позволит «виртуальному эксперту» работать одновременно во всех филиалах банка.

Задачи подобного рода легко решаются на базе платформы Deductor. Механизмы Deductor позволяют как создать консолидированное хранилище информации о заемщиках, обеспечивая к тому же и непротиворечивость хранимой информации, так и формализовать знания экспертов, создав модели классификации заемщиков с достоверностью более 90%. Причем модель позволит принять решение о выдаче кредита или отказе практически мгновенно. Так можно поставить потребительское кредитование на поток. Это тем более актуально ввиду предстоящего онлайн кредитования и массового использования кредитных карт.

Большинство банков уже имеют достаточно статистики по кредитованию физических лиц. Для построения достоверной модели достаточно информации за 3 - 4 года. Тем более, модели имеют возможность периодически перестраиваться, учитывая динамику рынка (новые данные).

Подытоживая все сказанное выше, можно с уверенностью говорить о готовности банков к использованию передовых методик оценки кредитоспособности физических лиц. Осталось лишь консолидировать накопленные данные и формализовать опыт экспертов в рамках единой архитектуры. Это с успехом позволяет сделать аналитическая платформа Deductor.

В виду этого, интересно будет рассмотреть основные принципы формирования такой системы на одном из примеров оценки кредитоспособности физических лиц. В нем будут видны преимущества заложенных в платформе методик относительно используемых в настоящий момент (скоринг, экспертные оценки и т.п.).

Прежде чем приступить к описанию решения необходимо осветить некоторые аспекты методики анализа с использованием механизмов Data Mining.

Краеугольным камнем методики является качество исходных данных. От него напрямую зависит качество построенной модели. Чтобы обеспечить его, необходимо придерживаться следующего алгоритма:

Именно с помощью такого подхода составлены анкеты - заявки на получение кредита. Экспертами в данной области были выявлены факторы, наиболее влияющие на результат. Эту информацию и заполняют в анкетах потенциальные заемщики.[27]

Итак, задача заключается в построении модели оценки (классификации) потенциальных заемщиков. Решение задачи также должно обладать большой достоверностью классификации, возможностью адаптации к любым условиям, простотой использования модели.

Пользуясь приведенной выше методикой, была предложена гипотеза о том, какие факторы влияют на кредитоспособность человека. По мнению экспертов, по этим факторам можно учесть суммарный риск. Тем самым должно достигаться и отнесение потенциального заемщика к способным вернуть кредит или не способным.

Предложенные факторы представлены в таблице 4.1

Таблица 4.1-Факторы, влияющие на кредитоспособность.

Категория

Некоторые факторы категории

Базовая персональная информация

Пол, возраст, образование…

Информация о семейном положении

Состояние в браке, количество детей…

Регистрационная информация

Прописка, срок проживания по данному адресу…

Информация о занятости

Специальность, сфера деятельности предприятия…

Информация о финансовом положении

Зарплата, другие начисления и удержания

Информация по обеспеченности

Имущество, ценные бумаги…

Информация о кредитной истории

Количество прошлых кредитов, текущие обязательства…

Хранилище данных по заемщикам

Согласно предложенной гипотезе, данные факторы были собраны и консолидированы в хранилище данных Deductor Warehouse. Методология хранилища такова, что информация хранится в процессах, каждый процесс имеет определенный набор измерений и фактов. Т.е. процесс реализован по стандартной схеме "Звезда", в центре которой хранятся факты, а измерения являются лучами. В данном случае процесс отображает выдачу кредита заемщику. Наиболее ценной информацией процесса является статус кредита. Хороший кредит - тот, который заемщик вернул в срок и в полном объеме, плохой - обратная ситуация.

Создание аналитической отчетности

При построении модели оценки кредитоспособности огромную помощь эксперту окажет разнообразная аналитическая отчетность. Поскольку данные в хранилище представлены в многомерном виде, то, несомненно, наиболее удобно получать отчетность в виде набора срезов данных - кросс - таблиц.

Например, на рис. видно распределение сумм кредитов по возрасту заемщиков. Также информация отображается в разрезе как «хороших», так и «плохих» кредитов.

Рисунок 4.1- Суммы, которые получили заемщики (или требовали потенциальные заемщики).

Более наглядно распределение представляется в виде кросс-диаграммы (рис4.2).

Рисунок 4.2 - Представление данных в виде кросс-диаграммы.

На рисунке наглядно видно, что в основном берут кредит лица до 30 лет, от 30 до 50 менее активно, от 50 до 70 практически не берут. Видимо, условия кредитования не устраивает лиц, старше 30 лет в большинстве случаев. Банку, для привлечения данной категории лиц придется менять условия кредитования (например, уменьшить плату за кредит).  Если анализировать причину такого количества отказов в выдачи кредитов, то выяснится, что потенциальные заемщики неадекватно оценивали свои возможности по погашению кредита (это наглядно видно на самоорганизующихся картах далее).[28]

В Deductor 4 в OLAP-кубе с помощью инструмента 'селектор' можно агрегировать факты по какому-либо измерению, оставляя только те объекты, которые соответствуют указанному условию. Например, можно объединить сумму кредитов по возрастам заемщиков, оставив только тех, которые в сумме берут 50% кредитов. На рис. 3 и 4 представлены селектор и заемщики, взявшие 50% от общей суммы.

Рисунок 4.3- Селектор.

Рисунок 4.4- Заемщики, взявшие 50% всех кредитов.

Так подтверждается популярность кредитования среди молодежи.

Это небольшой пример применения аналитической отчетности. На практике можно таким образом анализировать любую информацию о заемщиках, имеющуюся в хранилище в произвольных разрезах.

Анализ предпочтений заемщиков

В первой части статьи затрагивались вопросы популярности тех или иных услуг кредитования, вопросы динамики спроса на услуги. Покажем, что можно сказать по этому поводу, исходя из имеющихся данных. На рис. 4.5 хорошо видно, что количество обратившихся за кредитом на покупку товаров длительного пользования составляет более 40% от общего количества заемщиков.

Рисунок4.5- Предпочтения заемщиков.

Сегментация заемщиков

Каждый заемщик обладает определенным набором атрибутов (факторов). Для анализа рынка необходимо в первую очередь понять общую картину. Кто берет кредиты, зачем, какие существуют причины отказов в выдаче кредитов или причины несостоятельности. Для этого необходимо наглядное представление всех имеющихся данных. Такую задачу можно решить с помощью построения самоорганизующихся карт. На рис. представлена некоторые из таких карт, показывающие распределение заемщиков по характеристикам 'Сумма кредита', 'Срок кредита', 'Цель кредитования', 'Среднемесячный доход', 'Количество иждивенцев' и 'Возраст'. Проведем анализ представленных данных.

Рисунок 4.7- Карты Кохонена.

Сначала необходимо дать анализ по каждой характеристики в отдельности, а затем уже оценить их общую связь.

Итак, какие суммы кредитов хотят брать заемщики? На карте видно равное количество как желающих взять небольшие суммы (до 20000 рублей) так и достаточно весомые (до 80000 рублей). Причем, исходя из данных карты среднемесячного дохода, практически все заемщики имеют одинаковый доход (2 - 3 тыс. рублей), из которого следует похожесть карт. Суммы кредита и срока кредита (с одним и тем же доходом большие суммы берутся на больший период). По карте "Возраст" можно судить о воcтребованности кредитов среди молодежи (половина кредитов берут заемщики моложе 30 лет). По совокупности карт 'Количество иждивенцев и Среднемесячный доход модно судить об удельной доходности на каждого члена семьи заемщика. Понятно, что при одинаковых доходах к заемщикам с меньшим количеством иждивенцев доверие больше.

Подавляющее большинство кредитов берутся на покупку товаров длительного потребления. Причем, даже здесь можно выделить как дешевые, так и дорогие товары (корреспонденция с картой суммы кредитов, рис 4.8 )

Рисунок 4.8- Выделение группы кредитов на дорогие товары.

Интересна также группа заемщиков с минимальным доходом (рис. ). Как видно, их активность наблюдается в сфере оплаты услуг (медицинских и пр.) а также в сфере оплаты за образование (или повышения квалификации). Также часть заемщиков приобретает в кредит дешевые товары.

Рисунок 4.9- Область кредитования заемщиков с малым доходом.

Классификация заемщиков

Данный пример показал, как можно легко анализировать имеющиеся данные, используя карты Кохонена. Такой анализ является всего лишь частью задачи, решаемой с помощью самоорганизующихся карт. Карты Кохонена решают задачу кластеризации. Как видно на рис. 10, все заемщики разбиты на несколько сегментов. Опишем каждый из представленных сегментов.

Рисунок 4.10- Выявленные сегменты заемщиков.

Итак, 0 сегмент - самый большой, представляет всех заемщиков старше 30 лет. Это наиболее консервативная часть всех заемщиков, поэтому ей присущи сходные черты и, следовательно, необходим одинаковый подход при оказании им услуг кредитования, а также их классификации. Заемщики же моложе 30 лет делятся еще на 4 сегмента:

1 сегмент - более состоятельные молодые семьи, желающие обустроить свое жилье. Причем верхняя часть сегмента - проблемные заемщики, неадекватно оценивающие свои возможности.

2 сегмент - работающие студенты.

3 сегмент - Заемщики, приобретающие в кредит дешевые товары.

4 сегмент - группа заемщиков, берущая кредит на ремонт.

5 сегмент - Заемщики, получающие в кредит образование и различные услуги.

Кластеризация показала, что на рынке кредитования физических лиц существуют не только различные направления (кредитование товаров, образовательные кредиты), но и различные сегменты заемщиков, пользующиеся одним и тем, же видом услуг. Следовательно, для каждой такой группы необходим свой способ классификации на 'хороших' и 'плохих' заемщиков.[29]

Очевидно, что, даже анализируя отдельный сегмент рынка, доминируют те или иные факторы в зависимости от ситуации. В рассматриваемой далее модели будет показано, что при определенных условиях большую роль играет наличие собственности у кредитора, при других его образование или срок работы на предприятии. Т.е. модель классификации получается весьма гибкая. Тем не менее, существуют такие факторы, влияние которых на принятие решения о выдаче кредита мало меняется от остальных условий. Это сумма кредита, срок кредита, среднемесячный доход и среднемесячный расход (что тоже будет показано далее).

Классификация одной из групп заемщиков

Исходя из данных предыдущего анализа, можно выделить несколько групп заемщиков, берущих в кредит товары длительного пользования: кредиты на небольшие суммы, средние и значительные и проанализируем некоторые из них.

Выделим из полученных сегментов группу заемщиков, берущих небольшие кредиты на приобретение товаров. Построим для этой группы дерево решений. Входными параметрами будут факторы, влияющие на кредитоспособность согласно выдвинутой гипотезе. Выходом же дерева будет решение о выдаче кредита или отказе.

Построенная модель классификации представлена в виде дерева правил на рис. 4.11.

Рисунок 4.11- Дерево решений для небольших кредитов.

Заметим, что дерево само отсекло незначащие и мало влияющие на результат факторы, оставив среднемесячный доход, расход и срок кредита. Это можно учесть при экспресс кредитовании наиболее дешевых товаров.

В других же группах заемщиков для достоверного определения кредитоспособности модель учитывает и ряд других факторов. Так, группа заемщиков, берущих в кредит более дорогие товары длительного пользования определяется большим рядом факторов (рис.4.12 ).

Рисунок 4.12- Дерево решений для кредитования более дорогих товаров.

Для других групп классификация еще сложнее.

Модель на основе нейронной сети

Рассмотренные ранее методы классификации давали набор правил, согласно которым потенциальный заемщик оказывается 'плохим' или 'хорошим'. Для некоторых групп потенциальных заемщиков необходимо дать нечеткую оценку его кредитоспособности.

Например, введя понятие вероятности возврата кредита полностью и в срок. Это необходимо, если руководство банка выразит желание смягчить или, наоборот, ужесточить требования к потенциальным заемщикам. Для построения такой модели необходимо представить решение о выдаче кредита в числовом виде: 0 – «плохой кредит», 1 – «хороший кредит». Тогда после построения модели на выходе как раз и получится вероятность возврата. Управляющему же остается лишь задать пороговое значение вероятности, выше которой принимать решение о выдачи кредита, ниже - отказывать. Т.е. полученная модель дает возможность напрямую управлять уровнем риска. Можно свести риск к минимуму, указав в качестве порога 1 или повысить его при меньших значениях порога (но и, согласно применяющейся в банках практике, переложить его на заемщиков). Это также позволит оставаться в выигрышном положении перед конкурентами: снизить стоимость определенных услуг до уровня конкурентов, но также при этом увеличить порог, снизив риск.

Полученную модель эксперт может также анализировать, выявляя ее годность. Это осуществляется при помощи диаграммы «Что-если». В ней можно увидеть влияние на результат всего ряда значений какого-нибудь фактора при неизменных остальных факторах и оценить верность данной зависимости. Если модель ведет себя неадекватно, то, возможно, не учтены какие - то факторы, либо недостаточного данных.  Приведем пример таких зависимостей оценки кредитоспособности от образования заемщика (рис. 13) и наличия у него автомобиля (рис. 4.14).

Рисунок 4.13- Анализ полученной модели, зависимость от образования.

Рисунок 4.14- Анализ полученной модели, зависимость от наличия автомобиля.

В данном примере зависимости вполне соответствую реальности: доверие к заемщику возрастает при уменьшении его 'образованности' - лица со средним образованием более предрасположены к возврату кредита. Так же больше доверия к заемщику, имеющему автомобиль.[30]

Классификация заемщиков конечным пользователем системы

Перейдем непосредственно к классификации потенциальных заемщиков с помощью одной из построенных моделей. Для этого также используется инструмент «Что-если».

В нем конечный пользователь задает входные факторы - анкетные данные, а результатом является оценка его кредитоспособности (0 - заемщик наверняка не вернет кредит, 1 - наверняка вернет). Оценка представлена на рис. 4.15.

Рисунок 4.15- Оценка кредитоспособности потенциального заемщика.

Более продуктивным будет групповой анализ данных о потенциальных заемщиках. Принцип его проведения такой: из хранилища извлекаются данные о лицах, обратившихся за кредитом в последнее время. Согласно этим данным, для каждого клиента автоматически подбирается одна из построенных моделей оценки кредитоспособности. Через модели прогоняются все данные. Затем результаты анализа экспортируются на сторону в виде отчета. Т.е. система регулярно сама выдает оценку потенциальных заемщиков.