3.2 Основные этапы анализа данных
Можно выделить следующие основные этапы анализа данных:
Подготовка данных для анализа.
Проведена нормализация данных: приведение параметров к булевому типу, числовому и текстовому, характеризующих данную область данных о клиенте. После выбора параметров, данные представляют собой прямоугольную таблицу, где каждая запись представляет клиента с набором характеристик, свойств и показателей.
Из массива данных удалены данные, которые являются неинформативными, либо дублируют ключевой показатель.
Кроме того, сокращение количества полей позволяет сократить время обработки данных. Это позволяет избавиться от избыточности данных. База данных очищена от ошибок, дефектов и полей без значений.
Применение методов поиска ассоциативных правил: алгоритм apriori, DHP, предикативный анализ.
Верификация и проверка получившихся результатов.
Использование полученной информации и применение ее в работе банка.
- Министерство образования и науки Российской Федерации
- 1 Постановка задачи
- 2 Обзор источников
- 2.1 Существующие методы
- 2.1.1 Экспертные системы оценки
- 2.1.2 Балльные системы оценки кредитоспособности клиентов
- 2.1.2.1 Application-скоринг(Оценка заявки на кредит)
- 2.1.2.2 Fraud-скоринг
- 2.1.2.3 Collection-скоринг
- 2.1.2.4 Behavioral-scoring (поведенческий скоринг)
- 2.2. Проблема существующих методов
- 3 Методика решения задачи
- 3.1 Общая структура модели
- 3.2 Основные этапы анализа данных
- 4 Формулировка задачи
- 4.1 Математическая формулировка
- 4.2. Исходные данные
- 4.2 Алгоритм расчета
- 4.2.1. Алгоритм apriori
- 5 Результаты
- 6 Анализ результатов
- 6.1. Интерпретация полученных результатов
- 6.2 Основные результаты
- Заключение
- Список использованной литературы
- Приложение а.