logo search
Лаптырев Д

Задание классифицирующих правил на временных интервалах

Пусть, классифицируя лицевые счета по корсчетам банков, в период с 01.04.2000 по 30.04.2000 необходимо представить все лицевые счета "Бэнк оф Карибати" как средства резидентов (например, на практике названный банк выполняет лишь транзитные функции по размещению средств одного из российских банков). В этом случае будем иметь следующую систему классифицирующих правил:

┌────────────┬───────────────────────┬──────────────────────────────────┐

│Первичный АП│ Временной интервал │ Правило классификации │

├────────────┼───────────────────────┼──────────────────────────────────┤

│ Корсчета │ [-?; 30.03.2000] │NBS2 = 30109 │

│ резидентов │ │ │

│ ├───────────────────────┼──────────────────────────────────┤

│ │ [01.04. 2000; │NBS2 = 30109 ИЛИ (NLS содержит│

│ │ 30.04.2000] │"Банк оф Карибати") │

│ ├───────────────────────┼──────────────────────────────────┤

│ │ [01.05.2000;+ ?] │NBS2 = 30109 │

├────────────┼───────────────────────┼──────────────────────────────────┤

│ Корсчета │ [-?; 30.03.2000] │NBS2 >= 30111 И NBS2 <= 30113 │

│нерезидентов│ │ │

│ ├───────────────────────┼──────────────────────────────────┤

│ │[01.04.2000:30.04.2000]│(NBS2 >= 30111 И NBS2 <= 30113)│

│ │ │(NLS не содержит "Бэнк оф│

│ │ │Карибати") │

│ ├───────────────────────┼──────────────────────────────────┤

│ │ [01.05.2000;+ ?] │NBS2 >= 30111 И NBS2 <= 30113 │

└────────────┴───────────────────────┴──────────────────────────────────┘

Для расчета значений вторичных аналитических показателей используются значения первичных и иных (возможно, вторичных) АП. В общем случае между вторичным аналитическим показателем v, и множеством его аргументов a_i1,..., a_in задается произвольная функциональная зависимость F_t вида:

v_i = F_i(a_i1,..., a_in). (5.1)

На произвольный характер F_t в каждой конкретной реализации системы аналитической обработки данных могут накладываться специфические ограничения, обусловленные различными факторами, в том числе и целесообразностью. Так, например, для задачи преобразования первичных финансовых данных, применяемых в рассматриваемой в книге автоматизированной технологии финансового планирования, характерно использование линейных соотношений и агрегирующих функций вида (П2.1). В других задачах, сопряженных с расчетом средних, эффективных и др. процентных ставок, а также различных относительных показателей финансовой деятельности, соотношения (5.1) могут подразумевать более широкий спектр математических операций.

При наличии большого числа АП и связей между ними аналитику практически невозможно осознавать и помнить все эти взаимосвязи. Между тем это необходимо как при поиске возможных ошибок, так и в процессе их предотвращения. Ниже рассматриваются некоторые базовые решения, позволяющие переложить анализ критических взаимосвязей между показателями с аналитика (пользователя) на СОАД.

С точки зрения реализации Системы аналитической обработки данных каждый вторичный АП задает направленный граф, в котором узлами служат аналитические показатели, а ребрами - связи между аналитическими показателями (рис. 5.9).

При таком представлении взаимосвязей между показателями в метаданных САОД необходимо хранить зависимости вида X -> A, Y -> A, Z -> А*(43). Смысл интерпретации вторичных АП в виде графов с последующим хранением таких данных виден, если всю Систему вторичных аналитических показателей представить в виде подобных графов (рис. 5.10) и хранить в базе метаданных сведения обо всех связях между вторичными АП, в том числе транзитивных:

X -> А, X -> F, А -> F, Y -> A, Y -> F, Y -> Е, Y

Е -> Н, ..., B -> D, B -> S, D -> S. (5.2)

"Рис. 5.9. Схема представления ВАП в виде направленного графа"

"Рис. 5.10. Граф Системы вторичных аналитических показателей"

С помощью таких метаданных, которые определены зависимостями вида (5.2), можно решать задачи, относящиеся к следующим двум классам.

1. Поуровневая разбивка ВАП при расчете их значений. Если показатель А использует в качестве аргумента показатель X, т.е. X -> А, то очевидно, что значение X должно рассчитываться, прежде чем САОД приступит к расчету значения А. Анализируя с помощью специальных алгоритмов зависимости указанного вида, она разбивает все множество V вторичных аналитических показателей на ряд подмножеств V_1, V_2,..., V_N, т. е. на N уровней. При этом показатели 1 уровня используются другими АП, но сами их не используют (что характерно для первичных АП), в то время как показатели N уровня используют показатели уровней 1, 2, ..., N-1, но сами в качестве аргументов не используются ни одним из существующих вторичных показателей.

2. Анализ ацикличности системы ВАП. Никакой аналитический показатель, пусть и транзитивно, не может использовать сам себя. Анализ ацикличности существенно затрудняется при наличии большого числа ВАП и замысловатых связей между ними. Примером довольно очевидной попытки реализовать ацикличность может для показанного на рис. 5.10 графа служить использование АП F параметром для АП Z. Во многих случаях при достаточном числе промежуточных АП (уровней) на пути от Z до F ошибочность таких (ацикличных) действий может быть не вполне очевидной. При хранении всех транзитивных зависимостей между АП (пример 5.6) задача выявления таких потенциальных циклов является вполне тривиальной.

Пример 5.6