Анализ потенциальной клиентской базы по операциям ипотечного кредитования
1.1 Анализ статистических данных
Средняя арифметическая - это тот предел, около которого группируются отдельные значения наблюдаемых и изучаемых характеристик. Средняя арифметическая - частное от деления суммы значений кого-либо признака на число элементов совокупности. Среднее арифметическое рассчитывается по формуле:
(1)
Дисперсия рассчитывается по формуле:
(2)
Среднее квадратическое отклонение рассчитывается по формуле:
(3)
Мода - значение элемента, встречающегося наиболее часто в ряду распределения. Мода определяется непосредственно по исходным данным. Модой является то значение X, у которого максимально значение fi.
Для расчета моды и медианы необходимо найти ширину медианного и модального интервала. Для определения интервала необходимо рассчитать плотность распределения для каждого интервала, а затем выбрать интервал с наибольшей плотностью. Ширина интервала рассчитывается по следующей формуле:
(4)
Плотность распределения рассчитывается по следующей формуле:
(5)
где, hi - ширина i-го интервала;
Из таблицы 1 видно, что наибольшей плотностью распределения обладает интервал с доходом от 30 до 50 тыс. руб., таким образом, он является модальным интервалом.
Мода рассчитывается по формуле:
(6)
где,
- нижняя граница модального интервала;
h - ширина модального интервала;
fMo - 1 - частота интервала, предшествующего модальному;
fMo - частота модального интервала;
fMo + 1 - частота интервала, следующего за модальным.
Медианой (Ме) называется такое значение признака X, когда одна половина значений экспериментальных данных меньше ее, а вторая половина - больше.
(7)
где,
- нижняя граница медианного интервала;
fMe-1 - накопленная частота интервала, предшествующего медианному;
fMe - частота медианного интервала;
?fi - сумма накопленных частот.
Коэффициент вариации (принято рассчитывать в процентах):
V = (у / ) * 100 (%) (8)
Ошибка по средней
Стандартное отклонение распределения средних называется стандартной ошибкой средней или просто стандартной ошибкой. Чем она меньше, тем ближе будет средняя любой конкретной выборки к генеральной средней.
Ошибка по средней рассчитывается по следующей формуле:
(9)
Ошибка по среднеквадратическому отклонению рассчитывается по следующей формуле:
(10)
Значения статистических показателей представлены в таблице 2:
Таблица 2. Показатели, характеризующие статистическую совокупность
Показатели |
значение |
|
Хср |
20,10 |
|
дисперсия |
128,62 |
|
среднеквадратическое отклонение |
11,34 |
|
коэффициент ковариации |
56,42% |
|
ширина интервала |
15 |
|
мода |
19,74 |
|
медиана |
19,62 |
|
ошибка по среднему |
25,06 |
|
ошибка по среднеквадратическому откл. |
32,90 |
Согласно полученным данным можно сделать следующие выводы:
§ Средний уровень дохода респондентов составил 20,10 тыс. руб.,
§ Среднеквадратическое отклонение показало, что доходы респондентов в среднем отклоняются от среднего дохода на 11,34 тыс. руб.
§ Коэффициент вариации в работе оказался равен 56,42%. Не соответствует нормативу, т.е. более 33%. Это говорит о том, что рассматриваемая статистическая совокупность неоднородна.
§ Модальный интервал соответствует доходной группе от 15 до 30 тыс. руб., а полученное значение моды в 19,74 тыс. руб. означает, что это наиболее часто встречаемый в совокупности уровень дохода респондентов.
§ Медианный интервал соответствует доходной группе от 15 до 30 тыс. руб, т.к. в пределах этого интервала расположено значение, которое делит совокупность на две равные части. Значит 19,62 тыс. руб. означает, что одна половина респондентов имеет доход до 25,06 тыс.руб., а другая - больше.
§ Ошибка по среднеквадратическому отклонению равна32,9, можно сделать вывод о том, что выборка сформирована под влиянием существенных факторов (t > 3) и ее можно рассматривать как генеральную.