Анализ потенциальной клиентской базы по операциям ипотечного кредитования

курсовая работа

1.1 Анализ статистических данных

Средняя арифметическая - это тот предел, около которого группируются отдельные значения наблюдаемых и изучаемых характеристик. Средняя арифметическая - частное от деления суммы значений кого-либо признака на число элементов совокупности. Среднее арифметическое рассчитывается по формуле:

(1)

Дисперсия рассчитывается по формуле:

(2)

Среднее квадратическое отклонение рассчитывается по формуле:

(3)

Мода - значение элемента, встречающегося наиболее часто в ряду распределения. Мода определяется непосредственно по исходным данным. Модой является то значение X, у которого максимально значение fi.

Для расчета моды и медианы необходимо найти ширину медианного и модального интервала. Для определения интервала необходимо рассчитать плотность распределения для каждого интервала, а затем выбрать интервал с наибольшей плотностью. Ширина интервала рассчитывается по следующей формуле:

(4)

Плотность распределения рассчитывается по следующей формуле:

(5)

где, hi - ширина i-го интервала;

Из таблицы 1 видно, что наибольшей плотностью распределения обладает интервал с доходом от 30 до 50 тыс. руб., таким образом, он является модальным интервалом.

Мода рассчитывается по формуле:

(6)

где,

- нижняя граница модального интервала;

h - ширина модального интервала;

fMo - 1 - частота интервала, предшествующего модальному;

fMo - частота модального интервала;

fMo + 1 - частота интервала, следующего за модальным.

Медианой (Ме) называется такое значение признака X, когда одна половина значений экспериментальных данных меньше ее, а вторая половина - больше.

(7)

где,

- нижняя граница медианного интервала;

fMe-1 - накопленная частота интервала, предшествующего медианному;

fMe - частота медианного интервала;

?fi - сумма накопленных частот.

Коэффициент вариации (принято рассчитывать в процентах):

V = (у / ) * 100 (%) (8)

Ошибка по средней

Стандартное отклонение распределения средних называется стандартной ошибкой средней или просто стандартной ошибкой. Чем она меньше, тем ближе будет средняя любой конкретной выборки к генеральной средней.

Ошибка по средней рассчитывается по следующей формуле:

(9)

Ошибка по среднеквадратическому отклонению рассчитывается по следующей формуле:

(10)

Значения статистических показателей представлены в таблице 2:

Таблица 2. Показатели, характеризующие статистическую совокупность

Показатели

значение

Хср

20,10

дисперсия

128,62

среднеквадратическое отклонение

11,34

коэффициент ковариации

56,42%

ширина интервала

15

мода

19,74

медиана

19,62

ошибка по среднему

25,06

ошибка по среднеквадратическому откл.

32,90

Согласно полученным данным можно сделать следующие выводы:

§ Средний уровень дохода респондентов составил 20,10 тыс. руб.,

§ Среднеквадратическое отклонение показало, что доходы респондентов в среднем отклоняются от среднего дохода на 11,34 тыс. руб.

§ Коэффициент вариации в работе оказался равен 56,42%. Не соответствует нормативу, т.е. более 33%. Это говорит о том, что рассматриваемая статистическая совокупность неоднородна.

§ Модальный интервал соответствует доходной группе от 15 до 30 тыс. руб., а полученное значение моды в 19,74 тыс. руб. означает, что это наиболее часто встречаемый в совокупности уровень дохода респондентов.

§ Медианный интервал соответствует доходной группе от 15 до 30 тыс. руб, т.к. в пределах этого интервала расположено значение, которое делит совокупность на две равные части. Значит 19,62 тыс. руб. означает, что одна половина респондентов имеет доход до 25,06 тыс.руб., а другая - больше.

§ Ошибка по среднеквадратическому отклонению равна32,9, можно сделать вывод о том, что выборка сформирована под влиянием существенных факторов (t > 3) и ее можно рассматривать как генеральную.

Делись добром ;)