logo
Статистика страхования

2. ПРАКТИЧЕСКОЕ ЗАДАНИЕ

Исходные данные

Таблица 2.1. Показатели деятельности предприятия за отчётный период

№ предприятия

Объём

производства, тонн

Среднегодовая стоимость основных производственных фондов, млн. руб.

А

1

2

1

978

3,52

2

1043,6

3,71

3

620,6

2,13

4

485,1

1,05

5

884,5

2,82

6

1020,4

4,1

7

872,3

2,73

8

421,8

1,5

9

280,6

0,89

10

851,8

3,04

11

637,2

2,37

12

815,6

2,56

13

921,7

3,2

14

544,3

1,64

15

915,1

3

16

1010,4

3,61

1. Для того, чтобы провести аналитическую группировку с равными интервалами, необходимо определить оптимальное число групп, которое рассчитывается по формуле Стержесса:

m=1+3,321·lgN, (1)

где m - число групп, N - число единиц совокупности.

m=1+3,321·lg16=4,999.

Так как число групп должно быть целым, то выбираем m=5.

2. В качестве признака, по которому строится группировка, берётся факторный признак х - объём производства, от которого зависит результативный признак у - среднегодовая стоимость основных производственных фондов.

Зная число групп, рассчитываем величину интервала:

(2)

Величина интервала составляет:

Таблица 2.2. Вспомогательная таблица для построения группировки предприятий по объёму производства

№ группы

Группы предприятий по объёму производства, тонн

Номера предприятий, входящих в группу

1

280,6 - 433,2

8, 9

2

433,2 - 585,8

4, 14

3

585,8 - 738,4

3, 11

4

738,4 - 891

5, 7, 10, 12

5

891 - 1043,6

1, 2, 6, 13, 15, 16

На основании вспомогательной таблицы (таблица 2) и таблицы исходных данных (таблица 1), построим аналитическую группировку и представим её в статистической таблице (таблица 3).

Таблица 2.3. Аналитическая группировка предприятий по объёму производства для выявления взаимосвязи между показателями: объём производства и среднегодовой стоимости основных производственных фондов

Группы предприятий по объёму производства, тонн

Количество

предприятий,

ед.

Удельный вес

Группы предприятий, %

Объём производства, тонн

Среднегодовая стоимость основных производственных фондов, млн. руб.

итого

в среднем

итого

в среднем

А

1

2

3

4

5

6

280,6 - 433,2

2

12,5

702,4

351,2

2,39

1,195

433,2 - 585,8

2

12,5

1029,4

514,7

2,69

1,345

585,8 - 738,4

2

12,5

1257,8

628,9

4,5

2,25

738,4 - 891

4

25

3424,2

856,05

11,15

2,788

891 - 1043,6

6

37,5

5889,2

981,53

21,14

3,523

Итого:

16

100

12303

41,87

В среднем:

768,94

2,617

В представленной таблице 3 показатель «Удельный вес группы предприятий» [УВ] для графы 2 рассчитывается на основании формулы:

, (3)

где f - частота i-ой группы, т.е. количество предприятий в каждой группе.

Из таблицы видно, что наибольший удельный вес имеет 5 группа - 37,5 %. При этом наблюдается рост среднего значения объёма производства и среднегодовой стоимости основных производственных фондов, что говорит о возможном наличии между данными положительной связи.

3. Для того, чтобы построить гистограмму распределения и кумуляту создадим вспомогательную таблицу.

Таблица 2.4. Вспомогательная таблица для построения графических характеристик

Группы предприятий по объёму производства, тонн

f, ед

s, ед.

А

1

2

280,6 - 433,2

2

2

433,2 - 585,8

2

4

585,8 - 738,4

2

6

738,4 - 891

4

10

891 - 1043,6

6

16

Итого:

16

В таблице 4 в графе 2, представлена накопленная частота [s], которая показывает, сколько единиц совокупности имеют значения признака не больше, чем данное значение. Данный показатель вычисляется путём последовательного прибавления к частоте первого интервала частот последующих интервалов.

На рисунках 1 и 2 представлены соответственно гистограмма распределения и кумулята

Рис. 2.1. Гистограмма распределения

Рис. 2.2. Кумулята

При построении гистограммы (рис.1) на оси абсцисс (х) откладываются величины интервалов, а частоты изображаются прямоугольниками, построенными на соответствующих интервалах. Высота столбцов должна быть пропорциональна частотам.

При построении кумуляты (рис.2) интервального вариационного ряда по оси абсцисс (х) откладываются варианты ряда, а по оси ординат (s) накопленные частоты, которые наносят на поле графика в виде перпендикуляров к оси абсцисс в верхних границах интервалов. Затем эти перпендикуляры соединяют и получают ломаную линию, то есть кумуляту.

4. Факторный признак - объём производства. Среднее значение для данного признака можно определить двумя способами:

1 способ - для несгруппированных данных, с помощью простой средней:

, (4)

где n - количество значений ряда наблюдения.

тонн

2 способ - для вариационного ряда (таблица 3) с помощью формулы взвешенной средней:

, (5)

где - среднее значение i-ой группы, m - число групп.

тонн

Размах вариации [R] зависит от величины только двух крайних вариант и не учитывает степени колеблемости основной массы членной ряда:

, (6)

где , - соответственно максимальное и минимальное значение признака.

Размах вариации составляет:

R=1043,6 - 280,6 = 763

Среднее линейное отклонение, дисперсия и среднее квадратическое отклонение можно определить двумя способами.

Среднее линейное отклонение:

· для первичного ряда:

(7)

· для вариационного ряда:

(8)

Дисперсия:

· для первичного ряда:

(9)

· для вариационного ряда:

(10)

Среднее квадратическое отклонение:

· для первичного ряда:

(11)

· для вариационного ряда:

(12)

Используем способ вариационного ряда. Для расчёта по формулам (8), (10), (12) целесообразно построить вспомогательную таблицу расчёта.

Таблица 2.5. Вспомогательная таблица для расчёта показателей вариации

Группы предприятий по объёму производства, тонн

 ,

тонн

 ,

ед.

,

тонн

,

тонн

,

тонн

,

тонн

А

1

2

3

4

5

6

280,6 - 433,2

351,2

2

417,7

835,48

174504,6

349009,2

433,2 - 585,8

514,7

2

254,2

508,48

64636,7

129273,4

585,8 - 738,4

628,9

2

140,03

280,08

19610,5

39221

738,4 - 891

856,05

4

87,11

348,45

7588,6

30354,4

891 - 1043,6

981,533

6

212,6

1275,58

45196,97

271181,8

Итого:

16

3248,05

819039,8

На основании таблицы 5, получаем:

Зная среднее квадратическое отклонение и среднее значение признака, определяется коэффициент вариации:

, (13)

Получаем,

%

Так как коэффициент вариации превышает 25%, то вариация объёма производства сильная. Так как коэффициент вариации не превышает 33%, то это говорит об однородности информации.

5. В основе дисперсионного анализа лежит разделение дисперсии на части или компоненты. Данный анализ сводится к расчёту и анализу трёх видов дисперсий: общей, внутригрупповой и межгрупповой. Общая дисперсия измеряет вариацию результативного признака по всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Данный вид дисперсии рассчитывается на основании исходных несгруппированных данных по формуле:

, (14)

Для расчёта по формуле (14) построим вспомогательную таблицу расчёта.

Таблица 2.6 Вспомогательная таблица для расчёта общей дисперсии

№ п/п

 ,

тонн

 ,

млн. руб.

, млн. руб.

,

(млн. руб)

А

1

2

3

4

1

978

3,52

0,9

0,81

2

1043,6

3,71

1,09

1,19

3

620,6

2,13

-0,49

0,24

4

485,1

1,05

-1,57

2,46

5

884,5

2,82

0,2

0,04

6

1020,4

4,1

1,48

2,19

7

872,3

2,73

0,11

0,01

8

421,8

1,5

-1,12

1,25

9

280,6

0,89

-1,73

2,99

10

851,8

3,04

0,42

0,18

11

637,2

2,37

-0,25

0,06

12

815,6

2,56

-0,06

0,004

13

921,7

3,2

0,58

0,34

14

544,3

1,64

-0,98

0,96

15

915,1

3

0,38

0,14

16

1010,4

3,61

0,99

0,98

Итого

12303

41,87

13,86

Среднее

768,94

2,62

0,866

На основании таблицы 6 определяем:

(млн. руб)

Межгрупповая дисперсия характеризует систематическую вариацию под воздействие признака - фактора, положенного в основание группировки. Она является мерой вариации частных средних по группам вокруг общей средней и определяется по формуле:

(15)

Для расчёта по формуле (12) построим вспомогательную таблицу расчёта.

Таблица 2.7 Вспомогательная таблица для расчёта межгрупповой дисперсии

Группы предприятий по объёму производства, тонн

 ,

ед.

 ,

млн. руб.

, млн. руб.

,

(млн. руб)

,

(млн. руб)

А

1

2

3

4

5

280,6 - 433,2

2

1,195

-1,425

2,03

4,06

433,2 - 585,8

2

1,345

-1,275

1,63

3,25

585,8 - 738,4

2

2,25

-0,37

0,14

0,27

738,4 - 891

4

2,788

0,168

0,03

0,11

891 - 1043,6

6

3,523

0,903

0,82

4,89

Итого:

12,59

В среднем:

0,787

На основании таблицы 7 определяем:

Вариацию, обусловленную влиянием прочих факторов, характеризует в каждой группе внутригрупповая дисперсия :

, (16)

Соответственно внутригрупповая дисперсия определяется путём суммирования отдельных внутригрупповых дисперсий, взвешенных по частоте.

, (17)

Для расчёта общей внутригрупповой дисперсии построим вспомогательную таблицу расчёта:

Таблица 2.8 Вспомогательная таблица для расчёта внутригрупповой дисперсии

Группы предприятий по объёму производства,

тонн

№ предприятий, входящих в группу

 ,

ед.

, млн. руб.

 ,

млн. руб.

,

(млн. руб.)

,

(млн. руб.)

,

(млн. руб.)

280,6 - 433,2

8

2

1,5

1,195

0,0930

0,093

0,186

9

0,89

0,0930

433,2 - 585,8

4

2

1,05

1,345

0,087

0,087

0,174

14

1,64

0,087

585,8 - 738,4

3

2

2,13

2,25

0,014

0,014

0,029

11

2,37

0,014

738,4 - 891

5

4

2,82

2,788

0,001

0,0299

0,1199

7

2,73

0,003

10

3,04

0,064

12

2,56

0,052

891 - 1043,6

1

6

3,52

3,523

0

0,126

0,753

2

3,71

0,035

6

4,1

0,339

13

3,2

0,104

15

3

0,274

16

3,61

0,008

Итого:

16

41,87

1,26

В среднем:

0,079

На основании таблицы 8 определяем:

(млн. руб.)

Для проверки правильности найденных дисперсий воспользуемся правилом сложения дисперсий, согласно которому:

(18)

Подставим найденные значения в формулу (18):

0,866=0,787+0,079 (млн. руб.)

0,866=0,866 (млн. руб.)

Так как правило сложения дисперсий выполняется, то рассчитанные значения дисперсий определены верно.

Определим силу влияния группировочного признака на образование общей вариации, рассчитав эмпирический коэффициент детерминации :

, (19)

Получаем:

Так как полученный эмпирический коэффициент детерминации близок к единице, то это говорит о том, что связь между рассматриваемыми признаками достаточно сильная.

Эмпирическое корреляционное отношение определяется по формуле:

(20)

Получаем:

Так как >0,7, связь между признаками объём реализации и среднегодовая стоимость основных производственных фондов - сильная.

6. В рамках корреляционного анализа решается задача обнаружения линейной связи и оценки её уровня. Самый простой способ оценки связи - это графический способ. В этом случае строится поле корреляции, которое образует множество точек с координатами (), i=1, ... N.

По виду корреляционного поля можно оценить связь. Достаточно построить на корреляционном поле вертикальную прямую х = и горизонтальную прямую у = . Корреляционное поле будет таким образом разделено на 4 зоны:

· х меньше , у меньше - зона (- , -)

· х меньше , у больше - зона (- , +)

· х больше , у меньше - зона (+ , -)

· х больше , у больше - зона (+ , +).

Корреляционный анализ можно проводить как для несгруппированных данных, так и для сгруппированных. Проведем корреляционный анализ для исходных несгруппированных данных (таблица 1).

Рис 3. Корреляционное поле для исходных данных

Поскольку 15 из 16 точек лежит в зонах (- , -) и (+, +), то линейная связь между рассматриваемыми признаками х и у положительная.

Парный линейный коэффициент корреляции rхарактеризует направление взаимосвязи и оценивает её степень тесноты.

(21)

Значения всех необходимых показателей найдём с помощью вспомогательной таблицы.

Таблица 2.9 Вспомогательная таблица для расчёта коэффициента корреляции (несгруппированные данные)

№ п/п

А

1

2

3

4

5

1

978

3,52

3442,56

43722,8

0,81

2

1043,6

3,71

3871,76

75460,1

1,19

3

620,6

2,13

1321,88

21992,9

0,24

4

485,1

1,05

509,36

80542,4

2,46

5

884,5

2,82

2494,29

13363,4

0,04

6

1020,4

4,1

4183,64

63252,3

2,19

А

1

2

3

4

5

7

872,3

2,73

2381,38

10691,6

0,01

8

421,8

1,5

632,7

120478

1,25

9

280,6

0,89

249,73

238437

2,99

10

851,8

3,04

2589,47

6872,41

0,18

11

637,2

2,37

1510,16

17344,9

0,06

12

815,6

2,56

2087,94

2180,89

0,004

13

921,7

3,2

2949,44

23347,8

0,34

14

544,3

1,64

892,65

50445,2

0,96

15

915,1

3

2745,3

21374,4

0,14

16

1010,4

3,61

3647,54

58322,3

0,98

Итого:

12303

41,87

35509,8

847829

13,86

Среднее:

768,94

2,62

2219,36

52989,3

0,87

Среднее квадратическое отклонение определяем на основании формулы:

(22)

Подставив данные из таблицы 9, получаем:

(млн. руб.)

(млн. руб.)

Таким образом, парный линейный коэффициент корреляции:

=0,97

Поскольку полученный коэффициент корреляции больше 0, связь положительная. Так как >0,7 и практически равен 1, то взаимосвязь между признаками очень высокая.

Проведем корреляционный анализ для сгруппированных данных (табл. 3).

Рис 4. Корреляционное поле для вариационного ряда

Поскольку 5 точек из 5 лежит в зонах (- , -) и (+, +), то линейная связь между рассматриваемыми признаками х и у положительная.

Составим вспомогательную таблицу для расчёта всех необходимых показателей необходимых для определения парного линейного коэффициента корреляции по формуле (21).

Таблица 2.10 Вспомогательная таблица для расчёта коэффициента корреляции (несгруппированные данные)

А

1

2

3

4

5

6

7

8

1

351,2

1,195

2

702,4

2,39

839,37

349009

4,06

2

514,7

1,345

2

1029,4

2,69

1384,54

129273

3,25

3

628,9

2,25

2

1257,8

4,5

2830,05

39221

0,27

4

856,1

2,788

4

3424,2

11,15

9546,67

30354,4

0,11

5

981,5

3,523

6

5889,2

21,14

20747,64

271182

4,89

Итого:

3332,4

11,101

12303

41,87

35348,28

819040

12,59

Среднее:

768,94

2,62

2209,27

51189,99

0,787

Определим среднее квадратическое отклонение по формуле (22):

(млн. руб.)

(млн. руб.)

Таким образом, парный линейный коэффициент корреляции:

=0,98

=0,97

Поскольку полученный коэффициент корреляции больше 0, связь положительная. Так как >0,7 и практически равен 1, то взаимосвязь между признаками очень высокая.

Значение коэффициента корреляции для несгруппированных данных является приближённым, так как происходит усреднение значений признака для каждой выделенной группы. Коэффициент корреляции для несгруппированных данных является точным, но связан с большими вычислительными затратами, поэтому на практике лучше проводить корреляционный анализ для несгруппированных данных, при условии что полученная группировка является однородной.