logo
мат-лы по статистике1

Статистическая сводка и группировка

Сводка – комплекс последовательных операций по обобщению конкретных единичных факторов для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом.

Виды сводки:

Группировка – расчленение множества единиц изучаемой совокупности на группы по определенным, существенным для них признакам.

Группировочный признак (основание группировки) – признак, по которому производится разбиение единиц совокупности на отдельные группы.

Оптимальное число групп определяется с помощью формулы Стерджесса:

где - число групп;

- число единиц совокупности

Виды группировок:

Типологическая группировка – распределение исследуемой качественной разнородной совокупности на классы, социально-экономические типы, однородные группы единиц в соответствии с правилами научной группировки.

Структурная группировка – разделение исследуемой качественно однородной совокупности на группы, характеризующие ее структуру по какому-либо варьирующему признаку.

Аналитическая группировка – группировка, выявляющая взаимосвязи между изучаемыми явлениями и их признаками.

Ряд распределения – упорядоченное распределение единиц совокупности на группы по определенному варьирующему признаку.

Виды рядов распределения:

Варианты – отдельные значения признака, которые он принимает в вариационном ряду.

Частоты ( ) – выраженные в долях единицы или в процентах к итогу значения изучаемого признака.

Частости ( ) – частоты, выраженные в виде относительных величин (доли единиц, процентов).

Объем распределения (численность распределения) – сумма всех частот.

Интервал – значения варьирующего признака, лежащие в определенных границах.

Величина интервала – разность между верхней и нижней границами интервала.

Закрытые интервалы – интервалы, у которых обозначены обе границы.

Открытые интервалы – интервалы, у которых указана только одна граница.

Для группировки:

- с равными интервалами величина интервала находится по

формуле: где - размах вариации;

; - максимальное и минимальное значения признака в совокупности;

- число групп;

- с неравными интервалами величина интервала может изменяться в арифметической и геометрической прогрессии по формулам:

Для вариационного ряда с неравными интервалами исчисляют плотность распределения.

Абсолютная плотность распределения – это частота, приходящаяся на единицу длины интервала, т.е. .

Относительная плотность распределения – частость, приходящаяся на единицу длины интервала, т.е. .

Полигон, использующийся при изображении дискретных вариационных рядов, представляет собой замкнутый многоугольник, абсциссами вершин которого являются значения варьирующего признака, а ординатами – соответствующие им частоты или частости.

Гистограмма (разновидность столбиковых диаграмм), применяется для изображения интервального вариационного ряда, и представляет собой совокупность столбиков с основаниями, равными ширите интервалов, и высотой, соответствующей частоте. Гистограмма может быть преобразована в полигон распределения, если найти середины сторон прямоугольников и затем эти точки соединить отрезками.

Кумулятивная кривая (кумулята) используется для изображения ряда накопленных частот.

Вторичная группировка – операция по образованию новых групп

на основе ранее построенной группировки.

Методы построения вторичной группировки: