<<
>>

6.1. ВАРИАЦИЯ ПРИЗНАКА В СОВОКУПНОСТИ И ЗНАЧЕНИЕ ЕЕ ИЗУЧЕНИЯ

Построение рядов распределения является составной частью сводной. обработки данных статистического наблюдения.

В зависимости от того, является ли признак, взятый за основу группировки, качественным или количественным, различают соответственно два типа рядов распределения: атрибутивные и вариационные.

Ряды распределения, построенные по качественным признакам, называют атрибутивными. Примером атрибутивных рядов может служить распределение населения по полу, характеру труда, национальности, профессиям и т. д. Ряды распределения, построенные по количественному признаку, называются вариационными рядами. Величины того или иного количественного признака у отдельных единиц совокупности более или менее различаются между собой. Такое различие величины признака носит название вариации. Числовые значения признака, встречающиеся в данной совокупности, называют вариантами значений.

Например, себестоимость 1 кВт-ч электроэнергии по различным тепловым станциям одной энергосистемы характеризуется следующими данными:

номера ТЭЦ 1 2 3 4 5

себестоимость 1 кВт.ч электроэнергии, коп. 0,58 0,66 0,59 0,67 0,66

В примере перечислены четыре варианта значений признака, колеблющихся в пределах от 0,58 до 0,67 коп. Колебания уровня себестоимости 1 кВт-ч на различных ТЭЦ обусловлены различными факторами, часто действующими в противоположных направлениях (например, снижение удельного расхода топлива ведет к снижению себестоимости 1 кВт-ч электроэнергии, а повышение цен на топливо ведет к увеличению себестоимости). В результате совместного действия многих факторов складывается величина себестоимости 1 кВт-ч на отдельных ТЭЦ.

Изучение характера и степени вариации признаков у отдельных единиц, составляющих изучаемую совокупность, является важнейшим вопросом всякого статистического исследования. Представленные выше данные о себестоимости 1 кВт-ч электроэнергии по пяти ТЭЦ без какой-либо их систематизации образуют так называемый первичный ряд. При наличии достаточно большого количества вариантов значений признака первичный ряд становится трудно обозримым и непосредственное рассмотрение его не дает представления о распределении единиц по величине признака в совокупности. Первым шагом в деле упорядочения первичного ряда является его ранжирование, т. е. расположение всех вариантов ряда в возрастающем (или убывающем) порядке.

S2

Расположим значения признака первичного ряда в возрастающем порядке и получим ранжированный ряд:

порядковый номер ТЭЦ себестоимость 1 кВт-ч электроэнергии, коп.

1

0,58

3

0,59

2

0,63

5

0,66

4

0,67

При рассмотрении ряда первичных данных можно видеть, что варианты значений признака у отдельных единиц повторяются. Число повторений отдельных вариантов называют частотой повторения. В дальнейшем частоту повторения будем обозначать буквой /, а сумму частот, равную объему изучаемой совокупности, — п.

По характеру вариации различают дискретные и непрерывные признаки. Дискретные признаки отличаются друг от друга на некоторую конечную величину, т. е. даны в виде прерывных чисел. Например, тарифный разряд рабочих, число детей в семье, число рабочих на предприятии и т. д. Непрерывные признаки могут отличаться один от другого на сколь угодно малую величину и в определенных границах принимать любые значения. Например, заработная плата рабочих, процент выполнения рабочими норм выработки, стоимость основных фондов предприятия и т. д.

Способы построения вариационного ряда для этих видов признаков различны. Для построения дискретного ряда с небольшим числом вариантов выписываются все встречающиеся варианты значений признака, обозначаемые через Хи а затем подсчитывается частота повторения каждого варианта ft. Ряд распределения принято оформлять в виде таблицы. Например, распределение рабочих участка по квалификации характеризуется данными табл. 6.1.

Таким образом, ряд первичных данных, характеризующих квалификацию двадцати рабочих, заменен коротким рядом, состоящим из пяти групп. Вместо абсолютного числа рабочих, имеющих определенный разряд, можно установить долю рабочих этого разряда. Частоты, представленные в относительном выражении, называют частостями и обозначают W{ (см. гр. 3 табл. 6.1):

Таблица 6.1 Тарифный разряд рабочего Число рабочих, их е

кщи. данный разряд 5 8 4 2 0,05 0,25 0,40 0,20 0,10 1

6

14 18

20 Итого 20 1,00 U

2/i

Частости могут быть выражены в долях единицы или в процентах. Замена частот частостями позволяет сопоставлять вариационные ряды с различным числом наблюдений. Распределение, в ко

93

тором вариация признака выражается в виде непрерывно изменяющейся величины, называется непрерывным. Такие распределения наиболее распространены в практике статистической работы.

Для построения ряда распределения непрерывных признаков значения вариантов указываются в интервалах «от—до», так как значения признака у отдельных единиц могут вообще не повторяться. Поэтому при построении интервальных рядов распределения необходимо прежде всего установить число групп (интервалов), на которые следует разбить все единицы изучаемой совокупности. При группировке внутри однокачественных совокупностей появляется возможность применения равных интервалов, число которых зависит от вариации признака в совокупности и от количества обследованных единиц.

Определение величины интервала i для построения вариационного ряда с равными интервалами производится следующим образом: 1) вычисляется разность между максимальным и минимальным значениями признака первичного ряда (так называемый размах вариации, R)i

R — -^max -^min '

2) размах вариации делится на число групп К, т. е. i=— . Число

К

групп приближенно определяется по формуле /С~ 1+3,322 \gn, где п — число изучаемых единиц совокупности. Указанное выражение почти всегда оказывается дробной величиной, которую округляют до ближайшего целого числа (число групп не может быть дробной величиной)1.

Величина интервала должна определяться в соответствии с точностью данных наблюдения: если исходные данные представлены целыми числами, то рассчитанная величина интервала округляется до ближайшего целого числа, если данные представлены с точностью до 0,1, то и величина интервала округляется до целых с десятыми и т. д.

Знание величины интервала позволяет определить границы всех интервалов ряда распределения. Нижнюю границу первого интервала целесообразно принимать равной минимальному значению признака (иногда за начальную границу берется число, ближайшее к минимальному значению). В каждый интервал включаются варианты, числовые значения которых больше нижней границы и меньше или равны верхней границе. Например, имеются данные о размере средней дневной заработной платы 20 рабочих участка (руб.): 3,8; 4,3; 6,7; 5,4; 5,1; 8,2; 4,6; 5,7; 6,4; 5,9; 5,2; 6,2; 6,3; 8,0; 7,9; 5,8; 4,9; 7,6; 7,0; 6,9.

1 Рассмотренный способ приближенного определения интервала группировки

был предложен в 1926 г. Г. А. Стерджессом: i= . m"x-r^—. Для определения

1+3,322 Ign

числа групп можно воспользоваться и другой формулой: Kx^og2n + l. 94

Определяем количество групп интервального вариационного ряда! /С» 1+3,322 lg 20=1+3,322-1,301=5,32. Округляя, получим число групп, равное 5. Величина интервала составит 0,9 руб.

— -j , В результате получим ряд распределения рабо-

та б л и ц а 6.2

чих по размеру средней дневной заработной платы (см. графы 1, 2 табл. 6.2). Значения признака у отдельных единиц совпали с границами интервалов (например, значения 4,6; 6,4 и 8,2). Так как максимальное значение признака совпадает с верхней границей последнего интервала, эти значения признака следует включать в интервал, верхняя граница которого совпадает с указанным значением. (Например, значение признака 4,6 включается в первый интервал, значение признака 6,4 — в третий.)

Если вариационный ряд дан в неравных интервалах, то для правильного представления о характере распределения необходимо рассчитать абсолютную и относительную плотности распределения, для определения которых вычисляют отношение частот или частостей к величине интервала, т. е. абсолютная плотность — Средняя днев- Число Накоплен- ная зарплата. рабочих ные часто- руб. xt h ты sl 1 2 3 3,7—4,6 3 3 4,6-5,5 4 7 5,5-6,4 6 13 6,4—7,3 3 16 7,3-8,2 4 20 Итого 20 m

относительная плотность —mtL

Эти показа-

1" i

тели используют для преобразования интервалов, что бывает необходимым при сравнительной оценке данных, собранных по различным совокупностям и по-разному обработанных. Например,

Т а б л и ц а 6.3

Таблица 6.4 Завод 1 Завод 2 Количество рабочих, % к итогу группы рабочих по проценту выполнения норм выработки количество рабочих, % к итогу группы рабочих по

проценту выполнения норм выработки * Группы pafo-о чнх по про-к - центу выполни s нения корм к g выработки чю о

О rt Ы Q.S

завод 1 завод 2 До 90

90—100

100—110

110—120

120—140

140—150

150—160 2 3

50 30 8 5 2 До 100

100—120

120—150

150—180

180 и

выше 8 До 100 40

20 100—120 15

17 120—150

150 и выше 5 80 13

2 8 40

20 32 Итого 100 100 Итого 1С0 100 95

по двум предприятиям известно распределение рабочих по проценту выполнения норм выработки (табл. 6.3). Для перегруппировки данных с целью получения сопоставимых групп и их анализа можно воспользоваться простым укрупнением интервалов, и тогда для двух предприятий будут использоваться одинаковые интервалы (табл. 6.4).

Можно воспользоваться и другой группировкой по проценту выполнения норм выработки, например:

группа рабочих 12 3 4 5

процент выполнения норм выработки до 100 100—110 110—120 120—140 14Г—160

Для такой группировки встает необходимость расщепления интервалов ряда распределения рабочих завода 2. Если известна относительная плотность распределения, то частости соответствующего интервала можно определить умножением плотности на величину интервала, т. е. Wi = rtii0-i.

По данным табл. 6.3 определяем плотности распределения группы рабочих по проценту выполнения норм выработки для интервалов:

второго

третьего

100—120 mi =2,0

120-150 #л,- = —

четвертого 150— 180

т

(4)-

о_ 1 /15 \

1 ~ Т [~W )

Тогда, например, количество рабочих (в % к итогу) завода 2, выполняющих норму на 140—160%, определится так:

— -10+— 10=12. 3 2

Результаты перегруппировки представлены в табл. 6.5.

<< | >>
Источник: Т. В. Рябушкин. Общая теория статистики: Учебник/Т. В. Рябушкин, 0-28 М. Р. Ефимова, И. М. Ипатова, Н. И. Яковлева. — М.: Финансы и статистика. — 279 с, ил.. 1981

Еще по теме 6.1. ВАРИАЦИЯ ПРИЗНАКА В СОВОКУПНОСТИ И ЗНАЧЕНИЕ ЕЕ ИЗУЧЕНИЯ:

  1. 6.5. ПОКАЗАТЕЛИ КОЛЕБЛЕМОСТИ (ВАРИАЦИИ) ПРИЗНАКА
  2. 4.5. Показатели вариации Значение показателей вариации
  3. 3.4. СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ ТИПОВ ЯВЛЕНИЙ И ВЫБОР ПРИЗНАКОВ
  4. 7.2.3. Изучение связи между качественными признаками на основе таблиц сопряженности
  5. § 1. Значение изучения причин преступности
  6. Значение ценностей в изучении политики
  7. Глава 1 Что же представляет собой организация (компания): совокупность отделов или совокупность процессов?
  8. Совокупный спрос и совокупное предложение. Теории макроэкономического равновесия
  9. § 14. ЗНАЧЕНИЕ СРАВНИТЕЛЬНОГО ИЗУЧЕНИЯ МЕЖДУНАРОДНОГО ЧАСТНОГО ПРАВА РАЗЛИЧНЫХ СТРАН
  10. 5.1. Понятие, значение и основные признаки юридического лица
  11. § 1. Понятие договора, значение и основные его признаки
  12. Антифашистское искусство Болгарии и его международное значение (Опыт сравнительного изучения) Е. П. ЛЬВОВА
  13. § 1. Понятие принципов уголовного судопроизводства, их признаки (критерии) и значение
  14. ДИАГНОСТИЧЕСКОЕ ЗНАЧЕНИЕ ИЗУЧЕНИЯ СОМАТИЧЕСКОЙ ПАТОЛОГИИ ПРИ СМЕРТИ ОТ НАРКОМАНИИ В СУДЕБНО-МЕДИЦИНСКОЙ ПРАКТИКЕ Д.В. Богомолов, Ю.И. Пиголкин, М.Я. Баранова, И.Н. Богомолова Москва
  15. § 1. Система наказаний в действующем уголовном праве РФ: понятие, признаки, уголовно - правовое значение.
  16. 5.3. Показатели вариации и способы их расчета
  17. § 8. От конкретно-социологического изучения составов преступлений — к изучению институтов Общей части уголовного права