<<
>>

6.5. ПОКАЗАТЕЛИ КОЛЕБЛЕМОСТИ (ВАРИАЦИИ) ПРИЗНАКА

Средняя величина дает обобщающую характеристику всей совокупности изучаемого явления. Однако два ряда распределения, имеющие одинаковую среднюю арифметическую величину, могут значительно отличаться друг от друга по степени колеблемости (вариации) величины изучаемого признака.

Индивидуальные зна-

ки

чения признака в одном ряду могут мало отличаться друг от друга, вследствие чего средняя арифметическая будет достаточно показательной характеристикой данной совокупности. Другой ряд распределения может характеризоваться значительным рассеиванием индивидуальных значений признака, вследствие чего средняя арифметическая будет ненадежной характеристикой этой совокупности и не будет иметь практического значения. Например, выработка рабочих двух бригад за семь дней характеризуется такими данными (шт.):

первая бригада: 4,4,5,5,5,6,6. Средняя выработка в день *i = 5; вторая бригада: 1,2,2,2,7,10,11. Средняя выработка в день х2 = 5.

И хотя ср.едние одинаковы, первая бригада работала равномерно, вторая— скачкообразно. *

Для измерения вариации признака применяются различные обобщающие показатели. К абсолютным показателям рассеивания относятся размах колебаний, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение.

Размах колебаний, или размах вариации, R представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности:

R — Xmax — Хщщ •

Безусловным достоинством показателя является простота расчета. Однако размах вариации зависит от величины только крайних значений признака, поэтому область его применения ограничена достаточно однородными совокупностями. В частности, в практике он находит применение в предупредительном контроле качества продукции. Точнее будет характеризовать вариацию признака показатель, основанный на учете колеблемости всех значений признака. Поскольку средняя арифметическая является обобщающей характеристикой совокупности, большинство показателей вариации основано на рассмотрении отклонений значений признака от этой величины. К таким показателям относятся среднее линейное отклонение, среднее квадратическое отклонение и дисперсия, представляющая собой среднюю арифметическую из отклонений индивидуальных значений признака от средней арифметической, причем среднее линейное отклонение рассчитывается из отклонений в первой степени, среднее квадратическое — из отклонений во второй степени. Так как алгебраическая сумма отклонений индивидуальных значений признака от средней арифметической (согласно нулевому свойству) всегда равна нулю, то для расчета среднего линейного отклонения используется арифметическая сумма отклонений, т. е. суммируются абсолютные значения индивидуальных отклонений независимо от знака.

фор?№ ЛШейНОе ОТКЛОнение d вычисляется по следующим для первичного ряда

-=J^*i?*|__2|d<|

и л

отклонение индивидуальных значений признака от средней апи«Ь метической обозначим d,-; т. е di=x-7 Р Р Ф"

для вариационного ряда!

2* 2Л *

знате™ЛйРпТ,°в~СреДНЯЯ И3 кваДРат°в отклонений вариантов

r^SSSSH^5SS?вел™- Р~

вается по следующим формулам: для первичного ряда

2 (**-*)* 2d,1

J2= -

п

для вариационного ряда

„2_?(*--~)2fr 2«Pi/i

2Л ЁТГ"

ЩиГоРбМразомГ РЗСЧеТа ДИСП6РСИИ М°ЖНо преобразовать следую-

q2 = 2(*1-*)ж_ 2 (х\ _ 2хх, +"7)

? =-• =—--2хх + X =--А =Х —X

п п П

т.

е. дисперсия равна разности средней из квадратов минус квадрат средней. Этой формулой пользуются и при машинной обработке исходных данных.

Дисперсия обладает рядом свойств, некоторые из которых позволяют упростить ее вычисления:

1) дисперсия постоянной величины равна нулю;

2) если все варианты значений признака уменьшить на одно и то же число, то дисперсия не уменьшится;

3) если все варианты значений признака уменьшить в одно и то же число раз (k раз), то дисперсия уменьшится в k2 раз.

Среднее квадратическое отклонение о представляет собой корень квадратный из дисперсии:

1 При расчете среднего линейного и среднего квадратическвго отклонения для интервального вариационного ряда берут отклонения центральных значений интервала от средней арифметической, т. е. х*,—х.

103

102

для первичного ряда

для вариационного ряда

„ l/" 2(*>-*)2/< 1/ SrfVi

Размах вариации, среднее линейное отклонение и среднее квадратическое отклонение являются величинами именованными. Они имеют те же единицы измерения, что и индивидуальные значения признака. Дисперсия и среднее квадратическое отклонение являются наиболее широко применяемыми показателями вариации. Объясняется это тем, что они входят в большинство теорем теории вероятностей, служащих фундаментом математической статистики. Кроме того, дисперсия может быть разложена на составные элементы, позволяющие оценить влияние различных факторов, обусловливающих вариацию признака. В последующих главах будет показано, что дисперсия используется для построения показателей тесноты корреляционной связи, при оценке результатов выборочных наблюдений, в дисперсионном анализе и т. д.

Расчет показателей вариации рассмотрим в табл. 6.7.

Т а б л и ц а 6.7 Дневная заработная плата, руб. дг. Число рабочих /j х\ *\h a\h 1 2 3 4 5 6 7 3,7—4,6 4,6—5,5 5,5—6,4 6,4—7,3 7,3—8,2 3 4 6 3 4 4,15 5,05 5,95 6,85 7,75 12,45 20,20 35,70 20,55 31,00 —1,845 —0,945 —0,045 + 0,855 + 1,755 5,535 3,780 0,270 2,565 7,020 10,01 3,57 0,01 2,19

12,32 Итого 20 119,90 19,170 28,00 _ 119 90

*=-9Рт=5,995 руб.;

d=

20 19,170

Hi 20

~г=.

28

= 0,9585 руб.; 1.4;

I/.- 20

о=уШ =1,18 руб.

Среднее линейное и среднее квадратическое отклонение показывает, на сколько в среднем колеблется величина признака у единиц исследуемой совокупности. Так, в данном примере средняя величина колеблемости дневной заработной платы составляет: по среднему линейному отклонению 0,959 руб., а по среднему квадра-тическому отклонению 1,02 руб.

По свойству мажорантности средних величин (см. гл. 5) среднее квадратическое отклонение о всегда больше среднего линейного отклонения d. Если распределение признака близко к нормальному или симметричному распределению, то между and существует взаимосвязь а» 1,25d или d»0,8a.

При вычислении обобщающих статистических характеристик для интервальных рядов распределений действительные значения признака заменяются центральными значениями интервалов, которые более или менее отличаются от средней арифметической значений, включенных в интервал. Это приводит к появлению систематической погрешности при расчете дисперсии. В. Ф. Шеппард установил, что ошибка в дисперсии, вызванная применением при расчете сгруппированных данных, составляет V12 квадрата величины интервала, т. е. скорректированная дисперсия равна о2— —V12/2.

Поправка Шеппарда .должна применяться при следующих условиях: 1) распределение относится к признаку с непрерывным характером вариации; 2) распределение характеризуется тесной близостью с осью абсцисс на концах кривой; 3) распределение построено по большому количеству исходных данных (л>500).

Если в качестве показателей центра распределения используется медиана, то для характеристики вариации признаков совокупности можно применить так называемое квартальное отклонение Q. Этот показатель также можно применить вместо размаха вариации, чтобы избежать недостатков, связанных с использованием крайних значений.

где Qi и Q3 соответственно первая и третья квартили распределения.

Квартили — это значения признака в ранжированном ряду распределения, выбранные таким образом, что 25% единиц совокупности будут меньше по величине Qt; 25% единиц будут заключены между Q, и Q2; 25% — между Q2 и Q3 и остальные 25 7о превосходят Q3. Квартили определяются по формулам, аналогичным приведенной выше формуле для расчета медианы:

—;——^ci

Qi =xQl + i--f-,

Где Xq} — нижняя граница интервала, в котором находится первая квартиль; Sqt — сумма накопленных частот интервалов, предше-

105

104

ствуюших интервалу, в котором находится первая квартиль; /у, — частота интервала, в котором находится первая квартиль;

Q2 = Me ;

??'+1 s

3-

Qs = Xq, + i---Г

I ч

(условные обозначения те же, что и для величины Q\). По данным примера табл. 6.7 вычислим:

21/4-3

Q, = 4,6+ 0,9-г-=5,106 руб.;

21/2—7

Q2=5,5 + 0,9—-=6,025 руб.;

21-3/4-13

Q3=6,4 + 0,9-з-= 7,225 руб.

Квартильнее отклонение равно:

Qs-Q, 7,225—5,106 Q = .^_^-=-J-_J--=1,0595 руб.

Так как на квартильное отклонение не влияют отклонения всех значений признака, его нельзя считать точной мерой вариации.

При сравнении колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях с различной величиной средней арифметической пользуются относительными показателями рассеивания. Эти показатели вычисляются как отношение абсолютных показателей вариации к средней арифметической (или медиане). Используя в качестве абсолютного показателя вариации размах вариации, среднее линейное отклонение, среднее квадратическое отклонение и квартильное отклонение, получим относительные показатели колеблемости (чаще всего они выражаются в процентах):

коэффициент осцилляции Кя=-^=-100% ;

X

относительное линейное отклонение K-=^Z=-100% ;

d х

коэффициент вариации V=-^--]00% ;

х

относительный показатель квартальной вариации

XC=JL.100% Me

или Ко=-^Г—-100%-2-Q2

Наиболее часто применяемый показатель относительной колеблемости— коэффициент вариации. Его используют не только для сравнительной оценки, но и как характеристику однородности со

106

вокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному). Для примера, приведенного в табл. 6.7, относительные показатели получились равными:

/Ся=~=|^-100% = 70,5%.; Kd=-gf--100% = 16,0%; У=~~Г0О%=19,7%;

1 072

*«~5og-100% = 17,79%.

Основываясь на коэффициенте вариации, можно сделать вывод, что по размеру дневной заработной платы совокупность является однородной.

Применим коэффициент вариации для сравнительной оценки колеблемости различных признаков. Например, по предприятиям главка средний размер стоимости основных фондов составляет 5,12 млн. руб. и среднее квадратическое отклонение—1,03 млн. руб. Средний размер валовой продукции—11,27 млн. руб. при среднем квадратическом отклонении 2,5 млн. руб. Чтобы ответить на вопрос о том, по какому из показателей (по валовой продукции или по стоимости основных фондов) выше колеблемость величины признака, недостаточно знать только среднее квадратическое отклонение, так как а рассчитывается по отклонениям от средних, а средние уровни признаков различны по величине. В этом случае необходимо соотнести среднее квадратическое отклонение с величиной соответствующей ему средней.

Коэффициент вариации по стоимости основных фондов будет

V=-—?№% =20,1%, а по стоимости валовой продукции — соответственно

V=—-100% =22,2%,

следовательно, вариация стоимости валовой продукции несколько выше, чем вариация стоимости основных фондов.

Для оценки влияния различных факторов, определяющих колеблемость индивидуальных значений признака, можно воспользоваться разложением дисперсии на составляющие: на так называемую межгрупповую и внутригрупповую дисперсии.

Если рассчитать дисперсию признака по всей изучаемой совокупности, т. е. общую дисперсию Со2, то полученный показатель будет характеризовать вариацию признака как результат влияния всех факторов, определяющих индивидуальные различия единиц совокупности. Если же поставить дальнейшую задачу — выделить в составе обшей дисперсии ту ее часть, которая обусловлена влия-

107

нием какого-либо одного определенного фактора, то следует разбить изучаемую совокупность на группы, положив в основу груп-^ пировки интересующий нас фактор. Затем изучить раздельно ва-' риацию признака внутри однородных в отношении данного фактора групп и изменения в величине признака от группы к группе. Выполнение такой группировки позволяет разложить общую дисперсию признака на две дисперсии, одна из которых будет характеризовать часть вариации, обусловленную влиянием фактора, положенного в основу группировки, а вторая — вариацию, происходящую под влиянием прочих факторов (кроме фактора, положенного в основу группировки).

Вариацию, обусловленную влиянием фактора, положенного в основу группировки, характеризует межгрупповая дисперсия б2, которая является мерой колеблемости частных средних по группам Xj вокруг общей средней Хо и исчисляется по формуле

к _ _

2 (*j-*o)2"i

2 п, 1

где k — число групп; щ — число единиц в /-й группе; Xj — частная средняя по /-Й группе; х0 — общая средняя по совокупности единиц.

Вариацию, обусловленную влиянием прочих факторов, характеризует в каждой группе внутригрупповая дисперсия

», _ 2

2

°i =--'

а по совокупности в целом — средняя из внутригрупповых дисперсий

* "j — * г

2 2 Р 2 —2 1 1 —2 1

Oj =-j--ИЛИ Oj =-~h--

2 «1 2 «J

i i

Между общей дисперсией о02, средней из внутригрупповых о/ и межгрупповой б2 дисперсиями существует определенное соотношение, которое определяется правилом сложения 'дисперсий. Согласно этому правилу общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий:

оо =б2+о,-2 ?

Например, при изучении влияния стажа работы рабочих на производительность труда в цехе были получены такие данные;

108

Т а б л и ц а 6.8 Средняя часовая Группы рабочих Число рабочих выработка рабочих Дисперсия выработки по стажу работы, лет в группах, чел. в данной группе в каждой группе в условных единицах До 5 30 20,0 3,0 5 и более 40 23,0 2,0 Вариация признака за счет изменения стажа определяться величиной межгрупповой дисперсии. ' Средняя часовая выработка всех рабочих

— 20,0-30+23,0-40 «о=--™--=21,7;

работы будет

70

межгрупповая дисперсия

(20,0-21,7)г-30+ (23,0-21,7)2-40

б2=-

= 2,20.

70

Вариация выработки под действием всех прочих факторов будет характеризоваться величиной средней из внутригрупповых дисперсий

—„ 3,0-30+2,0-40

о,-

2 —_

70

- = 2,43.

Вариация выработки под действием всех факторов будет характеризоваться величиной общей дисперсии

Of/

2,43 + 2,20 20

Это означает, что на 47,6%

63

в стаже

4,63.

100%'j дисперсия выра-рабочих, а на 52,4%

ботки обусловлена различиями

("f^if"' .j —влиянием прочих факторов.

Выше были рассмотрены показатели вариации для количественных признаков. Но наряду с вариацией количественных признаков может наблюдаться и вариация качественных признаков. При наличии двух взаимно исключающих друг друга вариантов говорят о наличии альтернативной изменчивости качественных признаков. Например, при изучении качества изготовленной продукции можно разделить ее на две группы: годную и бракованную. В таком случае будем иметь дело с альтернативным признаком. Можно считать, что эквивалентом качественного признака будет переменная, которая принимает значение 1 или 0, причем значение 1 она принимает в том случае, когда обследуемая единица обладает данным признаком, а значение 0 — когда не обладает им. Допустим, общее число единиц совокупности равно п, число единиц, обладающих данным признаком, f, тогда число -единиц, не обладающих данным признаком, будет равно п—f. Учитывая изложенное, построим ряд распределения по качественному признаку:

109

Значение ?переменной

1

О

Частота повторений

1 n-f

Средняя арифметическая такого

f

ряда равна:

- 1 ?/+<)? (и-Г) х=-

Итого

г. е. равна относительной частоте (частости), которую можно обозначить

через р, тогда х=р. Таким образом, доля единиц, обладающих данным признаком, равна р; соответственно доля единиц, не обладающих данным признаком, равна q. Следует иметь в виду, что p+q=\. Тогда дисперсия альтернативного признака определится по формуле

(1-р)2р+(0-р)2Я я2Р+Р2Я

Р+Я

Р+Я

?=РЯ-

Среднее квадратическое отклонение альтернативного признака равно:

a=fp~q ?

Например, в результате приемочного контроля качества из 1000 готовых изделий 20 оказались бракованными. Применяя вышеуказанную символику, строим ряд распределения (1 соответствует бракованным изделиям, а 0 — годной продукции).

— 1-20+0-980 р = х =--= 0,02,

Значение переменной

1

0

Частота повторений

20

1000

Итого

1000

т. е. доля брака составляет 2%. Дисперсия доли оР2 = 0,02 • 0,98=0,0196, а среднее квадратическое отклонение оР = 0,14.

<< | >>
Источник: Т. В. Рябушкин. Общая теория статистики: Учебник/Т. В. Рябушкин, 0-28 М. Р. Ефимова, И. М. Ипатова, Н. И. Яковлева. — М.: Финансы и статистика. — 279 с, ил.. 1981 {original}

Еще по теме 6.5. ПОКАЗАТЕЛИ КОЛЕБЛЕМОСТИ (ВАРИАЦИИ) ПРИЗНАКА:

  1. 4.5. Показатели вариации Значение показателей вариации
  2. 5.3. Показатели вариации и способы их расчета
  3. 6.1. ВАРИАЦИЯ ПРИЗНАКА В СОВОКУПНОСТИ И ЗНАЧЕНИЕ ЕЕ ИЗУЧЕНИЯ
  4. 7.4. Показатели тесноты связи между двумя количественными признаками
  5. 7.3. Показатели тесноты связи между двумя качественными признаками
  6. Правовые признаки состава речевых преступлений и их лингвистические показатели
  7. Измерение колеблемости в рядах динамики
  8. 3.6. Методы расчета и анализа колеблемости и соотношений цен
  9. 2.7. Анализ тенденций развития, колеблемости и цикличности рынка
  10. 8.2.3. Сбор и обработка информации при помощи показателей и систем показателей
  11. 3. ВАРИАЦИИ
  12. Средние величины и коэффициенты вариации
  13. Какую вариацию модели GE/McKinsey предложил Дэй?
  14. ПОНИМАНИЕ ВАРИАЦИЙ
  15. 8.2.4. Примеры показателей и систем показателей
  16. ВАРИАЦИИ АНТИБРЭНДОВ
  17. Зависимая переменная и ее вариация
  18. Какую вариацию модели GE/McKinsey предложил Монивсон?