5.8. Критерии согласия
Так как все предположения о характере того или иного распределения — это гипотезы, а не категорические утверждения, то они, естественно, должны быть подвергнуты статистической проверке с помощью так называемых критериев согласия.
Критерии согласия, опираясь на установленный закон распределения, дают возможность установить, когда расхождения между теоретическими и эмпирическими частотами следует признать несущественными (случайными), а когда — существенными (неслучайными). Таким образом, критерии согласия позволяют отвергнуть или подтвердить правильность выдвинутой при выравнивании ряда гипотезыо характере распределения в эмпирическом ряду и дать ответ, можно ли принять для данного эмпирического распределения модель, выраженную некоторым теоретическим законом распределения.
Существует ряд критериев согласия. Чаще других применяют критерии Пирсона, Романовского и Колмогорова. Рассмотрим их.
Критерий согласия Пирсона %2 (хи-квадрат) — один из основных критериев согласия. Критерий предложен английским математиком Карлом Пирсоном (1857—1936) для оценки случайности (существенности) расхождений между частотами эмпирического и теоретического распределений. Критерий Пирсона где к
ті
т'
число групп, на которые разбито эмпирическое распределение;
наблюдаемая частота признака в і-й группе; теоретическая частота, рассчитанная по предполагаемому распределению. Для распределения у} составлены таблицы, где указано критическое значение критерия согласия %2 для выбранного уровня значимости а и данного числа степеней свободы V (см. Приложение 4).
Уровень значимости а — вероятность ошибочного отклонения выдвинутой гипотезы, т.е. вероятность того, что будет отвергнута правильная гипотеза. В статистических исследованиях в зависимости от важности и ответственности решаемых задач пользуются следующими тремя уровнями значимости: 1)
а = 0,10, тогда Р = 0,90; 2)
а = 0,05, тогда Р = 0,95; 3)
а = 0,01, тогда Р = 0,99.
Например, вероятность 0,01 означает, что в одном случае из 100 может быть отвергнута правильная гипотеза.
В экономических исследованиях считается практически приемлемой вероятность ошибки 0,05, т.е. в 5 случаях из 100 может быть отвергнута правильная гипотеза.Кроме того, %2-критерий, определяемый по таблице, зависит и от числа степеней свободы. Число степеней свободы V определяется как число групп в ряду распределения к минус число связей с V
= к - г.
о,
Под числом связей понимается число показателей эмпирического ряда, использованных при исчислении теоретических частот, т.е. показателей, связывающих эмпирические и теоретичес- / л
кие частоты
Так, в случае выравнивания по кривой нормального распределения имеется три связи:
х ~ х' ' СУ = а' * х Ш = У
ЭМП теор’ ЭМП ТеОр> ^ 1ЭМП ^ /теор*
/ /
Поэтому при выравнивании по кривой нормального распределения число степеней свободы определяется как V = к — 3, где к — число групп в ряду.
В случае выравнивания по кривой Пуассона V = к — 2, так как при построении частот используются две ограничивающие связи: х, 1тг /
Для оценки существенности расчетное значение %2расч сравнивается с табличным %2табл.
При полном совпадении теоретического и эмпирического распределений %2 = 0, в противном случае %2 > 0.
Если Храсч > Xтабл’ Т0 ПРИ заданном уровне значимости а и числе степеней свободы V гипотезу о несущественности (случайности) расхождений отклоняем.
В случае если %2асч ^ Х2табЛ’ заключаем, что эмпирический ряд хорошо согласуется с гипотезой о предполагаемом распределении и с вероятностью (1 — а) можно утверждать, что расхождение между теоретическими и эмпирическими частотами случайно.
Используя критерий согласия ?2, необходимо соблюдать следующие условия: 1)
объем исследуемой совокупности должен быть достаточно большим (УУ> 50), при этом частота или численность каждой группы должна быть не менее 5. Если это условие нарушается, необходимо предварительно объединить маленькие частоты; 2)
эмпирическое распределение должно состоять из данных, полученных в результате случайного отбора, т.е.
они должны быть независимыми.Если в эмпирическом ряду распределение задано частостями / \ т.
w:
то у} следует исчислять по формуле
2>(. -
«О1
W
Критерий Романовского Кр основан на использовании критерия Пирсона %2, т.е. уже найденных значений %2, и числа степеней свободы v:
К = I*2 ~V1
V2v '
Он весьма удобен при отсутствии таблиц для %2.
Если Кр < 3, то расхождения между теоретическим и эмпирическим распределением случайны, если же К? > 3, то не случайны
и, соответственно, теоретическое распределение не может служить моделью для изучаемого эмпирического распределения.
Критерий Колмогорова X основан на определении максимального расхождения между накопленными частотами или частостями эмпирических и теоретических распределений:
X = -2= или X = , iN
где Dud— соответственно максимальная разность между накопленными частотами (F — F') и между накоплен-
ными частостями (р — р') эмпирического и теоретического рядов распределений;
N — число единиц в совокупности.
Рассчитав значение X, по таблице Р(к) (см. Приложение 6) определяют вероятность, с которой можно утверждать, что отклонения эмпирических частот от теоретических случайны. Вероятность Р(к) может изменяться от 0 до 1. При Р(к) = 1 происходит полное совпадение частот, при Р(к) = 0 — полное расхождение. Если А, принимает значения до 0,3, то Р(к) = 1.
Основное условие для использования критерия Колмогорова — достаточно большое число наблюдений.
Пример. Используя данные табл. 5.17, проверить правильность выдвинутой гипотезы о распределении призывников района по закону нормального распределения. Величины, необходимые для расчета критериев согласия, приведены в табл. 5.19.
Таблица 5.19
Расчет величин для определения критериев согласия Пирсона х2 и Колмогорова X Рост, см Частоты ряда распределения (/п - т')2 т' F F' к- р,\ т т' А 1 2 3 4 5 6 156-160 8 5 1,8 8 5 3 161-165 17 16 0,1 25 21 4 166-170 42 40 0,1 67 61 6 171-175 54 65 1,9 121 126 5 176-180 73 73 0 194 199 5 181-185 57 57 0 251 256 5 186-190 38 30 2,1 289 286 3 191-195 11 11 0 300 297 3 X 300 297 6,0 Сначала рассчитаем критерий Пирсона
2
2 = (т-т')
Л-расч >
т
Затем выберем уровень значимости а = 0,05 и определим число степеней свободы V.
В данном распределении 8 групп и число связей (параметров) равно 3, следовательно, V = 8 — 3 = 5. По таблице Приложения 4 найдем при а = 0,05 и V = 5 критерий Пирсона %2 = 11,07.Так как %2расч < Х2абл, с вероятностью 0,95 можно утверждать, что в основе эмпирического распределения призывников по росту лежит закон нормального распределения, т.е. выдвинутая гипотеза не отвергается, а расхождения объясняются случайными факторами.
Проверим выдвинутую гипотезу, используя критерий Романовского:
I X2 - V I 16,0 — 5 I 1
кр = ] Г=^ = 1 = ——г = 0,3.
р 3,16
Так как Кр < 3, гипотеза не отвергается.
Критерий Романовского также подтверждает, что расхождения между эмпирическими и теоретическими частотами несущественны.
Рассмотрим теперь применение критерия Колмогорова А,. Как видно из табл. 5.19, максимальная разность между кумулятивными частотами равна 6, т.е. Б = шах!/1— Р'\ = 6. Следовательно, критерий Колмогорова
X = -?= = = 0,35.
л/ЛГ л/300
По таблице Приложения 6 находим значение вероятности при X = 0,35: Р(Х) = 0,9997. Это означает, что с вероятностью, близкой к единице, можно утверждать, что гипотеза о нормальном распределении не отвергается, а расхождения эмпирического и теоретического распределений носят случайный характер.
Теперь, подтвердив правильность выдвинутой гипотезы с помощью известных критериев согласия, можно использовать результаты распределения для практической деятельности.
Пример. Используя данные табл. 5.18, проверить гипотезу о подчинении распределения числа неисправностей в автомобилях закону Пуассона.
Исходные данные и расчет величин, необходимых для определения критериев согласия, приведены в табл. 5.20.
Подсчитаем величину %2: 2
(/я - т’)2
Дфасч ^ / 9
т
(см. табл. 5.20). х< т т' (т — т')2 т' F F’ | F — F | А 1 2 3 4 5 6 0 215 220 0,11 215 220 5 1 135 132 0,07 350 352 2 2 38 39 0,03 388 391 3 3 8 8 0 396 399 3 4 3 1 4 399 400 1 5 1 0 0 400 400 0 Z 400 400 4,21 При уровне значимости а = 0,05 и числе степеней свободы v = 6 - 2 = 4
Хтабл = 9>49
(см. Приложение 4).
Поскольку %2расч < Х^абл’ можно сделать вывод о том, что расхождения эмпирических и теоретических частот случайны.
Таким образом, выдвинутая гипотеза о распределении числа неисправностей в автомобилях по закону Пуассона не отвергается.
Критерий Романовского также подтверждает выдвинутую гипотезу:
Еще по теме 5.8. Критерии согласия:
- Тема 11. КРИТЕРИИ ДОСТИЖЕНИЯ ЦЕЛЕЙ ОРГАНИЗАЦИИ
- 1. Статистика
- 6.7. ИЗУЧЕНИЕ ФОРМЫ РАСПРЕДЕЛЕНИЯ
- 8.3. ПРОВЕРКА ГИПОТЕЗЫ О СООТВЕТСТВИИ ЭМПИРИЧЕСКОГО РАСПРЕДЕЛЕНИЯ ТИПУ КРИВЫХ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ
- 9.1. СУЩНОСТЬ КОРРЕЛЯЦИОННОЙ связи
- 5.7. Теоретические кривые распределения
- 5.8. Критерии согласия
- 1. Статистика
- Тема 11. КРИТЕРИИ ДОСТИЖЕНИЯ ЦЕЛЕЙ ОРГАНИЗАЦИИ
- 1. СУВЕРЕНИТЕТ И ЮРИСДИКЦИЯ
- § 7. Анализ вариационных радов
- ВВЕДЕНИЕ
- Толерантность как ценность в политической культуре студентов
- Установки толерантности в политической культуре молодежи
- Политическая идентичность и политическое участие студентов.
- Толерантность студентов к политическим партиям
- Объективные факторы формирования политической толерантности и интолерантности
- Приложение 1.Программа конкретного эмпирического исследования на тему «Представления о толерантности в субкультуре студенчества (на примере студентов ФГБОУ ВПО «Петрозаводский государственный университет», Кольский филиал (г. Апатиты Мурманской области)»
- Приложение 4 Программа эмпирического исследования на тему «Установки толерантности в политической субкультуре студенчества (на примере студентов ФГБОУ ВПО «Петрозаводский государственный университет», Кольский филиал (г. Апатиты Мурманской области))»