<<
>>

8.1. ОБЩИЕ ПОНЯТИЯ. ВЫБОР ТИПА КРИТИЧЕСКОЙ ОБЛАСТИ

Под статистической гипотезой понимаются различного рода предположения относительно вида или параметров распределения случайной переменной, которые можно проверить, опираясь на результаты наблюдений в случайной выборке.

Следует иметь в виду, что статистическая проверка гипотез имеет вероятностный характер, так как принимаемые заключения основываются на изучении свойств распределения случайной переменной по данным выборки, а потому всегда существует риск допустить ошибку. Однако с помощью статистической проверки гипотез можно определить вероятность принятия ложного решения. Если вероятность последнего невелика, то можно считать, что применяемый критерий обеспечивает малый риск ошибки.

При проверке гипотез существует возможность совершить ошибку двоякого рода:

ошибка первого рода — проверяемая гипотеза (ее обычно называют нулевой гипотезой и обозначают Н0) является в действительности верной, но результаты проверки приводят к отказу от нее;

ошибка второго рода — проверяемая гипотеза в действительности является ошибочной, но результаты проверки приводят к ее принятию.. ^

Для построения статистического критерия, позволяющего проверить некоторую гипотезу, необходимо выполнить следующее:

1) сформулировать проверяемую гипотезу Н0. Наряду с проверяемой гипотезой формулируется также конкурирующая (альтернативная) гипотеза; 2) выбрать уровень значимости а, контролирующий допустимую вероятность ошибки первого рода; 3) определить область допустимых значений и так называемую критическую область; 4) принять то или иное решение.

Уровнем значимости будем называть такое малое значение вероятности попадания критерия в критическую область при условии справедливости гипотезы, что появление этого события может расцениваться как следствие существенного расхождения выдвинутой гипотезы и результатов выборки. Обычно уровень значимости принимают равным 0,05 или 0,01.

Исходя из величины уровня значимости можно определить критическую область, под которой понимается такая область значений выборочной характеристики, попадая в которую они будут свидетельствовать о том, что проверяемая гипотеза должна быть отвергнута. К критической области относятся те значения, появление которых при условии верности гипотезы было бы маловероятным. Допустим, что рассчитанное по эмпирическим данным значение критерия попало в критическую область, тогда при условии верности проверяемой гипотезы Н0 вероятность этого события будет не больше уровня значимости а. Поскольку а выбирается достаточным малым, то такое событие явля

154

ется маловероятным, и, следовательно, проверяемая гипотеза Н0 может быть отвергнута. Если же наблюдаемое значение критерия не принадлежит к критической области и, следовательно, находится в области допустимых значений, то проверяемая гипотеза Я0 не отвергается. Вероятность попадания критерия в область допустимых значений при справедливости проверяемой гипотезы Н0 равна 1—а. Нужно учитывать, что попадание критерия в область допустимых значений не означает строгого доказательства гипотезы Но-Оно лишь указывает, что между выдвигаемой гипотезой и результатами выборки нет существенного расхождения. Чем меньше уровень значимости, тем меньше вероятность забраковать проверяемую гипотезу, когда она верна, т. е. меньше вероятность совершить ошибку первого рода. Но при этом расширяется область допустимых значений и, значит, увеличивается вероятность совершения ошибки второго рода. 1

При данном уровне значимости возможно по-разному устанавливать критическую область, гарантирующую этот уровень. Пусть мы задаемся уровнем значимости а=0,05. В качестве критической области, отвечающей этому уровню значимости, мы можем взять (для нормально распределенного критерия):

1. Область больших положительных отклонений так, чтобы

Рт=Р(.Ох+/тц)=0,05.

Тогда

ОО t I2

1 г — 1 1 п —

Pi= —= \е 2 dt=---= А е 2 dt,

Рп J 2 рп*

1 Г ' 2 1 откуда-p==rj е~2~ dt= —--0,05=0,45

о

и по таблице нормированной функции Лапласа находим, что &=1,64.

2.

Область больших отрицательных отклонений

Рц=Р(х<7-tmi) =0,05, т. е. Рп=Р(х<х- 1,64ц.).

3. Область больших по абсолютной величине отклонений

t fj

^ш=Р(|лг-7|>/ш^)=0,05, т. е. 0,05=1-2--^} е" dt.

ТОТда-^-4'й,^_о,475. 'о

По таблице нормированной функции Лапласа находим, что tm— = 1,96.

4. Область малых по абсолютной величине отклонений

Piv=P(|a;-"x|<^vp)=2--L- J е~~ 155

t

156

Таблица 8.1 ^ Количество наблюдений Минимальные значения Максимальные значения Разность смежных значений Среднее значение Среднее квадратическое отклонение по выборке Xi Xi *п X,-Xi хп~~ хп—1 X 5 84 7 13 130 178 6 48 57,3 35,3 Используем критическую область вида Р (xn>x-{-ta), так как минимальное значение Xi незначительно отличается от следующего за ним значения в ранжированном ряду, т. е. проверим, принадлежит ли выделяющееся наблюдение дсп = 178 к рассматриваемой совокупности результатов. При уровне значимости а=0,01 значение нормированной функции Лапласа для рассматриваемой критической области будет равно:

t t»

-L V e~~^ dt= —-0,01=0,49. У2д Jo 2

Этому значению в таблице нормированной функции Лапласа соответствует ./=2,33. Тогда верхняя допустимая граница значений признака, которая не может быть превышена с вероятностью 0,99, будет равна 57,3+2,33-35,3= 139,6. Значение хп=П8 выходит за рассчитанную границу, а потому с вероятностью 0,99 можно считать хп = 178 не принадлежащим к изучаемой совокупности и исключить его из дальнейших расчетов.

Часто могут иметь место такие случаи, когда параметры генеральной совокупности х и о неизвестны, и для проверки гипотезы о выделяющихся наблюдениях используются полученные по выборке оценки соответствующих параметров. Однако следует учитывать, особенно для малых выборок, что эти оценки являются не вполне надежными. В этой связи для отбрасывания выделяющихся наблюдений по данным малых выборок можно рекомендовать пользоваться критерием Ф. Груббса.

Критерий Ф. Груббса основан на отношении двух сумм квадратов отклонений.

1. Для испытания наибольшего наблюдения, являющегося выделяющимся в выборке объема п из нормально распределенной совокупности, рассчитывается отношение

2 (*<-*)2

— i=l — i = i

х1<.х2<.хъ<...". 157

Тогда —pL=f e —r*dt= 0,025. о

Величина t, соответствующая вероятности 0,025, равна 0,063.

<< | >>
Источник: Т. В. Рябушкин. Общая теория статистики: Учебник/Т. В. Рябушкин, 0-28 М. Р. Ефимова, И. М. Ипатова, Н. И. Яковлева. — М.: Финансы и статистика. — 279 с, ил.. 1981

Еще по теме 8.1. ОБЩИЕ ПОНЯТИЯ. ВЫБОР ТИПА КРИТИЧЕСКОЙ ОБЛАСТИ:

  1. Тема 1 ОБЩИЕ ПОНЯТИЯ МЕЖДУНАРОДНОГО ЧАСТНОГО ПРАВА
  2. 4.1. Понятие о типах систем социального управления
  3. Общее понятие управления. Управление как социальное явление
  4. 8.1. ОБЩИЕ ПОНЯТИЯ. ВЫБОР ТИПА КРИТИЧЕСКОЙ ОБЛАСТИ
  5. 6.7. Общие понятия и схема статистической проверки гипотез
  6. 2. Акцизы Общие понятия об акцизах
  7. ОБЩЕЕ ПОНЯТИЕ
  8. ЧАСТЬ I   ОБЩИЕ ПОНЯТИЯ
  9. § 7. Общее понятие о лице (и физическом в частности). Начало и конец физического лица Его правоспособность и дееспособность
  10. I. Общее понятие о лице в праве
  11. Глава I. Общие понятия об обязательственном праве
  12. III. Общее понятие об обеспечении договоров; в частности, задаток и отступное
  13. Глава первая. Общие понятия
  14. Глава первая. Общие понятия и учреждения завещательного права
  15. Введение Общие понятия
  16. ГЛАВА 3 ОБЩЕЕ ПОНЯТИЕ И КЛАССИФИКАЦИЯ ХИЩЕНИЙ
  17. Раздел I ПОНЯТИЕ МОДЕЛЕЙ, ТИПОВ И ВИДОВ ПРОЦЕССА