<<
>>

6.7. Общие понятия и схема статистической проверки гипотез

Результаты выборочных наблюдений широко используются в статистике для проверки предположений, выдвигаемых в отношении характера или параметров распределения случайной величины в генеральной совокупности.

Такие предположения, которые планируется проверить с помощью специальных статистических методов, называются статистическими гипотезами.

Проверка статистической гипотезы заключается в том, чтобы оценить, можно ли считать случайным расхождение между выдвинутой гипотезой и результатами выборочного наблюдения. Такая оценка всегда носит вероятностный характер. Если расхождение между эмпирическими и теоретическими значениями не выходит за пределы случайной ошибки, то можно считать, что с заданной вероятностью выдвинутая гипотеза не опровергается. При этом справедливость самой гипотезы не доказывается, а лишь делается вывод о том, можно ли ее считать допустимой или необходимо отвергнуть.

Например, для санитарного контроля проводится мониторинг, в ходе которого устанавливается степень соответствия фактического содержания вредных веществ в атмосфере предельно допустимой концентрации (ПДК). Обозначим ПДК какого-либо вредного вещества, например двуокиси углерода, через х0, а фактическую концентрацию, установленную в результате мониторинга, через х. Требуется проверить справедливость гипотезы о том, что содержа - ние вредного вещества в атмосфере города можно признать допустимым. Если эта гипотеза не подтверждается, т.е. окажется, что х > х0, то необходимы дополнительные меры по охране атмосферного воздуха.

Проверяемая гипотеза называется основной и обозначается через Н0. Суть проверки — убедиться в отсутствии систематической ошибки между исследуемым параметром генеральной совокупности и заданным его значением, т.е. проверяется гипотеза о нулевом расхождении между ними, поэтому основную гипотезу называют также нулевой.

При записи содержание гипотезы отделяется от символа Н0 двоеточием.

В приведенном примере суть проверяемой гипотезы может быть представлена следующим образом:

Н0: х < х0.

Гипотеза, альтернативная основной, обозначается через Ну В нашем случае альтернативной является гипотеза о том, что содержание вредного вещества в атмосфере города превышает ПДК, т.е. Ну х > х0.

Выдвигаемые гипотезы могут быть простыми и сложными. Простая гипотеза однозначно характеризует оцениваемый параметр генеральной совокупности. Например, #0: х = х0, т.е. степень загрязнения воздуха точно соответствует ПДК. Сложная гипотеза определяет область возможных значений исследуемого параметра. Так, выдвинутая ранее гипотеза Нй: х < х0 является сложной.

Поскольку при проверке гипотезы используются данные выборочного наблюдения, вывод о ее допустимости носит вероятностный характер, т.е. не исключена возможность ошибки. При этом могут возникать следующие ошибки: •

ошибка первого рода — если в результате проверки делается вывод о необходимости отклонить нулевую гипотезу, которая в действительности верна; •

ошибка второго рода — если нулевая гипотеза не отклоняется, хотя на самом деле она ошибочна.

Для того чтобы сделать вывод о соответствии результатов выборочного наблюдения выдвинутой гипотезе, необходимо принять определенный критерий, т.е. правила, в соответствии с которыми устанавливается, при каких результатах выборочного обследования основная гипотеза не может быть отклонена, а при каких от нее необходимо отказаться. Например, при проверке гипотезы о среднем значении признака в генеральной совокупности Н0: х — а в качестве критерия (0) можно использовать среднее значение

признака в выборке х, отклонение выборочной средней от а

(т.е. х — а), а также нормированное отклонение I = .

Из множества значений статистического критерия необходимо выделить такое их подмножество, при попадании в которое выборочной характеристики основная гипотеза должна быть отклонена. Это подмножество называется критической областью. Ее границы устанавливаются таким образом, чтобы вероятность попадания в нее значений выборочной характеристики при условии справедливости выдвинутой гипотезы была величиной достаточно малой.

Напомним, что указанная вероятность называется уровнем значимости критерия и обозначается через а. Если значение критерия попадает в критическую область при верной нулевой гипотезе, то эта гипотеза должна быть отвергнута, т.е. будет допущена ошибка первого рода, вероятность которой равна а. Уменьшая уровень значимости, мы снижаем вероятность появления ошибки первого рода. Однако если основная гипотеза неверна, то, уменьшая а, мы увеличиваем область допустимых значений и, соответственно, вероятность появления ошибки второго рода. Устанавливая уровень значимости, необходимо стремиться к минимизации возможных потерь, связанных с возникновением этих ошибок. Обычно уровень значимости принимается равным 0,05; 0,01; 0,005; 0,001. Если нулевая гипотеза верна, то вероятность ее принятия равна (1 — а).

Точка, разделяющая критическую область и область принятия нулевой гипотезы, называется критической.

Обозначив вероятность ошибки второго рода через Р, можно определить вероятность того, что при использовании для оценки гипотезы определенного критерия неверная гипотеза не будет принята. Эта вероятность определяет мощность критерия, и она равна (1 - (3).

Стремление увеличить мощность критерия при неизменном объеме выборки приводит к расширению критической области, т.е. повышает вероятность ошибки первого рода. Снизить вероятность их появления можно, лишь увеличив объем выборки, что практически не всегда возможно.

При заданном уровне значимости критическая область может быть определена как односторонняя или двусторонняя в зависимости от сформированной альтернативной гипотезы.

Предположим, что проверке подлежит гипотеза о среднем значении признака в генеральной совокупности Н0: х = а, а в качестве критерия 0 принята выборочная средняя. Альтернативная гипотеза может быть представлена следующим образом: Ну х < а, Ну х > а или Ну х *= а. 1.

Ну х < а. При достаточно большом объеме выборки распределение возможных значений выборочной средней приближается к нормальному распределению.

При случайном расхождении между выборочными и генеральной средней они должны быть сгруппированы около величины х — а. Если же среднее значение признака, полученное на основе выборки, значительно меньше, чем а, то выдвинутая гипотеза должна быть отклонена. В таком случае критическая область является левосторонней (рис. 6.3).

(критическая точка)

Рис. 6.3. Левосторонняя критическая область

Обозначив общую площадь, ограниченную кривой, отражающей распределение выборочной средней, через а площадь критической области через ? , получаем: а = Б /Б = Р{В < 0(). Принимая уровень значимости а = 0,05, получаем Р(0 < 0,) = 0,05. Если в качестве критерия используется значение выборочной средней х, а критическая точка 0] представлена через случайную ошибку выборки, то можно записать: 0 _г_

Р(х < а

(6.22)

/е“2сі/ = 0,05. Следовательно,

| е 2с1/ = 0,45. В таком случае значение л/2тс -! интеграла вероятностей Лапласа в пределах от —і до И

По таблице Приложения 2 находим соответствующее значение / = 1,64.

Таким образом, значение критерия в критической точке 0, = = а — 1,64ц. Если по результатам выборочного обследования окажется, что х > а - 1,64ц, то выдвинутая гипотеза Н0: х = а не отвергается. В противном случае ее необходимо отклонить. 2.

Ну х > а. Критическая область при такой альтернативной гипотезе является правосторонней (рис. 6.4).

(критическая

точка)

Рис. 6.4. Правосторонняя критическая область

При а = 0,05 вероятность Р(х > а + tji) = 0,05, т.е. 1

1 '

Р(х > а + t\i) = - - -j=rJe 11 dt = 0,05. (6.23) 2

Л/271 О

точка)

точка)

Рис. 6.5. Двусторонняя критическая область

Следовательно, критические точки 0, и 02 должны распола

/ц,

гаться на равном расстоянии от величины а, т.е. 0, = а

02 = а + /ц. В таком случае для нахождения /-статистики можно использовать значение интеграла вероятностей Лапласа в пределах от —/ до +Г. 1

а > /|1) = 1 -

Р(\

г— I е" 2 с1/ = 0,05.

(6.24)

Ы2п -I 2

~~^= | е 2с1/ = 0,95, откуда табличное значе- л/2я -I

ние / = 1,96 (см. Приложение 2).

В результате критические точки имеют следующие значения:

Следовательно,

0,

а — 1,96ц, 02 = а + 1,96ц.

Полученные значения / при а = 0,05 справедливы лишь в том случае, если объем выборочной совокупности достаточно велик. Если же выборка малая, то для нахождения /-статистики при заданном уровне значимости а необходимо использовать распределение Стьюдента (см. параграф 6.5).

Общий порядок проверки статистических гипотез таков: •

формулируется основная (проверяемая) и альтернативная гипотезы; •

выбирается статистический критерий для проверки справедливости гипотезы; •

определяются критическая область и область допустимых значений, значения критерия в критических точках; •

проводится выборочное обследование, по результатам которого рассчитывается фактическое значение выбранного критерия; •

на основе сравнения фактического и критического значений критерия делается вывод о правдоподобности или необходимости отклонения выдвинутой гипотезы.

В зависимости от вида проверяемых гипотез (о среднем значении, законе распределения, взаимосвязи признаков и т.д.) выбираются разные критерии (^-статистика (или коэффициент доверия), ^-статистика Стьюдента, %2-критерий Пирсона; /'-критерий Фишера и др.), которые подразделяются на параметрические и непараметрические. Для проведения оценки с использованием параметрических критериев необходимо знать закон распределения генеральной совокупности. Непараметрические критерии могут применяться при любом законе распределения, но при этом сохраняется главное условие — независимость испытаний при формировании выборочной совокупности, на основе которой проверяется выдвинутая гипотеза.

<< | >>
Источник: Г.Л. Громыко. Теория статистики: Учебник. — Т11 2-е изд., перераб. и доп. - М.: ИНФРА-М,. - 476 с. — (Классический университетский учебник)., . 2005

Еще по теме 6.7. Общие понятия и схема статистической проверки гипотез:

  1. Тема 1 ОБЩИЕ ПОНЯТИЯ МЕЖДУНАРОДНОГО ЧАСТНОГО ПРАВА
  2. Общее понятие управления. Управление как социальное явление
  3. ГЛАВА 8. СТАТИСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗ
  4. 8.1. ОБЩИЕ ПОНЯТИЯ. ВЫБОР ТИПА КРИТИЧЕСКОЙ ОБЛАСТИ
  5. 6.7. Общие понятия и схема статистической проверки гипотез
  6. 6.8. Проверка гипотез о средней и о доле Гипотезы о средней
  7. 2. Акцизы Общие понятия об акцизах
  8. ОБЩЕЕ ПОНЯТИЕ
  9. ЧАСТЬ I   ОБЩИЕ ПОНЯТИЯ
  10. § 7. Общее понятие о лице (и физическом в частности). Начало и конец физического лица Его правоспособность и дееспособность
  11. I. Общее понятие о лице в праве