6.8. Проверка гипотез о средней и о доле Гипотезы о средней
В статистической практике наиболее часто проверяются два вида гипотез о средних величинах: •
гипотеза о равенстве средней величины установленному нор-
мативу; •
гипотеза о равенстве средних значений признака двух совокупностей.
Общий подход к проверке гипотезы о равенстве среднего значения признака в генеральной совокупности некоторой величине Н0: х = а описан в параграфе 6.7.
В качестве критерия в этом случае целесообразно использовать нормированное отклонение выборочной средней от заданной величины:И
где ц — средняя квадратическая ошибка выборочной средней, т.е. средняя ошибка выборки.
При большом объеме выборки (я > 30) средняя ошибка вы-
борки ц рассчитывается по формуле
формуле ц - л -. Если полученное по результатам обследо- 11
п — 1
вания фактическое значение /-статистики меньше табличного, т.е. /факт < /, то гипотеза не отклоняется. В противном случае нулевую гипотезу следует отклонить.
Пример. При оценке влияния изменений в налоговой политике на платежеспособность предприятий одного из регионов установлено, что до указанных изменений средний коэффициент покрытия по этим предприятиям соответствовал нормативу, равному 2. После внесения изменений в действующую налоговую систему было проведено выборочное обследование 49 предприятий региона, в результате которого установлено, что средний коэффициент покрытия на них составил 1,7 при среднем квадратическом отклонении 0,6.
Выдвигаемая нулевая гипотеза состоит в том, что изменения в проводимой налоговой политике существенно не повлияли на платежеспособность предприятий региона, т.е. коэффициент покрытия остался на прежнем уровне: Н0: х = 2. В качестве альтернативной может быть рассмотрена гипотеза о том, что указанные изменения повлияли на степень платежеспособности предприятий: Ну х Ф 2.
Для проверки выдвинутой гипотезы примем уровень значимости а = 0,05.
Так как вероятность Р{\х — 2| > /р,) = 0,05, а п > 30, 1+'
то для значения интеграла вероятностей Лапласа ,— \ е 2с1/ =
= 0,95 находим табличное значение /-статистики: / = 1,96 (см. Приложение 2).
Фактическое значение /-статистики
х — а
х — а\ 1,7 — 2
—?1 = 3,5.
0,36
Так как /факт > /, то выдвинутая гипотеза отклоняется, т.е. изменения в налоговой системе повлияли на платежеспособность предприятий региона.
Для того чтобы сделать более определенный вывод о характере этих изменений, альтернативную гипотезу сформулируем следующим образом: изменения в налоговой системе привели к снижению платежеспособности предприятий региона, т.е. Ну х <2. Зададим для этого случая уровень значимости а = 0,01. Вероятность Р{х <2 — /ц) = 0,01, следовательно, значение интеграла 1
0 --
вероятностей Лапласа в пределах от — / до 0 равно ,— \ е 2 с!/ =
^2к -I —
— — 0,01 = 0,49, а в пределах от — / до +/ соответственно 0,98.
По таблице Приложения 2 находим для данной вероятности значение /-статистики: t= 2,33. Так как /факт > /, то нулевая гипотеза должна быть отклонена, т.е. с вероятностью 0,99 можно считать, что изменения в налоговой системе привели к снижению платежеспособности предприятий региона.
Если для проверки выдвинутой гипотезы используется малая выборка, то значение /-статистики определяется с помощью распределения Стьюдента. При этом степень обоснованности вывода зависит от того, насколько распределение генеральной совокупности соответствует нормальному закону.
Гипотеза о равенстве средних значений признака двух совокупностей выдвигается часто для того, чтобы проверить влияние како- го-либо фактора на среднюю. Обозначим среднее значение признака в этих совокупностях через хх и х а дисперсии в генеральных совокупностях — соответственно а2, и а2гГ В таком случае нулевая гипотеза может быть представлена следующим образом: Н0: хх = х2.
Для ее проверки проводится выборочное обследование, при котором объем выборки из первой совокупности составляет ир а из второй — пт Обозначим соответствующие значения средних в этих выборках через х] и х2, а дисперсии —о2 и а2т В качестве критерия при проверке этой гипотезы принимается /-статистика, фактическое значение которой по результатам выборочного обследования рассчитывается по формуле
'факт = -ц ' (6'26)
Г1*, -X,
^_2 _2 г1 г2
1 — стандартная ошибка разности выбо- 1
2 рочных средних.
Предположим, что дисперсии в двух совокупностях равны, т.е. ст2, = О22 = о2. Следовательно,
(6.27)
аг(п, + п2)
Если дисперсии в выборочных совокупностях известны, то они могут быть использованы для оценки общей дисперсии. Расчет проводится по формуле средней арифметической взвешенной, где в качестве весов выступает число степеней свободы в каждой выборке (V = п — 1): 2
_ о, (И, - 1) + о2(я2 - 1) _ о, (и, - 1) + д22(п2 - 1)
Г («, — 1) + (П2 — 1) И, + П2 - 2
\2
т _ ?(*л - *і) _2 _ Е(х,'2 - *г)
Так как о1 —, а о2 - , то
ст2 = ?(*/1 ~ + ?(*/2 ~ ^ = Гф] + «2СТ2 г «1 + п2 — 2 я, + л2 — 2 ’
Iд/и, + п2 - 2 ^гцп2 П2®2
Подставим полученное выражение в формулу (6.26), учитывая также формулу (6.27):
^факт = '"Л"1 2Г==^~ (6'28)
/п]а1 + ПпОп л/п, +
Сравнивая фактическое значение ^-статистики, рассчитанное по формуле (6.28), с табличным (см. Приложение 9) при заданном уровне значимости, можно сделать вывод о необходимости согласиться с выдвинутой гипотезой или отклонить ее.
Пример. Для оценки влияния формы собственности на платежеспособность предприятий отрасли проведено выборочное обследование частных и государственных предприятий, в результате которого получены данные, приведенные в табл. 6.10.
Таблица 6.10 Число Средний Дисперсия Форма обследованных коэффициент в выборочной собственности предприятий покрытия совокупности пі Х1 Частная 16 1,8 0,25 Государственная 10 1,2 1,18 В качестве нулевой выдвинем гипотезу о независимости степени платежеспособности предприятий от формы собственности, т.е.
о равенстве коэффициентов покрытия на предприятиях указанных форм собственности: HQ: х] = х2. Альтернативной является гипотеза Ну х, ^ х2. При проверке выдвинутой гипотезы примем уровень значимости а = 0,05. Рассчитаем по формуле (6.28) фактическое значение /-статистики:, = I1’8 ~ 1>2К16 + 10 ~ 2^16'10 = 37,181 = 2
/факт л/16-0,25 + 10-1,18 л/16 + 10 20,268
Табличное значение найдем на основе распределения Стью- дента при а = 0,05 и числе степеней свободы v = 16 + 10 - 2 = 24.
1,95
Так как P(t) = 25(0 - 1 = 1 - а = 0,95, то S(t) = —— = 0,975.
Соответствующее табличное значение / = 2,0639 (см. Приложение 9). Фактическое значение /-статистики меньше табличного, следовательно, с вероятностью 0,95 можно считать, что платежеспособность предприятий не зависит от принятой на них формы собственности.
Гипотезы о доле
Аналогичные два вида гипотез могут быть проверены и для доли: •
гипотеза о равенстве доли единиц, обладающих определенным признаком, нормативу; •
сравнение долей единиц, обладающих определенным признаком, в двух совокупностях.
Порядок проверки гипотез первого вида аналогичен порядку, приведенному для средней, т.е. проверяется гипотеза HQ: р = а, где р — доля единиц, обладающих изучаемым признаком в генеральной совокупности, а — норматив. Альтернативными могут быть гипотезы трех видов:
1) Ну р ^ а\ Т) Ну р > а\ Ъ) Ну р < а.
В качестве критерия также может быть принято значение /-статистики. Фактическое значение величины / рассчитывается по формуле
w — а
'факт Ц ’ (6.29)
где w — доля изучаемого признака в выборке; ц, — средняя ошибка выборки для доли. тт ^
Для выборки большого объема ц = Л , для малой вы-
_ и>(1 - ю) борки - Л —.
V /7—1
Табличное значение /-статистики, как и для средней, находится на основе интеграла вероятностей Лапласа или распределения Стьюдента (для малой выборки).
При сравнении долей единиц, обладающих определенным признаком, в двух совокупностях применяется схема, аналогичная приведенной ранее для проверки соответствующей гипотезы
о средней.
В качестве критерия можно использовать /-статистику. Фактическое значение критерия в этом случае рассчитывается по формулеи', —
'факт = Т ^ (6-30)
где и и>2— доля единиц, обладающих изучаемым признаком, в сравниваемых выборках;
Ц — стандартная ошибка разности выборочных долей.
Стандартная ошибка выборки может быть рассчитана по формуле
(6.31)
'± + ±'
П1 П7 V
1 2 У
где р — доля признака в генеральной совокупности; я, и «2 — объем каждой из двух выборок.
Эта формула справедлива, если величина р в двух сравниваемых генеральных совокупностях одинакова. Так как при проверке нулевой гипотезы величина р неизвестна, в формуле (6.31) можно использовать ее оценку, полученную по результатам выборочного обследования:
т{ + т2 и’,«! + У?2п2
^ пх + п2 пх + п2
где т, и т2 — частота изучаемого признака в каждой из двух выборок.
Сравнение фактического и табличного значений /-статистики позволяет отклонить или не отклонить выдвинутую гипотезу. Для сравнения двух долей можно использовать также %2-критерий Пирсона (см. параграф 5.8).
Еще по теме 6.8. Проверка гипотез о средней и о доле Гипотезы о средней:
- ПАУТИНООБРАЗНАЯ МОДЕЛЬ Питер Пашигян Cobweb Theorem В. Peter Pashigian
- 4.2. Методы исследования спроса в ресторанном бизнесе
- 9.2.2 Мотивационно-ценностный комплекс факторов
- 1. Статистика
- ГЛАВА 8. СТАТИСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗ
- 8.1. ОБЩИЕ ПОНЯТИЯ. ВЫБОР ТИПА КРИТИЧЕСКОЙ ОБЛАСТИ
- 8.2. ПРОВЕРКА ГИПОТЕЗЫ О ПРИНАДЛЕЖНОСТИ «ВЫДЕЛЯЮЩИХСЯ» НАБЛЮДЕНИЙ ИССЛЕДУЕМОЙ ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ
- 8.3. ПРОВЕРКА ГИПОТЕЗЫ О СООТВЕТСТВИИ ЭМПИРИЧЕСКОГО РАСПРЕДЕЛЕНИЯ ТИПУ КРИВЫХ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ
- 8.4. ПРОВЕРКА ГИПОТЕЗЫ О ВЕЛИЧИНЕ ЦЕНТРА РАСПРЕДЕЛЕНИЯ
- 9.4. ИЗМЕРЕНИЕ ТЕСНОТЫ КОРРЕЛЯЦИОННОЙ СВЯЗИ МЕЖДУ ДВУМЯ ПРИЗНАКАМИ