<<
>>

6.8. Проверка гипотез о средней и о доле Гипотезы о средней

В статистической практике наиболее часто проверяются два вида гипотез о средних величинах: •

гипотеза о равенстве средней величины установленному нор-

мативу; •

гипотеза о равенстве средних значений признака двух совокупностей.

Общий подход к проверке гипотезы о равенстве среднего значения признака в генеральной совокупности некоторой величине Н0: х = а описан в параграфе 6.7.

В качестве критерия в этом случае целесообразно использовать нормированное отклонение выборочной средней от заданной величины:

И

где ц — средняя квадратическая ошибка выборочной средней, т.е. средняя ошибка выборки.

При большом объеме выборки (я > 30) средняя ошибка вы-

борки ц рассчитывается по формуле

формуле ц - л -. Если полученное по результатам обследо- 11

п — 1

вания фактическое значение /-статистики меньше табличного, т.е. /факт < /, то гипотеза не отклоняется. В противном случае нулевую гипотезу следует отклонить.

Пример. При оценке влияния изменений в налоговой политике на платежеспособность предприятий одного из регионов установлено, что до указанных изменений средний коэффициент покрытия по этим предприятиям соответствовал нормативу, равному 2. После внесения изменений в действующую налоговую систему было проведено выборочное обследование 49 предприятий региона, в результате которого установлено, что средний коэффициент покрытия на них составил 1,7 при среднем квадратическом отклонении 0,6.

Выдвигаемая нулевая гипотеза состоит в том, что изменения в проводимой налоговой политике существенно не повлияли на платежеспособность предприятий региона, т.е. коэффициент покрытия остался на прежнем уровне: Н0: х = 2. В качестве альтернативной может быть рассмотрена гипотеза о том, что указанные изменения повлияли на степень платежеспособности предприятий: Ну х Ф 2.

Для проверки выдвинутой гипотезы примем уровень значимости а = 0,05.

Так как вероятность Р{\х — 2| > /р,) = 0,05, а п > 30, 1

+'

то для значения интеграла вероятностей Лапласа ,— \ е 2с1/ =

= 0,95 находим табличное значение /-статистики: / = 1,96 (см. Приложение 2).

Фактическое значение /-статистики

х — а

х — а\ 1,7 — 2

—?1 = 3,5.

0,36

Так как /факт > /, то выдвинутая гипотеза отклоняется, т.е. изменения в налоговой системе повлияли на платежеспособность предприятий региона.

Для того чтобы сделать более определенный вывод о характере этих изменений, альтернативную гипотезу сформулируем следующим образом: изменения в налоговой системе привели к снижению платежеспособности предприятий региона, т.е. Ну х <2. Зададим для этого случая уровень значимости а = 0,01. Вероятность Р{х <2 — /ц) = 0,01, следовательно, значение интеграла 1

0 --

вероятностей Лапласа в пределах от — / до 0 равно ,— \ е 2 с!/ =

^2к -I —

— — 0,01 = 0,49, а в пределах от — / до +/ соответственно 0,98.

По таблице Приложения 2 находим для данной вероятности значение /-статистики: t= 2,33. Так как /факт > /, то нулевая гипотеза должна быть отклонена, т.е. с вероятностью 0,99 можно считать, что изменения в налоговой системе привели к снижению платежеспособности предприятий региона.

Если для проверки выдвинутой гипотезы используется малая выборка, то значение /-статистики определяется с помощью распределения Стьюдента. При этом степень обоснованности вывода зависит от того, насколько распределение генеральной совокупности соответствует нормальному закону.

Гипотеза о равенстве средних значений признака двух совокупностей выдвигается часто для того, чтобы проверить влияние како- го-либо фактора на среднюю. Обозначим среднее значение признака в этих совокупностях через хх и х а дисперсии в генеральных совокупностях — соответственно а2, и а2гГ В таком случае нулевая гипотеза может быть представлена следующим образом: Н0: хх = х2.

Для ее проверки проводится выборочное обследование, при котором объем выборки из первой совокупности составляет ир а из второй — пт Обозначим соответствующие значения средних в этих выборках через х] и х2, а дисперсии —

о2 и а2т В качестве критерия при проверке этой гипотезы принимается /-статистика, фактическое значение которой по результатам выборочного обследования рассчитывается по формуле

'факт = -ц ' (6'26)

Г1*, -X,

^_2 _2 г1 г2

1 — стандартная ошибка разности выбо- 1

2 рочных средних.

Предположим, что дисперсии в двух совокупностях равны, т.е. ст2, = О22 = о2. Следовательно,

(6.27)

аг(п, + п2)

Если дисперсии в выборочных совокупностях известны, то они могут быть использованы для оценки общей дисперсии. Расчет проводится по формуле средней арифметической взвешенной, где в качестве весов выступает число степеней свободы в каждой выборке (V = п — 1): 2

_ о, (И, - 1) + о2(я2 - 1) _ о, (и, - 1) + д22(п2 - 1)

Г («, — 1) + (П2 — 1) И, + П2 - 2

\2

т _ ?(*л - *і) _2 _ Е(х,'2 - *г)

Так как о1 —, а о2 - , то

ст2 = ?(*/1 ~ + ?(*/2 ~ ^ = Гф] + «2СТ2 г «1 + п2 — 2 я, + л2 — 2 ’

Iд/и, + п2 - 2 ^гцп2 П2®2

Подставим полученное выражение в формулу (6.26), учитывая также формулу (6.27):

^факт = '"Л"1 2Г==^~ (6'28)

/п]а1 + ПпОп л/п, +

Сравнивая фактическое значение ^-статистики, рассчитанное по формуле (6.28), с табличным (см. Приложение 9) при заданном уровне значимости, можно сделать вывод о необходимости согласиться с выдвинутой гипотезой или отклонить ее.

Пример. Для оценки влияния формы собственности на платежеспособность предприятий отрасли проведено выборочное обследование частных и государственных предприятий, в результате которого получены данные, приведенные в табл. 6.10.

Таблица 6.10 Число Средний Дисперсия Форма обследованных коэффициент в выборочной собственности предприятий покрытия совокупности пі Х1 Частная 16 1,8 0,25 Государственная 10 1,2 1,18 В качестве нулевой выдвинем гипотезу о независимости степени платежеспособности предприятий от формы собственности, т.е.

о равенстве коэффициентов покрытия на предприятиях указанных форм собственности: HQ: х] = х2. Альтернативной является гипотеза Ну х, ^ х2. При проверке выдвинутой гипотезы примем уровень значимости а = 0,05. Рассчитаем по формуле (6.28) фактическое значение /-статистики:

, = I1’8 ~ 1>2К16 + 10 ~ 2^16'10 = 37,181 = 2

/факт л/16-0,25 + 10-1,18 л/16 + 10 20,268

Табличное значение найдем на основе распределения Стью- дента при а = 0,05 и числе степеней свободы v = 16 + 10 - 2 = 24.

1,95

Так как P(t) = 25(0 - 1 = 1 - а = 0,95, то S(t) = —— = 0,975.

Соответствующее табличное значение / = 2,0639 (см. Приложение 9). Фактическое значение /-статистики меньше табличного, следовательно, с вероятностью 0,95 можно считать, что платежеспособность предприятий не зависит от принятой на них формы собственности.

Гипотезы о доле

Аналогичные два вида гипотез могут быть проверены и для доли: •

гипотеза о равенстве доли единиц, обладающих определенным признаком, нормативу; •

сравнение долей единиц, обладающих определенным признаком, в двух совокупностях.

Порядок проверки гипотез первого вида аналогичен порядку, приведенному для средней, т.е. проверяется гипотеза HQ: р = а, где р — доля единиц, обладающих изучаемым признаком в генеральной совокупности, а — норматив. Альтернативными могут быть гипотезы трех видов:

1) Ну р ^ а\ Т) Ну р > а\ Ъ) Ну р < а.

В качестве критерия также может быть принято значение /-статистики. Фактическое значение величины / рассчитывается по формуле

w — а

'факт Ц ’ (6.29)

где w — доля изучаемого признака в выборке; ц, — средняя ошибка выборки для доли. тт ^

Для выборки большого объема ц = Л , для малой вы-

_ и>(1 - ю) борки - Л —.

V /7—1

Табличное значение /-статистики, как и для средней, находится на основе интеграла вероятностей Лапласа или распределения Стьюдента (для малой выборки).

При сравнении долей единиц, обладающих определенным признаком, в двух совокупностях применяется схема, аналогичная приведенной ранее для проверки соответствующей гипотезы

о средней.

В качестве критерия можно использовать /-статистику. Фактическое значение критерия в этом случае рассчитывается по формуле

и', —

'факт = Т ^ (6-30)

где и и>2— доля единиц, обладающих изучаемым признаком, в сравниваемых выборках;

Ц — стандартная ошибка разности выборочных долей.

Стандартная ошибка выборки может быть рассчитана по формуле

(6.31)

'± + ±'

П1 П7 V

1 2 У

где р — доля признака в генеральной совокупности; я, и «2 — объем каждой из двух выборок.

Эта формула справедлива, если величина р в двух сравниваемых генеральных совокупностях одинакова. Так как при проверке нулевой гипотезы величина р неизвестна, в формуле (6.31) можно использовать ее оценку, полученную по результатам выборочного обследования:

т{ + т2 и’,«! + У?2п2

^ пх + п2 пх + п2

где т, и т2 — частота изучаемого признака в каждой из двух выборок.

Сравнение фактического и табличного значений /-статистики позволяет отклонить или не отклонить выдвинутую гипотезу. Для сравнения двух долей можно использовать также %2-критерий Пирсона (см. параграф 5.8).

<< | >>
Источник: Г.Л. Громыко. Теория статистики: Учебник. — Т11 2-е изд., перераб. и доп. - М.: ИНФРА-М,. - 476 с. — (Классический университетский учебник)., . 2005

Еще по теме 6.8. Проверка гипотез о средней и о доле Гипотезы о средней:

  1. ПАУТИНООБРАЗНАЯ МОДЕЛЬ Питер Пашигян Cobweb Theorem В. Peter Pashigian
  2. 4.2. Методы исследования спроса в ресторанном бизнесе
  3. 9.2.2 Мотивационно-ценностный комплекс факторов
  4. 1. Статистика
  5. ГЛАВА 8. СТАТИСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗ
  6. 8.1. ОБЩИЕ ПОНЯТИЯ. ВЫБОР ТИПА КРИТИЧЕСКОЙ ОБЛАСТИ
  7. 8.2. ПРОВЕРКА ГИПОТЕЗЫ О ПРИНАДЛЕЖНОСТИ «ВЫДЕЛЯЮЩИХСЯ» НАБЛЮДЕНИЙ ИССЛЕДУЕМОЙ ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ
  8. 8.3. ПРОВЕРКА ГИПОТЕЗЫ О СООТВЕТСТВИИ ЭМПИРИЧЕСКОГО РАСПРЕДЕЛЕНИЯ ТИПУ КРИВЫХ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ
  9. 8.4. ПРОВЕРКА ГИПОТЕЗЫ О ВЕЛИЧИНЕ ЦЕНТРА РАСПРЕДЕЛЕНИЯ
  10. 9.4. ИЗМЕРЕНИЕ ТЕСНОТЫ КОРРЕЛЯЦИОННОЙ СВЯЗИ МЕЖДУ ДВУМЯ ПРИЗНАКАМИ