<<
>>

6.5. Малая выборка

Приведенные в параграфах 6.2—6.4 формулы средней ошибки выборки показывают, что ее величина зависит от объема выборки п, степени колеблемости изучаемого признака в генеральной совокупности и способа отбора.

Для собственно случайной повторной выборки

(6.16)

Если объем выборки достаточно велик, единицей в знаменателе можно пренебречь. На практике иногда приходится отбирать из генеральной совокупности небольшое число единиц. В этом случае использование в формуле (6.16) вместо (и — 1) величины п может значительно повлиять на результат, т.е. занизить среднюю ошибку выборки. Как правило, выборка считается малой, если обследуется не более 30 единиц. Таким образом, средняя ошибка малой выборки при собственно случайном или механическом повторном отборе рассчитывается по формуле

Ц = (6.17)

Н-М.В _ ]

В условиях малой выборки дисперсия выборочной совокупности не может рассматриваться в качестве оценки генеральной дисперсии.

Второе отличие заключается в том, что в выборках большого объема вероятность появления определенного нормированного

X “? X

отклонения выборочной средней от генеральной / = под-

чиняется нормальному закону распределения независимо от того,

как распределены единицы в генеральной совокупности. Как следует из центральной предельной теоремы, предположение о нормальном распределении всех возможных значений выборочной средней и соответствующей величины ? справедливо только при значительном объеме выборки.

В условиях малой выборки характер распределения единиц в генеральной совокупности оказывает влияние на вероятность появления той или иной ошибки выборки. В условиях нормально распределенной генеральной совокупности при п < 30 нормиро-

X — X

ванное отклонение выборочной средней от генеральной / =

^м.в

и соответствующая вероятность подчинены закону распределения Стьюдента, открытому в 1908 г.

английским математиком У. Гос- сетом (псевдоним — Стьюдент).

Графически распределение Стьюдента имеет вид одновершинной кривой, которая симметрична относительно оси ординат и при увеличении объема выборки приближается к кривой нормального распределения (рис. 6.2). При п > 100 вероятность наступления того или иного значения /, найденная в соответствии с распределением Стьюдента, практически совпадает с соответствующей величиной интеграла вероятностей Лапласа. При 30 < п < 100 расхождения между указанными значениями невелики, поэтому на практике данное распределение используется лишь для и < 30.

Рис. 6.2. Кривые нормального распределения и распределения Стьюдента (при V = 3)

Согласно распределению Стьюдента, плотность распределения для нормированного отклонения выборочной средней от генеральной определяется по формуле

S(t) =

(6.18)

где V — число степеней свободы.

При определении выборочной дисперсии необходимо знать среднее значение признака, поэтому V = п — 1.

Гамма-функция имеет вид

(6.19)

Г(и) = {хи 'е Xdx.

о

Последовательно подставляя в формулу (6.19) вместо и значе- v + 1 v

ния

и —, можно получить значения гамма-функции, кото-

рые необходимо использовать при расчете плотности распределения ошибок малой выборки.

Вероятность того, что нормированное отклонение выборочной средней от генеральной не превысит заданного значения 1, будет равна площади, ограниченной кривой распределения Стьюдента и осью абсцисс в интервале от — до Г. Г

Г

V + 1 2

(6.20)

At.

5(0 =

Формула (6.20) свидетельствует о том, что в условиях малой выборки вероятность появления той или иной ошибки зависит не только от /, но и от объема выборки, так как v = п — 1. Чем меньше я, тем медленнее указанная кривая приближается к оси абсцисс (см. рис. 6.2). Следовательно, при малой выборке вероятность болылйх отклонений выборочной средней от генеральной более высока.

Найденное по формуле (6.20) значение функции S(t) — это вероятность того, что фактический коэффициент доверия /факт < t.

Следовательно, (1 — S(t)) — вероятность того, что ?факт > /. Если

рассматривать абсолютную величину нормированного отклонения, т.е. |7факт|, то вероятность ее выхода за заданные пределы t

AlWl>H) = 2[i -Wl-

Вероятность того, что это отклонение будет находиться в пределах от — t до +t,

«IV« t < l'l> - " - «IV-г I > I'D =

= ] - 2[1 - Д/)] = 2ЗД - 1. (6.21)

Кроме того, эта величина равна вероятности попадания среднего значения признака в генеральной совокупности в пределы х±Дмв (х-Дмв< х < х + Дмв), где Д — предельная ошибка малой выборки.

Величины S(t) для разных значений t и v табулированы, поэтому в каждом конкретном случае нет необходимости выполнять расчет по формуле (6.20). Соответствующие таблицы могут быть представлены двумя способами: •

искомая вероятность P(t) или S(t) находится на пересечении строки, соответствующей значению коэффициента доверия t, и столбца, соответствующего числу степеней свободы V или объему выборки п, так как v = п — 1 (см. Приложение 3); •

в клетках таблицы указывается значение коэффициента доверия t, соответствующее определенному числу степеней свободы V и некоторым наиболее часто употребляемым значениям доверительной вероятности P(t) (0,90; 0,95; 0,99) или уровню значимости, равному а = 1 — P(t) (0,10; 0,05; 0,01) (см. Приложение 9). В статистических таблицах вероятности S(t) и P(t) не тождественны:

S(t) — вероятность того, что фактическое значение нормированного отклонения выборочной средней от генеральной будет не больше, чем табличное значение, т.е. S(t) = P(tфакт < t)\

P{t) — вероятность ТОГО, ЧТО ?факт по абсолютной величине не превосходит значение |?|, т.е. P(t) = Дкфакт| ^ И) = 2S(t) — 1.

Пример. В результате выборочной проверки налоговой инспекцией 10 промышленных предприятий города средняя доля документально неоформленных работ на них составила 17%. Определить вероятность того, что в генеральной совокупности доля документально неоформленных работ не превышает 25%.

Для нахождения средней ошибки малой выборки необходимо знать ее дисперсию:

о2 = w( 1 - w) = 0,17(1 - 0,17) = 0,1411.

В таком случае

w( 1 — w) 0,1411

>v.

= тНггг - lltri 3 °'|2S-

Дмн < Р - w = °>25 - 0.17 = 0,08.

М.В 1 ' '

Следовательно, t= —— = = 0,64, отсюда /^факт < 0,64) =

I^M.B U.lzj

= S(t) при v = n — 1 = 9. По таблице Приложения 3 находим: при t = 0,64 и п = 10 вероятность S(t) = 0,718. Таким образом, с вероятностью 0,718 можно утверждать, что доля документально неоформленных работ на всех предприятиях города не превышает 25%.

Пример. При выборочном обследовании налоговой инспекцией 15 обменных пунктов города было установлено, что разница между курсом покупки и курсом продажи в среднем составляет 84 коп. за 1 долл. при среднем квадратическом отклонении 10 коп. С вероятностью 0,95 определить пределы, в которых находится разница между курсом покупки и курсом продажи валюты во всех обменных пунктах города.

Средняя ошибка малой выборки

о2 I 100

М-мв = Л7 Г = л/— Г = 2,67 коп. s 3 коп.

15 - 1

Так как P(t) = 0,95, то S(t) = ~ = ~ = 0,975.

При и = 15 (т.е. v = 15 — 1 = 14) и S(t) = 0,975 по таблице Приложения 3 определяем, что значение t находится между 2,1 и 2,2.

Более точно установить эту величину позволяет таблица Приложения 9: при v = 14 и а = 1 — P{t) = 0,05 соответствующее значение t = 2,145. Следовательно, предельная ошибка выборки А = til = 2,145 • 2,67 = 5,73 коп. = 6 коп.

М.В ‘ М.В

Пределы, в которых находится разница между курсом покупки и курсом продажи валюты, при найденном значении предельной ошибки выборки составляют

х — А <х<х + Д ,

м.в м.в’

т.е.

84 — 6 < х < 84 + 6,

или

78 коп. < х < 90 коп.

С вероятностью 0,95 можно утверждать, что в генеральной совокупности разница между курсом покупки и курсом продажи валюты составляет от 78 до 90 коп.

Выводы, сделанные на основе малой выборки, справедливы лишь при нормальном распределении значений изучаемого признака в генеральной совокупности. Поэтому использование малой выборки для оценки доли и средней в генеральной совокупности целесообразно в том случае, если исследователь не располагает необходимыми ресурсами для проведения выборки большего объема или если выборочное обследование связано с порчей единиц наблюдения (например, при проверке качества продуктов питания).

<< | >>
Источник: Г.Л. Громыко. Теория статистики: Учебник. — Т11 2-е изд., перераб. и доп. - М.: ИНФРА-М,. - 476 с. — (Классический университетский учебник)., . 2005

Еще по теме 6.5. Малая выборка:

  1. 1. Статистика
  2. Статистико-математическая научная школа
  3. 5.4. Способы отбора единиц из генеральной совокупности Классификация способов отбора единиц
  4. 7.1. ПОНЯТИЕ О ВЫБОРОЧНОМ НАБЛЮДЕНИИ
  5. 7.2. ПРОСТАЯ СЛУЧАЙНАЯ ВЫБОРКА
  6. 7.5. МАЛЫЕ ВЫБОРКИ
  7. 8.4. ПРОВЕРКА ГИПОТЕЗЫ О ВЕЛИЧИНЕ ЦЕНТРА РАСПРЕДЕЛЕНИЯ
  8. 9.4. ИЗМЕРЕНИЕ ТЕСНОТЫ КОРРЕЛЯЦИОННОЙ СВЯЗИ МЕЖДУ ДВУМЯ ПРИЗНАКАМИ
  9. 6.4. Определение необходимой численности выборки
  10. 6.5. Малая выборка
  11. 6.8. Проверка гипотез о средней и о доле Гипотезы о средней
  12. 1. Статистика
  13. 4.1. ИССЛЕДОВАТЕЛЬСКИЕ СТРАТЕГИИ И МЕТОДЫ
  14. Информационное обеспечение процесса разработки стратегий
  15. 6.4. Этапы разработки выборочного плана