<<
>>

5.2. Ошибки выборочного наблюдения Средняя ошибка

Принцип равных возможностей попадания в выборку каждой единицы генеральной совокупности исключает формирование выборочной совокупности только за счет лучших или худших единиц и появления систематических (тенденциозных) ошибок.

5.2.

Ошибки выборочного наблюдения

291

В то же время выборочная совокупность — это только часть генеральной совокупности, состоящей из единиц с варьирующими признаками. Отсюда обобщающая характеристика генеральной совокупности отличается от соответствующей характеристики выборки на среднюю ошибку Выборки р..

Средняя ошибка выборки показывает, как генеральная средняя (или доля) отклоняется в среднем от выборочной средней (или доли) в ту и другую сторону. Она имеет ту же единицу измерения, что и количественный признак, и представлена коэффициентом, если изучается альтернативный признак. Формула расчета средней ошибки выборки определяется видом исследуемого признака единиц совокупности (количественный или альтернативный) и способом отбора (бесповторный или повторный).

Если признак количественный, а отбор повторный, средняя ошибка выборки исчисляется по средней квадратической простой:

^0"в1ь1б —'

где ав2ь,б — дисперсия признака в выборочной совокупности; п — число единиц в выборке.

Если признак количественный, а отбор бесповторный:

где .V— число единиц в генеральной совокупности. Если признак альтернативный, отбор повторный:

м> -г выборочная доля.

Если признак альтернативный, отбор бесповторный:

Из формул видно, что средняя ошибка выборки зависит от варьи-руемости изучаемого признака, численности отобранных единиц и способа отбора. Бесповторная выборка дает меньшее значение средней ошибки выборки. Сильная варьируемость признака (большая величина ав2ь,б) увеличивает ошибку. Более точные результаты можно по

19*

292

Глава 5. Выборочное наблюдение

лучить при обследовании большего числа единиц п, поэтому среднюю ошибку называют ошибкой репрезентативности (представительства генеральной совокупности в отобранных единицах).

На основании средней ошибки исчисляется предельная ошибка выборки А, с определенной степенью вероятности устанавливающая пределы отклонения генеральной средней (или доли) от выборочной средней (или доли). Вероятность показывает, в скольких случаях из тысячи генеральная средняя (или доля) будет находиться в установленных пределах. Если вероятность 0,683, то в 683 случаях из 1000 значение х или р попадет в интервал, устанавливаемый с помощью А.

Влияние вероятности на пределы отклонения х(р) от х(м>) задается коэффициентом доверия (или кратности ошибки) I В экономических исследованиях наиболее часто применяются следующие значения /:

Вероятность 0,0000 0,0797 0,3829 0,6827 0,8664 0,9545 0,9876 0,9907 0,9973 0,9999 t 0,0 0,1 0,5 1,0 1,5 .2,0 2,5 2,6 3,0 4,0

Значение предельной ошибки выборки с заданной степенью вероятности:

Границы изменения генеральной средней и доли с заданной степенью вероятности:

Для изучения среднего возраста молодых специалистов города проведена 5%-ная случайная бесповторная выборка, в результате группировки первичных данных получено следующее распределение специалистов по возрасту:

Предельная ошибка

А* і Ц*> Аи> і \іп •

х - Ах < х < х + Ах; у-Ан^р^мг + Аы

Возраст, лет

Число специалистов, чел.

5

До 24 24-26 26-28

40

20

28-30

30

30 и больше

5

Итого

100

5.2. Ошибки выборочного наблюдения

293

С вероятностью 0,954 определим:

1) пределы, в которых находится средний возраст всех молодых специалистов города;

2) долю молодых специалистов в возрасте менее 26 лет в общей численности молодых специалистов города.

Определим средний возраст отобранных 100 специалистов по интервальному ряду распределения, построив расчетную таблицу: Возраст, лет X / хГ х—х (х-х)2 (х~х)2/ До 24 (22-24) ' 23 5 115 -4,2 17,64 88,2 24-26 25 20 500 -2,2 4,84 96,8 26-28 27 40 1080 0,2 0,04 1,6 28-30 29 30 870 1,8 3,24 97,2 30 и больше (30-32) 31 5 155 3,8 14,44 72,2 Итого ' •_ 100 2720 ?' — ?'- ? ? _ • 356,0 Х-'

X*/

Х/:

2720 100

= 27,2 года.

Средний возраст отобранных в случайном порядке ста молодых специалистов составляет 27,2 года.

Проверим типичность исчисленной средней для ста специалистов выборочной совокупности.

Овыб —•

Х^-^)2/_ 356__ - 1()0- ?,30.

X/

Среднее квадратическое отклонение:

ствыб = V ав2ыб = V 3,56 =±1,9 года.

Фактический возраст отобранных ста специалистов отклоняется от их среднего возраста, равного 27,2 года, в ту и другую сторону в среднем на 1,9 года.

Коэффициент вариации:

Ри = ^- 100=^- 100 = 7%(<30%).

X 11,1

Средний возраст 27,2 года можно считать типичной обобщающей характеристикой возраста специалистов выборочной совокупности.

294

Глава 5. Выборочное наблюдение

Определим среднюю ошибку выборки (признак количественный, отбор бесповторный, 5% -ный):

: = л/_|_(1-.|) =^^(1-0^=^0Щ4" = ±0,2

года.

Средний возраст всех 2000 (100 : 0,05) молодых специалистов города отклоняется от среднего возраста отобранных 100 специалистов в ту и другую сторону в среднем на 0,2 года.

Для вероятности 0,954 коэффициент доверия I — 2, откуда предельная ошибка выборки:

Л* = /Ц* = ±2 • 0,2 = ±0,4 года.

С вероятностью 0,954 можно утверждать, что средний возраст всех молодых специалистов города находится в пределах:

х- Дх<х< х + Ах; 27,2-0,4 <х< 27,2 + 0,4;

26,8лет <.5ё< 27,6года.

Доля молодых специалистов в возрасте менее 26 лет является альтернативным признаком (возраст либо менее 26 лет, либо 26 и более). Исчисляем выборочную долю:

5 + 20 25 п «. М! = =-щ = 0,25, или 25%.

В численности отобранных молодых специалистов удельный вес специалистов в возрасте менее 26 лет составляет 25%.

Средняя ошибка выборки (признак альтернативный, отбор бесповторный, 5%-ный):

,. = Л/-^(1-А)=^0,25(1о-0,25)(1_005) =

= ^0,0018 =±0,042, или 4,2%.

Доля молодых специалистов в возрасте менее 26 лет в общей численности молодых специалистов города отклоняется от соответствующей доли в численности отобранных специалистов в ту и другую сторону в среднем на 4,2%.

Для вероятности 0,954 предельная ошибка выборки:

Д„ = гЦн, = ±2 • 0,042 = ±0,084, или 8,4%.

5.3. Расчет необходимой численности выборки

295

С вероятностью 0,954 можно утверждать, что доля молодых специалистов в возрасте менее 26 лет в общей численности молодых специалистов города находится в пределах:

Величина средней ошибки выборки ц. зависит от численности единиц выборочной совокупности п. Чем больше отобрано единиц, тем меньше ошибка. В то же время увеличение п приводит к росту затрат на обработку данных или к разрушению большого количества исследуемых единиц. Отсюда важно установить оптимальный объем выборки п исходя из заданного значения предельной ошибки А.

Определение числа единиц выборочной совокупности при повторной выборке.

Если выборка повторная, признак количественный:

м>- А» <р < ц> + А„,; 25-8,45.3. Расчет необходимой численности выборки

Если выборка повторная, признак альтернативный:

Численность единиц бесповторной выборки

Если выборка бесповторная, признак количественный:

Д2 = г2

ав2ыб п) і2 ав2ыб ІУ- і1 ав2ь,б п

296

Глава 5. Выборочное наблюдение

Если выборка бесповторная, признак альтернативный:

Aw=t [L=f\j---(1-д?) ,

Al = t2

w (1 - w) (N-n) t1 w [(1 ~w)N~w(\- w) n] nN nN '

AI nN+11 w (1 - w) n -t2 w (1 - w) N;

AlN+flw(l -w)'

Для проверки массы батонов из партии размером 2000 шт. в случайном порядке отбираются образцы, чтобы с вероятностью 0,997 предельная ошибка не превысила 3% массы полукилограммового батона. Определим, сколько батонов необходимо отобрать при повторной и бесповторной выборке, если среднее квадратическое отклонение в выборочной совокупности равно 14 г.

Изучается количественный признак — масса батона. При повторной выборке:

;2Ов2ыб_ 32-142 1 76 4 7 ьд П А! (0,03 -500)2 225 /'б4шт' Если выборка бесповторная:

В городе проживает 10 000 семей. С целью определения доли семей, имеющих детей в возрасте до трех лет, необходимо провести выборочное наблюдение. Предварительно установлено, что доля таких семей в выборке должна равняться 25%, а предельная ошибка выборки с вероятностью 0,954 не может превышать 10%.

При повторном отборе и изучении альтернативного признака (возраст либо до трех лет, либо свыше трех лет):

f?leN З2- 142 - 2000 3 528 000

= 7,81 шт.

п =

A2N+t2aL6 152 ? 2000 +? З2 • 142 451 764

п t2w(\-w) _ 22-0,25 (1 -0,25) 0,75

75 семей.

Л2 . (ОД)2 0,01

5.4. Способы отбора единиц из генеральной совокупности

297

п =

Если отбор бесповторный:

22 • 0,25 (1 - 0,25) • 10000

7500

ММ+?\ч(\-у>) (ОД)2 • 10000+ 22 • 0,25 (1 -0,25) 100,75 семьи.

= 74

4 При бесповторной выборке необходимая точность результатов достигается при меньшем объеме выборочной совокупности.

<< | >>
Источник: Ёдронова В.Н., Бдронова М.В.. Общая теория статистики: Учебник — М.: Юристъ,. — 511с.. 2001

Еще по теме 5.2. Ошибки выборочного наблюдения Средняя ошибка:

  1. 2.4. Ошибки статистического наблюдения и контроль данных наблюдения
  2. 5.5. Методология и практика выборочного наблюдения Этапы наблюдения
  3. Ошибки репрезентативности Ошибки репрезентативности и регистрации информации
  4. 7.1. ПОНЯТИЕ О ВЫБОРОЧНОМ НАБЛЮДЕНИИ
  5. 6.6. Распространение результатов выборочного наблюдения на генеральную совокупность
  6. 6.1. Общая характеристика выборочного наблюдения
  7. 5.1. Сущность и необходимость выборочного наблюдения Основные понятия
  8. 7.4. РАЗЛИЧНЫЕ ВИДЫ ВЫБОРОЧНОГО НАБЛЮДЕНИЯ
  9. Теоретические ошибки репрезентативности
  10. Определение фактической ошибки репрезентативности
  11. Глава 5. Выборочное наблюдение
  12. ГЛАВА 7. ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ
  13. Глава 6 ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ