5.2. Ошибки выборочного наблюдения Средняя ошибка
Принцип равных возможностей попадания в выборку каждой единицы генеральной совокупности исключает формирование выборочной совокупности только за счет лучших или худших единиц и появления систематических (тенденциозных) ошибок.
5.2.
Ошибки выборочного наблюдения291
В то же время выборочная совокупность — это только часть генеральной совокупности, состоящей из единиц с варьирующими признаками. Отсюда обобщающая характеристика генеральной совокупности отличается от соответствующей характеристики выборки на среднюю ошибку Выборки р..
Средняя ошибка выборки показывает, как генеральная средняя (или доля) отклоняется в среднем от выборочной средней (или доли) в ту и другую сторону. Она имеет ту же единицу измерения, что и количественный признак, и представлена коэффициентом, если изучается альтернативный признак. Формула расчета средней ошибки выборки определяется видом исследуемого признака единиц совокупности (количественный или альтернативный) и способом отбора (бесповторный или повторный).
Если признак количественный, а отбор повторный, средняя ошибка выборки исчисляется по средней квадратической простой:
^0"в1ь1б —'
где ав2ь,б — дисперсия признака в выборочной совокупности; п — число единиц в выборке.
Если признак количественный, а отбор бесповторный:
где .V— число единиц в генеральной совокупности. Если признак альтернативный, отбор повторный:
м> -г выборочная доля.
Если признак альтернативный, отбор бесповторный:
Из формул видно, что средняя ошибка выборки зависит от варьи-руемости изучаемого признака, численности отобранных единиц и способа отбора. Бесповторная выборка дает меньшее значение средней ошибки выборки. Сильная варьируемость признака (большая величина ав2ь,б) увеличивает ошибку. Более точные результаты можно по
19*
292
Глава 5. Выборочное наблюдение
лучить при обследовании большего числа единиц п, поэтому среднюю ошибку называют ошибкой репрезентативности (представительства генеральной совокупности в отобранных единицах).
На основании средней ошибки исчисляется предельная ошибка выборки А, с определенной степенью вероятности устанавливающая пределы отклонения генеральной средней (или доли) от выборочной средней (или доли).
Вероятность показывает, в скольких случаях из тысячи генеральная средняя (или доля) будет находиться в установленных пределах. Если вероятность 0,683, то в 683 случаях из 1000 значение х или р попадет в интервал, устанавливаемый с помощью А.Влияние вероятности на пределы отклонения х(р) от х(м>) задается коэффициентом доверия (или кратности ошибки) I В экономических исследованиях наиболее часто применяются следующие значения /:
Вероятность 0,0000 0,0797 0,3829 0,6827 0,8664 0,9545 0,9876 0,9907 0,9973 0,9999 t 0,0 0,1 0,5 1,0 1,5 .2,0 2,5 2,6 3,0 4,0
Значение предельной ошибки выборки с заданной степенью вероятности:
Границы изменения генеральной средней и доли с заданной степенью вероятности:
Для изучения среднего возраста молодых специалистов города проведена 5%-ная случайная бесповторная выборка, в результате группировки первичных данных получено следующее распределение специалистов по возрасту:
Предельная ошибка
А* і Ц*> Аи> і \іп •
х - Ах < х < х + Ах; у-Ан^р^мг + Аы
Возраст, лет
Число специалистов, чел. 5
До 24 24-26 26-28
40
20
28-30
30
30 и больше
5
Итого
100
5.2. Ошибки выборочного наблюдения
293
С вероятностью 0,954 определим:
1) пределы, в которых находится средний возраст всех молодых специалистов города;
2) долю молодых специалистов в возрасте менее 26 лет в общей численности молодых специалистов города.
Определим средний возраст отобранных 100 специалистов по интервальному ряду распределения, построив расчетную таблицу: Возраст, лет X / хГ х—х (х-х)2 (х~х)2/ До 24 (22-24) ' 23 5 115 -4,2 17,64 88,2 24-26 25 20 500 -2,2 4,84 96,8 26-28 27 40 1080 0,2 0,04 1,6 28-30 29 30 870 1,8 3,24 97,2 30 и больше (30-32) 31 5 155 3,8 14,44 72,2 Итого ' •_ 100 2720 ?' — ?'- ? ? _ • 356,0 Х-'
X*/
Х/:
2720 100
= 27,2 года.
Средний возраст отобранных в случайном порядке ста молодых специалистов составляет 27,2 года.
Проверим типичность исчисленной средней для ста специалистов выборочной совокупности.
Овыб —•
Х^-^)2/_ 356__ - 1()0- ?,30.
X/
Среднее квадратическое отклонение:
ствыб = V ав2ыб = V 3,56 =±1,9 года.
Фактический возраст отобранных ста специалистов отклоняется от их среднего возраста, равного 27,2 года, в ту и другую сторону в среднем на 1,9 года.
Коэффициент вариации:
Ри = ^- 100=^- 100 = 7%(<30%).
X 11,1
Средний возраст 27,2 года можно считать типичной обобщающей характеристикой возраста специалистов выборочной совокупности.
294
Глава 5. Выборочное наблюдение
Определим среднюю ошибку выборки (признак количественный, отбор бесповторный, 5% -ный):
: = л/_|_(1-.|) =^^(1-0^=^0Щ4" = ±0,2
года.
Средний возраст всех 2000 (100 : 0,05) молодых специалистов города отклоняется от среднего возраста отобранных 100 специалистов в ту и другую сторону в среднем на 0,2 года.
Для вероятности 0,954 коэффициент доверия I — 2, откуда предельная ошибка выборки:
Л* = /Ц* = ±2 • 0,2 = ±0,4 года.
С вероятностью 0,954 можно утверждать, что средний возраст всех молодых специалистов города находится в пределах:
х- Дх<х< х + Ах; 27,2-0,4 <х< 27,2 + 0,4;
26,8лет <.5ё< 27,6года.
Доля молодых специалистов в возрасте менее 26 лет является альтернативным признаком (возраст либо менее 26 лет, либо 26 и более).
Исчисляем выборочную долю:5 + 20 25 п «. М! = =-щ = 0,25, или 25%.
В численности отобранных молодых специалистов удельный вес специалистов в возрасте менее 26 лет составляет 25%.
Средняя ошибка выборки (признак альтернативный, отбор бесповторный, 5%-ный):
,. = Л/-^(1-А)=^0,25(1о-0,25)(1_005) =
= ^0,0018 =±0,042, или 4,2%.
Доля молодых специалистов в возрасте менее 26 лет в общей численности молодых специалистов города отклоняется от соответствующей доли в численности отобранных специалистов в ту и другую сторону в среднем на 4,2%.
Для вероятности 0,954 предельная ошибка выборки:
Д„ = гЦн, = ±2 • 0,042 = ±0,084, или 8,4%.
5.3. Расчет необходимой численности выборки
295
С вероятностью 0,954 можно утверждать, что доля молодых специалистов в возрасте менее 26 лет в общей численности молодых специалистов города находится в пределах:
Величина средней ошибки выборки ц. зависит от численности единиц выборочной совокупности п. Чем больше отобрано единиц, тем меньше ошибка. В то же время увеличение п приводит к росту затрат на обработку данных или к разрушению большого количества исследуемых единиц. Отсюда важно установить оптимальный объем выборки п исходя из заданного значения предельной ошибки А.
Определение числа единиц выборочной совокупности при повторной выборке.
Если выборка повторная, признак количественный:
м>- А» <р < ц> + А„,; 25-8,4?<25 + 8,4; 16,6% <у?< 33,4%
5.3. Расчет необходимой численности выборки
Если выборка повторная, признак альтернативный:
Численность единиц бесповторной выборки
Если выборка бесповторная, признак количественный:
Д2 = г2
ав2ыб п) і2 ав2ыб ІУ- і1 ав2ь,б п
296
Глава 5. Выборочное наблюдение
Если выборка бесповторная, признак альтернативный:
Aw=t [L=f\j---(1-д?) ,
Al = t2
w (1 - w) (N-n) t1 w [(1 ~w)N~w(\- w) n] nN nN '
AI nN+11 w (1 - w) n -t2 w (1 - w) N;
AlN+flw(l -w)'
Для проверки массы батонов из партии размером 2000 шт.
в случайном порядке отбираются образцы, чтобы с вероятностью 0,997 предельная ошибка не превысила 3% массы полукилограммового батона. Определим, сколько батонов необходимо отобрать при повторной и бесповторной выборке, если среднее квадратическое отклонение в выборочной совокупности равно 14 г.Изучается количественный признак — масса батона. При повторной выборке:
;2Ов2ыб_ 32-142 1 76 4 7 ьд П А! (0,03 -500)2 225 /'б4шт' Если выборка бесповторная:
В городе проживает 10 000 семей. С целью определения доли семей, имеющих детей в возрасте до трех лет, необходимо провести выборочное наблюдение. Предварительно установлено, что доля таких семей в выборке должна равняться 25%, а предельная ошибка выборки с вероятностью 0,954 не может превышать 10%.
При повторном отборе и изучении альтернативного признака (возраст либо до трех лет, либо свыше трех лет):
f?leN З2- 142 - 2000 3 528 000
= 7,81 шт.
п =
A2N+t2aL6 152 ? 2000 +? З2 • 142 451 764
п t2w(\-w) _ 22-0,25 (1 -0,25) 0,75
75 семей.
Л2 . (ОД)2 0,01
5.4. Способы отбора единиц из генеральной совокупности
297
п =
Если отбор бесповторный:
22 • 0,25 (1 - 0,25) • 10000
7500
ММ+?\ч(\-у>) (ОД)2 • 10000+ 22 • 0,25 (1 -0,25) 100,75 семьи.
= 74
4 При бесповторной выборке необходимая точность результатов достигается при меньшем объеме выборочной совокупности.
Еще по теме 5.2. Ошибки выборочного наблюдения Средняя ошибка:
- 2.1. Формы, виды и способы статистического наблюдения Понятие статистического наблюдения
- 2.5. Контроль данных статистического наблюдения Виды ошибок
- Глава 5. Выборочное наблюдение
- 5.1. Сущность и необходимость выборочного наблюдения Основные понятия
- 5.2. Ошибки выборочного наблюдения Средняя ошибка
- 5.4. Способы отбора единиц из генеральной совокупности Классификация способов отбора единиц
- 5.5. Методология и практика выборочного наблюдения Этапы наблюдения
- ГЛАВА 7. ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ
- 7.1. ПОНЯТИЕ О ВЫБОРОЧНОМ НАБЛЮДЕНИИ
- 7.4. РАЗЛИЧНЫЕ ВИДЫ ВЫБОРОЧНОГО НАБЛЮДЕНИЯ
- 7.6. ПРАКТИКА ПРИМЕНЕНИЯ ВЫБОРОЧНОГО МЕТОДА (СТАТИСТИЧЕСКИЙ КОНТРОЛЬ КАЧЕСТВАМИ ИЗУЧЕНИЕ ИСПОЛЬЗОВАНИЯ ВНУТРИСМЕННОГО ВРЕМЕНИ РАБОЧИХ)
- 2.2. Виды и способы статистического наблюдения
- 2.4. Ошибки статистического наблюдения и контроль данных наблюдения