Ошибки выборки при одноступенчатом гнездовом отборе
Вычисление ошибки репрезентативности при использовании гнезд рассмотрим прежде всего для ситуации, когда применяется одноступенчатый гнездовой отбор[391]. В статистической литературе он нередко называется «серийным».
При проектировании такого выборочного обследования составляется список гнезд, например предприятий, вузов, жилых помещений, между которыми распределены все единицы исследования. В отобранных гнездах изучаются все единицы исследования. Именно такой характер носило выборочное обследование, которое, было осуществлено ЦСУ СССР во время переписи 1970 г. по дополнительной к бланку переписи программе, состоящей из 11 вопросов. В выборку было включено 25% всех жилых помещений, в которых опрашивались все проживающие там люди[392].При определении ошибки выборки следует исходить из того, что в качестве отдельной единицы наблюдения выступает, скажем, не рабочий или студент, а предприятие или вуз. И поэтому в знаменатель формулы ошибки случайной выборки (а гнездовая выборка является случайной) приходится включать не общее чис
ло опрошенных, а то число предприятий или вузов, где проходил опрос. Очевидно, что первая величина, как правило, намного больше второй, вследствие чего и ошибка гнездового отбора должна, как правило, превосходить ошибку чисто случайного
отбора[393].
гг
Ошибка гнездовой выборки определяется формулой ц = J —M
для случая повторного отбора и ц = 11 -Г I — для бесповтор-
V г V R)
ного отбора, где r — число серий в выборке; R — общее число серий, остальные обозначения прежние[394].
Резкое уменьшение знаменателя в формуле для гнездовой выборки не означает, однако, что ошибка выборки возрастает пропорциональным образом. Если бы дело обстояло так, и ошибка гнездовой выборки была бы всегда больше ошибки чисто случайной выборки в раз, то применение гнездового подхода было
бы во многих случаях неэффективно из-за чрезвычайно большой ошибки.
Однако дело обстоит не так. Одновременно с «опасным» уменьшением знаменателя происходит, как правило, и уменьшение числителя. Межгрупповая (или межгнездовая) дисперсия очень часто заметно меньше общей дисперсии. Информационная ценность одного гнезда намного выше ценности одной конечной единицы исследования. Очевидно, что данные о средней заработной плате рабочих предприятия-гнезда сообщают нам больше информации, чем сведения о заработной плате рабочего, отобранного собственно-случайным отбором.
Средняя характеристика гнезда формируется на основе различных значений признака, и поэтому она чаще ближе к общей средней генеральной совокупности и ближе к другим гнездовым средним, чем характеристики отдельных единиц. Это и дает возможность с помощью уменьшения межгрупповой дисперсии в известной мере компенсировать снижение объема выборки, принимаемой в расчет при определении ошибки. Степень этой компенсации зависит от структуры гнезда — чем она разнообразнее, чем больше в ней разброс признака, тем гнездовая средняя будет ближе к указанным выше величинам, тем будет меньше межгруппо- вая дисперсия.
Еще по теме Ошибки выборки при одноступенчатом гнездовом отборе:
- 5.4. Способы отбора единиц из генеральной совокупности Классификация способов отбора единиц
- 7.4. РАЗЛИЧНЫЕ ВИДЫ ВЫБОРОЧНОГО НАБЛЮДЕНИЯ
- 6.3. Основные способы формирования выборочной совокупности
- Многоступенчатый отбор и гнездо
- Ошибки выборки при одноступенчатом гнездовом отборе
- Коэффициент внутригнездовой корреляции
- Ошибка многоступенчатой выборки