<<
>>

Ошибки выборки при одноступенчатом гнездовом отборе

Вычисление ошибки репрезентативности при использовании гнезд рассмотрим прежде всего для ситуации, когда применяется одноступенчатый гнездовой отбор[391]. В статистической литературе он нередко называется «серийным».

При проектировании такого выборочного обследования составляется список гнезд, например предприятий, вузов, жилых помещений, между которыми распределены все единицы исследования. В отобранных гнездах изучаются все единицы исследования. Именно такой характер носило выборочное обследование, которое, было осуществлено ЦСУ СССР во время переписи 1970 г. по дополнительной к бланку переписи программе, состоящей из 11 вопросов. В выборку было включено 25% всех жилых помещений, в которых опрашивались все проживающие там люди[392].

При определении ошибки выборки следует исходить из того, что в качестве отдельной единицы наблюдения выступает, скажем, не рабочий или студент, а предприятие или вуз. И поэтому в знаменатель формулы ошибки случайной выборки (а гнездовая выборка является случайной) приходится включать не общее чис

ло опрошенных, а то число предприятий или вузов, где проходил опрос. Очевидно, что первая величина, как правило, намного больше второй, вследствие чего и ошибка гнездового отбора должна, как правило, превосходить ошибку чисто случайного

отбора[393].

гг

Ошибка гнездовой выборки определяется формулой ц = J —M

для случая повторного отбора и ц =              11 -Г I — для бесповтор-

V г V R)

ного отбора, где r — число серий в выборке; R — общее число серий, остальные обозначения прежние[394].

Резкое уменьшение знаменателя в формуле для гнездовой выборки не означает, однако, что ошибка выборки возрастает пропорциональным образом. Если бы дело обстояло так, и ошибка гнездовой выборки была бы всегда больше ошибки чисто случайной выборки в раз, то применение гнездового подхода было

бы во многих случаях неэффективно из-за чрезвычайно большой ошибки.

Однако дело обстоит не так. Одновременно с «опасным» уменьшением знаменателя происходит, как правило, и уменьшение числителя. Межгрупповая (или межгнездовая) дисперсия очень часто заметно меньше общей дисперсии. Информационная ценность одного гнезда намного выше ценности одной конечной единицы исследования. Очевидно, что данные о средней заработной плате рабочих предприятия-гнезда сообщают нам больше информации, чем сведения о заработной плате рабочего, отобранного собственно-случайным отбором.

Средняя характеристика гнезда формируется на основе различных значений признака, и поэтому она чаще ближе к общей средней генеральной совокупности и ближе к другим гнездовым средним, чем характеристики отдельных единиц. Это и дает возможность с помощью уменьшения межгрупповой дисперсии в известной мере компенсировать снижение объема выборки, принимаемой в расчет при определении ошибки. Степень этой компенсации зависит от структуры гнезда — чем она разнообразнее, чем больше в ней разброс признака, тем гнездовая средняя будет ближе к указанным выше величинам, тем будет меньше межгруппо- вая дисперсия.

<< | >>
Источник: Шляпентох В.Э.. Проблемы качества социологической информации: достоверность, репрезентативность, прогностический потенциал. — М.: ЦСП. — 664 с.. 2006

Еще по теме Ошибки выборки при одноступенчатом гнездовом отборе:

  1. 5.4. Способы отбора единиц из генеральной совокупности Классификация способов отбора единиц
  2. 7.4. РАЗЛИЧНЫЕ ВИДЫ ВЫБОРОЧНОГО НАБЛЮДЕНИЯ
  3. 6.3. Основные способы формирования выборочной совокупности
  4. Многоступенчатый отбор и гнездо
  5. Ошибки выборки при одноступенчатом гнездовом отборе
  6. Коэффициент внутригнездовой корреляции
  7. Ошибка многоступенчатой выборки