<<
>>

Стратифицированная выборка

Первая модификация случайного отбора получила название районированной (или стратифицированной) выборки[334]. Сущность стратифицированной выборки сводится, как уже отмечалось, к уменьшению ошибки за счет межгрупповой дисперсии.

Поясним это на примере. Ранее отмечался факт сильного влияния уровня образования человека на структуру его внерабочего времени. Поэтому исследователь, составляющий прогнозы, касающиеся досуга в будущем, при проектировании выборки должен, естественно, особое внимание уделить тому, чтобы в его выборке соотношение лиц с различным уровнем образования было примерно таким же, как в изучаемом им объекте. Конечно, он может положиться полностью на случайный отбор, обладающий свойством «самовзвешивания». Иначе говоря, если объем выборки будет достаточно велик, то доля лиц с высоким и низким уровнем образования в выборке будет отличаться от истинных значений на величину заранее прогнозируемой ошибки. Можно, однако, свести ошибку по этому показателю до минимума. Для этого необходимо

выделить отдельные страты, например, для лиц со средним и высшим образованием и лиц, не имеющих среднего образования, и из каждой страты уже производить случайный отбор. При этом общий объем выборки чаще всего следует распределить пропорционально численности людей в каждой страте. Предположим, выборка объемом в 2000 человек производится из взрослого населения города (старше 16 лет), насчитывающего 20 тыс. человек, из которых 60% имеют среднее и более высокий уровень образования, а 40% — более низкий уровень (пример условный). Очевидно, что из списка лиц с высоким уровнем образования можно отобрать 1200 человек


, а из второго списка — 800.

Благодаря такому приему социолог гарантирует себе соответствие выборки генеральной совокупности по данному показателю, сохраняя при этом в неприкосновенности основой принцип случайной выборки — равенство всех единиц перед возможностью попасть в объектив исследователя.

Обеспечение жесткого контроля за такой переменной, как уровень образования, понадобилось исследователю не для того, чтобы получить из выборки точные данные о соотношении лиц, окончивших и не окончивших среднее учебное заведение. Ведь именно этими данными он располагал еще до начала самого исследования. Контроль за этой переменной обещает быть эффективным благодаря тому, что «образование» (в соответствии с накопленными ранее знаниями) сильно влияет как раз на те переменные, для изучения которых и проводится само исследование (в данном случае затраты времени на чтение, просмотр телепрограмм и т.п.)[335]. Значит, ошибки репрезентативности для этих переменных будут (при том же объеме выборки) меньше, чем следовало бы ожидать из основной формулы случайной выборки[336]. В общем виде при

нцип районированной выборки может быть описан следующим образом. Предположим, в объекте исследования выделены L однородных страт и выборка из каждой i-й страты, осуществленная случайным образом, составит ni единиц. Тогда несмещенную оценку среднего значения изучаемого признака х, вычисленную по нашей стратифицированной выборке, можно найти по формуле:

L

х=Z Whxh,

i=1

где Wh — доля i-й страты в совокупности;

5ch — среднее значение изучаемого признака, вычисленное по выборке из данной страты. Соответственно ошибка среднего значения изучаемого признака будет равна:

L

и2 = - Z Wh о\

h=1

Выражение Who2h является не чем иным, как средней из внутригрупповых дисперсий[337].

Эффективность районированной выборки по сравнению со случайной выборкой того же самого объема оценивается отношением ошибки этой выборки к ошибке простой случайной выборки.

2

^              -              Мcmpam

Соотношение этих двух ошибок               2— называется коэффици

ентом эффекта районирования.

КакИбыло отмечено выше |М

2

'cmpam

всегда меньше ц2 за счет дисперсии между стратами, с учетом такого формирования страт, которое уменьшает внутригрупповую дисперсию и увеличивает межгрупповую дисперсию. Очевидно, что стратифицированная выборка будет тем более эффективной, чем меньше будет значение указанного отношения. Связь между ошибкой стратифицированной и чисто случайной выборки для изучаемой переменной может быть описана с помощью соотношения:

2              2              2

2              =0_ (1 — 2 ) 2 =0 0_ 2

Мстрат =              (1 р ) или Mcmpam =              р ,

n              n n

где р — коэффициент корреляции между изучаемым и стратифицирующим признаками.

Первый множитель представляет собой квадрат ошибки случайной выборки, второй характеризует влияние стратификации, точнее, зависимости между стратифицирующим и изучаемым признаками. При приближении р к единице ошибка стратифицированной выборки сильно уменьшается по сравнению с ошибкой чисто случайной выборки. При обратном движении эффект районирования уменьшается[338].

Практики часто преувеличивают эффективность стратификации. Дело в том, что обычно используемые для стратификации признаки не в состоянии обеспечить формирование однородных с точки зрения изучаемых признаков групп. Эффект стратификации бывает особенно невелик, когда идет речь о качественных признаках. Если доля единиц, обладающих определенным признаком, колеблется в отдельных стратах в пределах, скажем, 35-65%, то выигрыш из-за стратификации будет крайне мал. В интервале от 20% до 80% величина дисперсии р(1-р) весьма нечувствительна к сравнительно небольшим изменениям. Иначе дело обстоит в отношении крайних значений р (до 20 и более 80)[339].

При использовании стратифицированной выборки в зависимости от того, как решается вопрос о репрезентативности выделяемых страт, могут возникнуть две ситуации. Чаще всего исследователь, проявляя озабоченность по поводу обеспечения высокой представительности для характеристик генеральной совокупности в целом, не проявляет беспокойства о репрезентативности данных, относящихся к отдельным стратам, выделяемым на стадии проектирования выборки.

Так дело обстоит часто в обследованиях, проводящихся в масштабе страны. Объем выборки в таких обследованиях чаще всего не таков, чтобы обеспечить репрезентативность используемых в качестве страт регионов[340]. Однако в некоторых обследованиях, особенно локальных и монографических, положение иное, и социолог, определяя объем выборки и распределяя ее между стратами, принимает в расчет указанное обстоятельство.

Стратификация выборки осуществляется не только на стадии ее проектирования, но и после сбора информации. К апостериорной стратификации приходится прибегать тогда, когда сведения о стратифицирующем признаке могут быть получены только в ходе опроса; когда исследователь был вынужден опираться на стихийную выборку; когда в ходе сбора информации произошли отклонения от модели выборки[341].

<< | >>
Источник: Шляпентох В.Э.. Проблемы качества социологической информации: достоверность, репрезентативность, прогностический потенциал. — М.: ЦСП. — 664 с.. 2006

Еще по теме Стратифицированная выборка:

  1. 4.2. Применение модели Альтмана при прогнозе корпоративных банкротств
  2. 9.2.3 Персональные ресурсы потребителей
  3. Методы политологии
  4. 9.2.3 Персональные ресурсы потребителей
  5. Тесты к теме
  6. Организация отбора и виды выборочных обследований
  7. Стратифицированная выборка
  8. Одномерная стратифицированная выборка
  9. Многоступенчатая выборка
  10. Размер гнезда и организация выборки
  11. Эффективность квотной выборки и пути ее совершенствования
  12. Академгородок, Москва, первые Всесоюзные выборочные опросы