<<
>>

Задачи, решаемые с помощью многофазной выборки

Многофазная выборка служит важным средством решения ряда исследовательских задач. Эти задачи могут быть разделены на четыре группы. Рассмотрим каждую из этих групп.

К первой мы отнесем задачи по выявлению устойчивости информации, получаемой от респондентов.

Очевидно, что для этого необходимо использование панельных обследований с небольшим интервалом времени между фазами.

Вторую группу образуют задачи, связанные с удешевлением обследований благодаря использованию вспомогательной информации. Для этого необходимы такие обследования, в которых на второй фазе осуществляется выборка небольшого объема из выборки первой фазы. При этом необходимо, чтобы получение информации о единице исследования в первой фазе было дешевле,

чем во второй. Именно из-за этого социолог, преследуя определенные цели, считает более экономичным комбинировать данные обеих фаз вместо того, чтобы расширить объем выборки на второй фазе до уровня первой фазы[534].

Одна из задач второй группы связана с получением информации о «весе» страт на первой фазе для ее использования при обработке результатов второй фазы. Решение второй задачи предполагает уточнение характеристик, получаемых на второй фазе. Пусть на первой фазе (объем выборки n1) изучался признак со средней х1, а на второй фазе (объем выборки n2) — тот же признак со средней х2, и новый признак со средней у2 . Задача состоит в том, чтобы улучшить оценку второго признака на основе информации о зависимости между обоими признаками, которая получена на второй фазе, и сведений, добытых на первой фазе, когда объем выборки был существенно большим. Улучшенная оценка второго признака может быть получена разными способами и, в частности, с помощью уравнения регрессии:

У = У2 + b(*i - х2),

где

b X (У2 - 3/2 )(х2 - Х2 )

X (х2 - Х2 )2

Средняя ошибка для у может быть вычислена следующим образом:


где р — коэффициент корреляции между признаками во второй

фазе271.

Пусть, например, имеются условные данные о числе выписываемых газет и журналов, полученные в двух фазах выборочного обследования (на каждом предприятии число респондентов было одинаковым):

Номер предприятия

Количество выписываемых:

Газет

Журналов

первая фаза

вторая фаза

вторая фаза

1

2

3

4

2

3

-

-

3

4

2

2

4

1

-

-

5

2

2

3

6

0

-

-

/>7

1

2

5

8

1

-

-

9

4

6

6

10

2

-

-

8

Определим средние:              =              2              ;              %2 = 3; у2 = 4 ; 6 = — . Следовательно,

улучшенная оценка числа выписываемых журналов составит:

у = 4 +12(2 - 3)« 3,3 .

Определим теперь ошибку полученного показателя. Она составит ц2 = 0,5 или ц«±0,7 . Следовательно, истинный показатель, характеризующий число выписываемых журналов, находится в интервале: (3,3-0,7) lt; у lt; (3,3+0,7).

Особая ситуация возникает, если коэффициент общности на второй фазе меньше 1, и, следовательно, на обеих фазах имеются единицы, изученные только в одной фазе.

Обозначим через x' и у' средние, относящиеся к той части выборок, которая изучалась в обеих фазах, x" — средняя для единиц, изучавшихся только в первой фазе, а у" — только во второй фазе. Тогда оценка средней для второй фазы с учетом информации, полученной на первой фазе, составит:

Xup (x" - x')+ \y' + u (s - p2u ) у"

где p — коэффициент корреляции между x' и г/', т.е. между характеристиками единиц, изучавшихся в обеих фазах, X — доля общей части обеих выборок в объеме первой выборки, u = 1-А, [535].

Третья группа задач связана с изучением социальных процессов. Для этих задач необходимы многофазные обследования с длительным интервалом времени между фазами[536]. Задачи этой группы существенно отличаются друг от друга в зависимости от общности объектов исследования и степени соблюдения принципа равенства шансов единиц первой фазы попасть в выборку последующих фаз. Если речь идет о панельном обследовании типа «выборка из выборки», тогда оказывается возможным, используя различный математический аппарат, проанализировать, какие изменения произошли с генеральной совокупностью в период между первой и второй фазами. Если же на второй и последующих фазах не удалось реализовать случайный отбор из выборки первой фазы, тогда указанная выше задача может решаться с чрезвычайно большими оговорками с помощью индексного метода[537].

Применение повторной выборки позволяет, в отличие от панельного обследования, выявить изменение структуры генеральной совокупности. Однако для того, чтобы выяснить «чистое» изменение отдельных признаков и элиминировать влияние структурных сдвигов, следует вновь прибегнуть к индексному методу, используя на этот раз не веса базисного периода, а веса отчетного периода[538].

Наконец, к четвертой группе относятся задачи, решаемые с помощью пробных обследований. Эти задачи чаще всего связаны с вопросами методического характера[539].

По сути, пробные обследования часто представляют собой методические эксперименты.

Автор не согласен с теми социологами, которые отрицают причастность проблемы репрезентативности к пробному обследованию. Конечно, добиваться того, чтобы результаты пробного и основного обследования не отличались друг от друга по качеству, — чаще всего нереалистическое требование. Однако вместе с тем нельзя упускать из виду того, что использование результатов пробного обследования для любых целей вряд ли может быть эффективным, если вопрос об их репрезентативности не получит какого-либо решения.

Один из путей решения этого вопроса предполагает обеспечение репрезентативности пробного обследования только по одному параметру, сильно влияющему на отношение респондентов к опросу, на понимание вопросов анкеты и т.д. Мы имеем в виду прежде всего уровень образования.

В некоторых ситуациях можно ориентироваться (там, где это возможно) на изучение групп, состоящих из максимально однородных единиц исходной совокупности. Такая стратегия пробного обследования позволяет за счет контроля важных переменных резко сократить величину дисперсии, существенно повысить репрезентативность результатов, необходимых и для оценки материалов методических экспериментов и для последующего сравнения с итогами основного обследования.

Вопрос о том, какие признаки должны быть избраны для формирования однородных групп, не является простым. В ряде случаев этот вопрос приходится решать на основе уже накопленной информации о связях между признаками. Видимо, наиболее удачным является такой критерий однородности, который тесно коррелирован с рядом других признаков.

<< | >>
Источник: Шляпентох В.Э.. Проблемы качества социологической информации: достоверность, репрезентативность, прогностический потенциал. — М.: ЦСП. — 664 с.. 2006

Еще по теме Задачи, решаемые с помощью многофазной выборки:

  1. Задачи, решаемые с помощью многофазной выборки