Размер гнезда и организация выборки
При применении многоступенчатого отбора возникает чрезвычайно важная проблема учета размера гнезда. Социологическая практика, как правило, оперирует неравными гнездами, так как они в их естественном виде чаще всего как раз и являются таковыми.
Использование неравных гнезд приводит к усложнению статистического анализа, так как в этих условиях ошибки выборки попадают в зависимость не только от колебаний изучаемого признака, но и от разброса величины гнезд.
Размер гнезда является одной из важнейших проблем многоступенчатой выборки по двум причинам. Во-первых, в условиях дифференциации гнезд по размерам необходимо предпринимать специальные операции для сохранения принципов случайной вы- борки[405]. Принцип равенства шансов нарушается в тех случаях, когда из не одинаковых по размеру гнезд делается выборка равного объема. Во-вторых, вопрос о размере гнезда имеет первостепенное значение для организации сбора информации, в частности, для определения величины необходимых затрат на исследование. Рассмотрим вначале первый аспект проблемы.
Для обеспечения равенства шансов всем единицам совокупности попасть в выборку независимо от размера гнезда можно использовать прием, предполагающий составление списка гнезд с указанием объема каждого гнезда, а также числа всех единиц генеральной совокупности нарастающим итогом. Определив интервал отбора единиц совокупности, исследователь получает возможность выделить гнезда для выборки, причем так, что крупные гнезда (например, предприятия) будут иметь больше шансов попасть в выборку, чем мелкие. Благодаря этому обстоятельству все единицы совокупности (например, рабочие) независимо от того, являются ли они работниками крупных или мелких предприятий, получают одинаковые шансы оказаться в поле зрения исследователя. Именно этот путь избран авторами методики многоступенчатого районированного отбора, применяемого в выборочных обследованиях ЦСУ СССР.
Как правило, на первой ступени составляются отраслевые списки предприятий и учреждений, обычно в масштабе области или республики. В пределах каждого отраслевого списка предприятия или учреждения располагаются в виде ранжированного ряда в соответствии с одним из избранных критериев (например, средней заработной платой или средней денежной оценкой человеко-дня работы).
В стратифицированном подобным образом списке по каждому предприятию или учреждению указывается численность его ра
ботников, а также общая численность работников нарастающим итогом (см. табл. 3, пример условный).
Таблица 3
Структура страт после стратификации работников предприятия
Номер предприятия по порядку | Средняя месячная заработная плата рабочих, руб. | Среднесписочная численность рабочих | Число рабочих нарастающим итогом |
1 | 160 | 500 | 500 |
2 | 154 | 100 | 600 |
3 | 152 | 1100 | 1700 |
4 | 148 | 300 | 2000 |
5 | 132 | 2000 | 4000 |
6 | 127 | 500 | 4500 |
/>7 | 119 | 200 | 4700 |
8 | 118 | 300 | 5000 |
9 | 110 | 1000 | 6000 |
10 | 109 | 400 | 6400 |
Обычно принято считать, что на каждом предприятии следует изучать 20-25 человек (или семей).
После того как определяется общий объем выборки, можно установить число предприятий, отбираемых на первой ступени в качестве гнезд. Если, например, объем выборки для приведенного выше примера составил 100 человек, а объем выборки из гнезда принят равным 20, то число указанных гнезд составит 5. Затем определяется интервал отбора путем деления общего числа всех работников на число предприятий, включаемых в выборку. В нашем примере этот интервалбудет равен: 6400 = 1280 . Далее, используя значение размера интервала, выделяются предприятия, где будет происходить отбор самих работников.
В описываемом примере работник под № 1280 (исходя из численности работников нарастающим итогом) находится на предприятии № 3, работник под № 2560-на предприятии № 5, работник под № 3840 находится также в этом предприятии и т.д. На этих предприятиях и необходимо проводить обследование[406].
Очевидно, что на предприятии № 5 следует отобрать для выборки не 20, а 40 работников.
Для отбора работников по каждому предприятию, попавшему в выборку, вновь составляются списки, где работники стратифицируются по одному из критериев (например, по квалификации, уровню доходов и т.д.). Из этих списков отбор производится механическим путем.
Можно использовать несколько другую технику отбора. Она предполагает, что наименьшее по размеру гнездо берется за единицу и все остальные гнезда характеризуются числом соответствующих единиц. В нашем примере за единицу измерения естественно принять предприятие с числом рабочих, равным 100. Тогда данные о предприятиях примут следующий вид:
|
|
|
| Номера предприятий |
|
|
| |||
| 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
Размер в принятых единицах измерения | 5 | 1 | 11 | 3 | 20 | 5 | 2 | 3 | 10 | 4 |
Размер нарастающим итогом | 5 | 6 | 17 | 20 | 40 | 45 | 47 | 50 | 60 | 64 |
Теперь с помощью таблицы случайных чисел выберем несколько двузначных чисел (в зависимости от числа гнезд, включаемых в выборку).
Пусть из таблицы оказались извлеченными 25 и 54. Первое число означает, что в выборку попадает предприятие № 5, и второе — № 9. Очевидно, что чем больше интервал в третьем ряду между соседними предприятиями (а этот интервал пропорционален размеру гнезда, находящемуся в каждой паре справа), тем вероятнее, что в выборку попадет то предприятие, размер которого характеризует интервал. Известны модификации этой техники отбора, в частности, разработанные Д. Лахири[407].При проектировании многоступенчатого исследования его организатор обладает значительной свободой действий в определении того, какими гнездами он намерен оперировать — крупными
или мелкими; отбирать большое число гнезд с небольшой нормой отбора из каждого гнезда или же ориентироваться на включение в выборку небольшого числа гнезд с высокой нормой отбора.
Рассмотрим первый аспект проблемы. Крупные гнезда, как отмечалось выше, имеют более высокую дисперсию v потому, при прочих равных условиях, имеют преимущества над мелкими. К тому же использование крупных гнезд сопровождается меньшими транспортными расходами и затратами времени, чем выделение мелких гнезд. Однако применение крупных гнезд требует чаще всего выделения внутри гнезд новых стадий отбора, что усложняет проведение исследования и увеличивает общую ошибку выборки за счет ошибок, возникающих на новых ступенях. Еще более важным является то обстоятельство, что мелкие гнезда можно разместить на более обширной территории и учесть в большой мере специфику различных регионов.
Организатору исследования приходится на основе конкретной информации взвешивать все приведенные плюсы и минусы и принимать решение, пользуясь чаще всего эвристическими соображениями. В лучшем положении он находится при решении второй задачи — определить число гнезд и норму отбора из каждого гнезда[408]. Очевидно, что поиск оптимального соотношения числа гнезд и объема выборки из гнезда приобретает особый смысл, если отказаться от закрепления объема выборки и ориентироваться на минимизацию затрат.
Решающее значение приобретают величины, характеризующие затраты, связанные с привлечением гнезд (обозначим их через Ci), и затраты на изучение одной «конечной» единицы исследования (С2). Общая сумма затрат на обследование при двухступенчатом отборе составит: C = C1r + C2rm.
Изберем в качестве критерия произведение общих затрат на величину ошибки. Это означает, что исследователь может уменьшать эту величину как за счет экономии затрат, так и за счет уменьшения величины ошибки. С учетом приведенной выше формулы ошибки в двухступенчатом обследовании получаем:
Доказано, что это выражение принимает минимальное значение при:
alt="" />
Пусть при исследовании затрат времени на просмотр телепрограмм ов =15 минут, aM =10 минут, 0i=400 рублей, С2 =2 рубля, тогда:
Это означает, что наиболее целесообразным является гнездо объемом 21 человек[409].
Эффективное использование многоступенчатой гнездовой районированной выборки — самой распространенной разновидности выборочного обследования в социологии — требует решения множества проблем. Огромное влияние оказывают цели исследования, выделяемые ресурсы, сроки представления результатов. Нужны еще немалые усилия для того, чтобы при проектировании выборки все аспекты этого вида выборки максимально учитывались.
Еще по теме Размер гнезда и организация выборки:
- 9.2.3 Персональные ресурсы потребителей
- 7.4. РАЗЛИЧНЫЕ ВИДЫ ВЫБОРОЧНОГО НАБЛЮДЕНИЯ
- 9.2.3 Персональные ресурсы потребителей
- ЧАЙЛД, Джон (1940) Child, John
- Многоступенчатая выборка
- Многоступенчатый отбор и гнездо
- Размер гнезда и организация выборки
- Принципы организации территориальной выборки
- ГРАФИК