6.3. Основные способы формирования выборочной совокупности
Рассмотренный в параграфе 6.2 собственно случайный способ формирования выборочной совокупности теоретически наиболее простой, но он предполагает, что в распоряжении исследователя имеется полный перечень единиц.
На практике более широко используется механический отбор, основанный на предварительном упорядочении генеральной совокупности. Например, при проведении выборочных социально-демографических обследований составляются списки жилых помещений, при обследовании предприятий — их регистры и т.д. Устанавливается процент отбора, исходя из которого определяется число отбираемых единиц. Например, при формировании 5-процентной выборки из 1 млн единиц необходимо обследовать 50 тыс., т.е. из каждых 20 единиц одну. Затем определяется начало отбора, т.е. номер первой обследуемой единицы. Каждая следующая единица включается в выборку в соответствии с установленным шагом отбора. В приведенном примере из списка следует отбирать каждую 20-ю единицу.Механический способ отбора часто используется на практике, так как он позволяет проводить оперативную замену одной единицы наблюдения на другую, стоящую в списке непосредственно перед или за единицей, первоначально включенной в выборку. Необходимость замены единиц наблюдения довольно часто возникает в связи с отказом респондентов от участия в обследовании или отсутствием их по соответствующему адресу. Например, при проведении выборочных бюджетных обследований населения в России ротация выборки, обусловленная указанной причиной, ежегодно составляет 15-20%.
Начало отсчета определяется разными способами. Если предварительное упорядочение единиц генеральной совокупности по какому-либо признаку не проводится, а список единиц (или регистр) составляется в порядке их поступления (например, регистр предприятий), то начало отсчета устанавливается в случайном порядке, а каждая следующая единица отбирается из списка через установленный интервал отсчета.
Например, если началом отсчета при 5-процентном отборе является 20-я единица, то следующая — 40-я, затем 60-я и т.д.При механическом отборе из совокупности, упорядоченной по какому-либо признаку, очень важно правильно выбрать начало отсчета. Например, при изучении бюджетов домашних хозяйств списки можно составлять в зависимости от заработной платы работников, поэтому выбор в качестве начала отсчета первой или последней единицы из каждой группы приведет к появлению систематической ошибки выборки. Чтобы этого не происходило, необходимо из каждой группы отобрать единицу, которая находится в ее середине. При проведении выборочных социально-демографических обследований необходимо включить в выборку семьи разного состава. Поэтому из списка жилых помещений недостаточно механически отобрать каждое следующее в соответствии с установленным номером, требуется менять начало отсчета. Это позволяет исключить в выборке возможный перекос в сторону семей того или иного состава.
Если предварительное упорядочение проводится, то теоретически из общей ошибки выборки необходимо выделить ее случайную и систематическую компоненты. Однако практически это невозможно, поскольку в каждой группе обследуется одна единица. Поэтому при механическом отборе используются те же формулы для нахождения ошибки выборки, что и при собственно случайном отборе (табл. 6.5). Формулы средней ошибки выборки при собственно случайном и механическом отборе Оцениваемый
параметр Повторный отбор Бесповторный отбор Средняя -Я И, «1 Доля и>(1 — и>) Ц У п И
* \ п { м) В последние годы более широкое практическое применение получил типический (стратифицированный, расслоенный) отбор,
при котором обследуемая совокупность предварительно разбивается на типически однородные группы и выбор осуществляется из каждой такой группы механическим или собственно случайным способом.
Типический способ отбора используется в нашей стране при проведении выборочных бюджетных обследований домашних хозяйств, изучении потребительских ожиданий населения, при организации выборочных обследований по проблемам занятости, анализе результатов деятельности малых предприятий и их деловой активности.
До 1996 г.
при формировании выборочной совокупности домашних хозяйств для проведения бюджетных обследований применялась типическая выборка с механическим отбором единиц внутри групп. На первом этапе отбора в качестве типических групп использовалась территориально-отраслевая группировка рабочих и служащих, а на втором — группировка по средней месячной оплате труда. В настоящее время при проведении таких обследований применяется более сложная процедура отбора, также основанная на выделении типически однородных групп.При проведении ежеквартальных выборочных обследований малых предприятий используется многомерная типическая выборка, объем которой составляет примерно 20% от общей численности таких предприятий. Расслоение объектов генеральной совокупности по типически однородным группам проводится в соответствии со следующими признаками: территория, отрасль, форма собственности, выручка от реализации продукции (работ, услуг).
Из каждой выделенной группы при проведении типического отбора в выборочную совокупность отбирается определенное число единиц. Обозначим число единиц, попавших в выборку из /-й группы, через я;., а общее число образованных групп через т (/= 1, 2, ..., т). Величину я можно задать одним из трех способов:
п •
отбор из каждой группы равного числа единиц, т.е. я. = —.
т
Использование такого принципа отбора позволяет получить достаточно надежные результаты лишь при равных размерах выделенных типических групп. Если же их численность существенно различается между собой, то использование равномерного отбора может привести к смещению оценок, полученных по результатам выборочного обследования; •
отбор единиц пропорционально их численности в соответст-
N.
вующих группах генеральной совокупности, т.е. я(. = я-где
ТУ. — число единиц в /-й типической группе генеральной совокупности. Использование этого принципа формирования выборочной совокупности обеспечивает достаточно надежные результаты, если колеблемость признака несущественно различается в разных группах генеральной совокупности.
Если же коэффициенты вариации в них различаются существенно, то репрезентативность выборки при таком способе ее формирования может оказаться невысокой; •оптимальное размещение, учитывающее не только численность групп, но и степень вариации в них изучаемого признака,
N.<3.
т.е. я. = я=гтН—. где а. — среднее квадратическое отклоне-
ние признака в г'-й группе генеральной совокупности. Данная формула получена следующим образом:
N. а. N.0.
п, = = "у >; —? (6-8)
где УТУ. = N, а д~ = ,г—— средняя из групповых сред-
?ЛГ,
них квадратических отклонений.
Оптимальное размещение позволяет минимизировать среднюю ошибку выборки. Впервые ответ на вопрос о наиболее эффективной организации типической (расслоенной) выборки был получен в 1920 г. A.A. Чупровым и независимо от него в 1934 г. Е. Нейманом. В статистике такое размещение называется также неймановым. Хотя оно позволяет получить более точные результаты, на практике осуществить его сложно, поскольку необходимо знать вариацию признака в генеральной совокупности еще до проведения обследования.
В статистической практике нашей страны пропорциональный способ отбора используется при формировании выборочной совокупности для проведения наблюдения за деловой активностью малых предприятий в промышленности.
Для ежеквартального наблюдения за основными экономическими показателями, характеризующими деятельность малых предприятий, выборка строится с использованием принципа оптимального размещения.
Опыт практического применения принципа оптимального размещения показал, что использование в качестве показателя вариации в формуле (6.8) среднего квадратического отклонения по /-й типической группе генеральной совокупности (ajr) позволяет обеспечить оптимальное размещение единиц выборочной совокупности по типическим группам лишь в том случае, если нет существенных различий в значениях коэффициентов вариации по этим группам. При проведении выборочного обследования всех предприятий региона, а не только малых, высокое значение среднего квадратического отклонения может иметь место при низком значении коэффициента вариации (например, на крупных предприятиях) и наоборот.
В результате крайне неоднородные группы объектов, например малые предприятия, будут недостаточно представлены в выборке. В таком случае в формуле (6.8) целесообразно использовать не среднее квадратическое отклонение, а коэффициент вариации.Общая дисперсия изучаемого признака, согласно правилу сложения дисперсий, может быть представлена как сумма о2 = ст2 + 52,
2 с-2
где о; — средняя из групповых дисперсии, а о — межгрупповая дисперсия. При проведении типического отбора межгрупповая дисперсия не носит характера случайной вариации, так как группы образованы еще до начала выборочного обследования. Следовательно, при нахождении ошибки выборки необходимо из двух указанных слагаемых общей дисперсии учесть лишь то, которое связано со случайной вариацией, а именно среднюю из групповых дисперсий в выборке G2 . При отборе пропорционально численности групп средняя из
„ — 2>?и
групповых дисперсии о,- = — = — . В этом случае сред-
2*1 ; 2-1 ^ I
няя ошибка выборки при бесповторном отборе: для средней И =
а?
1--^
N для доли 1
и'Д! - И?,.)
где и». — доля единиц совокупности, обладающих изучаемым признаком в /-й типической группе;
IV.(1 — и*.) - средняя из групповых дисперсий для доли.
В табл. 6.6 представлены формулы для исчисления средней ошибки выборки при типическом отборе.
Таблица 6.6
Формулы средней ошибки выборки при типическом отборе Оцени
ваемый
параметр Повторный отбор Бесповторный отбор Пропорциональное распределение единиц выборочной совокупности по группам Средняя 1 п ( \ °/11 " 1
ц А Доля / \ N
\ Оптимальное распределение единиц выборочной совокупности по группам Средняя и 1 И"'2 1 I °'ЛГ' ( \ К ' У д *Г "1 Доля 1 1,и>,(1-»,)ЛГ,2 1 и Н-Д1 - ( л,. ^ п‘ 1 ^ Разновидностью типической является районированная выборка, при которой отбор единиц для наблюдения проводится из групп, представленных административно-территориальными образованиями. В этом случае преимущества типической выборки проявляются лишь при заметном расхождении среднего значения изучаемого признака по отдельным регионам.
Применение типического отбора позволяет уменьшить среднюю ошибку выборки, но его преимущества проявляются только при условии, что различия в средних значениях изучаемого признака между группами достаточно ощутимы, а вариация признака внутри каждой группы невелика.
Если при построении типической выборки предполагается получить значение нескольких показателей, то расслоение проводится, как правило, не по наблюдаемым, а по вспомогательному признаку. При этом вспомогательный признак должен коррелировать с наблюдаемыми.
Например, численность домашних хозяйств определенного типа (одиночки; семьи, состоящие из двоих взрослых; семьи с разным числом детей) коррелирует с показателями доходов и расходов.Пример. Для изучения объема и структуры доходов работников городских торговых предприятий, относящихся к разным формам собственности, проведен 2-процентный бесповторный типический отбор, результаты которого по одному из обследованных показателей приведены в табл. 6.7.
Таблица 6.7 Форма
собственности Числен
ность
занятых,
чел. Обсле
довано
человек Доход от участия в собственности предприятия на одного работника в год, тыс. руб. и/ средний
Х1 среднее квадратическое отклонение Государственная 5000 100 270 90 Негосударственная 25000 500 880 260 Всего 30000 600 В данном случае отбор проведен пропорционально численности работников, занятых на предприятиях каждой выделенной группы. Для того чтобы найти пределы, в которых указанный вид дохода работников торговли находится в генеральной совокупности, зададим доверительную вероятность Р = 0,95. Следовательно, коэффициент доверия { = 1,96 (см. Приложение 2).
В выборочной совокупности средняя сумма дохода от участия в собственности предприятия
Щл = 270-100 + 880.500 _
2>, 100 + 500
Для нахождения средней ошибки выборки необходимо знать среднюю из групповых дисперсий:
-г,Ш_ 90400 + 260*-500
?л. 100 + 500
Предельная ошибка выборки о.
'.-л'
V У
57683
= !,96Л/ 60() (1 - 0,02) г 19,0 тыс. руб. Следовательно, с вероятностью 0,95 можно сделать вывод о том, что среди торговых работников города средний годовой доход от участия в собственности предприятия находится в пределах
х — А < х < х 4- Д,
т.е.
778,3 - 19,0 < х < 778,3 + 19,0,
или 759,3
тыс. руб. < х < 797,3 тыс. руб.
Для того чтобы на основе приведенных данных сформировать выборочную совокупность с учетом не только численности выделенных групп в генеральной совокупности, но и степени вариации в них изучаемого признака, надо исходить из предположения, что групповые дисперсии в выборочной и генеральной совокупности равны, т.е. а2г ^ о2. Общий объем выборки п = 600 чел. с учетом степени вариации признака по формам собственности должен быть распределен следующим образом:
ЛГ,а, ^пп 5000-90 п. = п~ъ—1—— = 600 = 39 чел. 1
2 5000-90 + 25000-260 I
ЛЛа,
;=1
N2^2 ,пп 25000-260 И, = ПА = 600 — = 561 чел. 2
Д 5000-90 + 25000-260 lNiai
/=1 Таким образом, при оптимальном размещении необходимо обследовать 39 работников государственных торговых предприятий и 561 — негосударственных. В этом случае средняя ошибка выборки
5000 +
= 9,4 тыс. руб.
При Р= 0,95 предельная ошибка выборки равна 18,4 тыс. руб., т.е. немного меньше, чем при пропорциональном отборе.
Серийный (гнездовой) отбор применяется в том случае, если генеральная совокупность разбита на группы еще до начала выборочного обследования. При проведении выборки исследователь может из генеральной совокупности отбирать не отдельные единицы, а целые их серии и обследовать в рамках каждой серии все попавшие в нее единицы. Такой способ отбора широко применяется при контроле качества продукции, когда для проведения наблюдения вскрывается упаковка, содержащая определенное количество изделий, и все они проверяются. Если бы в этом случае из каждой упаковки обследовалась лишь одна единица, потребовалось бы повторно упаковывать всю партию товара, что привело бы к дополнительному увеличению затрат, связанных с обследованием.
Исследователь отбирает из генеральной совокупности в случайном порядке более крупные единицы (серии), поэтому возникновение случайной ошибки связано с отклонением серийных средних от общей средней. Поскольку внутри отобранных серий обследуются все единицы, то вариация признака в рамках каждой серии носит характер не случайной, а систематической составляющей и, следовательно, не должна учитываться при расчете средней ошибки выборки. Таким образом, в формуле средней ошибки выборки вместо общей дисперсии необходимо использовать меж- серийную дисперсию.
Обозначим число серий в генеральной совокупности через 5, а в выборке — через 5.
Межсерийная дисперсия при равновеликих сериях 5^ рассчитывается по формуле ?К-*)2
где X.
5
среднее значение признака в г-и серии;
При бесповторном серийном отборе средняя ошибка выборки
/=1
Если число серий в генеральной совокупности велико, то вместо (?- 1) в последней формуле можно использовать величину 5. В знаменателе первой дроби величина 5 берется лишь при большом объеме выборки (5 > 30). Если число отобранных серий невелико, вместо 5 должна быть величина (5 — 1).
При нахождении межсерийной дисперсии для доли необходимо учесть, что среднее значение альтернативного признака равно р, т.е. доле единиц, обладающих этим признаком. Соответственно, оно будет равно й7 в выборке и и^. в каждой отобранной серии. В таком случае межсерийная дисперсия для доли
я
5
При равновеликих сериях м/ = .
При серийном отборе средняя ошибка выборки рассчитывается по формулам, приведенным в табл. 6.8.
При рассмотренных способах формирования выборочной совокупности отбор единиц для наблюдения осуществляется уже на первом этапе. Такой отбор называется одноступенчатым. Однако на практике часто используется многоступенчатый отбор, при котором на первом этапе из совокупности отбираются укрупненные единицы (серии), а затем без проведения наблюдения за всеми единицами в рамках серии осуществляется собственно случайный или механический отбор единиц из каждой отобранной серии. Формулы средней ошибки выборки при серийном отборе Оцениваемый
параметр Повторный отбор* Бесповторный отбор [зГ 181 я-* Средняя Н;*-1 |з2 Доля ^ = V— ^ = 7Г—7 \ 5 \ 5 5- 1 * При серийной выборке повторный отбор практически не применим, поэтому в основном используются формулы ошибок для бесповторного отбора.
Ошибка выборки при двухступенчатом отборе складывается из ошибок, возникающих на каждой ступени. В данном случае п
Ж
И =
* /
(6.9)
где а2 - средняя из серийных дисперсий; —
общее число единиц совокупности в отобранных сериях.
По схеме двухступенчатой выборки организовано обследование населения по проблемам занятости, а также выборочные бюджетные обследования. На основе ежеквартальных выборочных бюджетных обследований населения изучаются источники средств существования разных категорий домашних хозяйств, структура их расходов, объем потребления продуктов питания, наличие домашнего имущества, обеспеченность жильем. В настоящее время такие обследования ориентированы в основном на сбор информации о расходах и объеме личного потребления населения. На основе полученных таким образом данных рассчитываются весовые коэффициенты, необходимые для исчисления сводного индекса потребительских цен.
Выборка строится по территориальному принципу с учетом необходимости представительства в ней разных типов домашних хозяйств. Базой для таких обследований служат материалы переписи населения. На первой ступени единицей отбора в рамках каждой территории является счетный участок переписи населения. На второй ступени на каждом отобранном участке отбирается 25 (30) домохозяйств, имеющих разные социально-экономические характеристики. В качестве группировочных признаков используются такие показатели, как размер домашнего хозяйства, принадлежность и тип жилого помещения, источники средств существования, возраст, пол и уровень образования обследованных лиц. В настоящее время выборочными обследованиями охвачено 49,2 тыс. домашних хозяйств всех субъектов Российской Федерации.
Эта выборочная совокупность служит также основой для проведения ежеквартальных выборочных обследований потребительских ожиданий населения. Такие обследования направлены на изучение мнения населения об общей экономической ситуации в стране и личном материальном положении, а также о ситуации на рынке товаров и услуг. Объем выборки при проведении обследований потребительских ожиданий составляет 5 тыс. человек в возрасте 16 лет и старше.
Аналогичным образом формируется выборочная совокупность домашних хозяйств для проведения обследований по проблемам занятости населения. Такие обследования проводятся в России с 1992 г. в целях получения информации о численности и составе экономически активного населения, занятых и безработных. В настоящее время выборочные обследования по проблемам занятости проводятся ежеквартально. Единицей наблюдения являются лица в возрасте от 15 до 72 лет, входящие в состав отобранных домохозяйств. Ежеквартальный объем выборки составляет около 63,8 тыс. человек (31 тыс. домашних хозяйств), а годовой ее объем — 255 тыс. человек.
При построении многоступенчатой выборки используется комбинация разных способов отбора, поэтому такой способ отбора иногда называют комбинированной выборкой.
От многоступенчатого следует отличать многофазный отбор, при котором из единиц совокупности, отобранных на первом этапе, осуществляется подвыборка в целях изучения дополнительных характеристик обследуемой совокупности. При многофазном отборе единица отбора на каждом этапе одна и та же, а при многоступенчатом она меняется: на первой ступени отбираются единицы более высокого порядка (например, серии), чем на второй. Многофазная выборка используется для расширения программы обследования. На второй фазе целесообразно изучать такие признаки, которые обладают меньшей вариацией в генеральной совокупности. Это позволяет сэкономить средства, необходимые для выборочного обследования. Отметим, что на каждой фазе многофазных выборок рассчитывается особое значение ошибки выборки.
Взаимопроникающие выборки — форма выборочного обследования, при которой из одной генеральной совокупности одним и тем же способом формируются две (или более) выборочные совокупности. При этом происходит взаимное уточнение результатов обследования.
Выборочные обследования широко применяются в отечественной статистической практике. Этот метод используется, например, при организации специальных статистических обследований, изучении общественного мнения и т.д.
Еще по теме 6.3. Основные способы формирования выборочной совокупности:
- 5.3.5. Вербовка и формирование предварительной выборочной совокупности кандидатов
- 1.2. ОСНОВНЫЕ СПОСОБЫ ВЫХОДА ФИРМЫ НА ВНЕШНИЙ РЫНОК И СТРАТЕГИИ МЕЖДУНАРОДНОГО МАРКЕТИНГА
- 6.2.3 Тестирование продукта
- 5.5. Методология и практика выборочного наблюдения Этапы наблюдения
- 7.1. ПОНЯТИЕ О ВЫБОРОЧНОМ НАБЛЮДЕНИИ
- 6.1. Общая характеристика выборочного наблюдения
- 6.3. Основные способы формирования выборочной совокупности
- 3. Классификация способов формирования верхних палат
- Глава 11 ОСНОВНЫЕ ФАКТОРЫ ФОРМИРОВАНИЯ ОБРАЗА СТРАНЫ
- § 2. Основные способы и приемы формирования содержания нормативных актов
- 5.3.5. Вербовка и формирование предварительной выборочной совокупности кандидатов
- 6.2.3 Тестирование продукта
- 1.2. ОСНОВНЫЕ СПОСОБЫ ВЫХОДА ФИРМЫ НА ВНЕШНИЙ РЫНОК И СТРАТЕГИИ МЕЖДУНАРОДНОГО МАРКЕТИНГА
- Коммуникативно-стилистические способы формирования общественного мнения в СМИ