<<
>>

§ 3. ВЫБОРОЧНЫЙ МЕТОД В СОЦИОЛОГИИ

Комплекс вопросов о выборке — одна из тех проблем социологии, в которой теоретико-методологические представления об их содержании находятся в явном, очевидном противоречии с реальной практикой их решения.

Социологи-предметники всегда видели это противоречие, но предпочитали его не обсуждать, опрометчиво поместив его в разряд так называемых «математических проблем социологии». И вот уже в течение многих десятилетий они терпеливо ожидают от математиков его взаимоприемлемого разрешения.

Однако наличие этого противоречия уже открыто признают и сами профессиональные математики, столкнувшиеся с необычайными, непреодолимыми препятствиями, которые всегда неизбежно возникали при попытках совмещения обеих сторон названной проблемы. Можно, например, встретить такое высказывание: «Поскольку процедура расчета выборки — это цепь бесконечных компромиссов между стремлением к точности результатов и ограниченностью ресурсов, дефицитом времени и неполнотой сведений об изучаемом явлении, поэтому в целом можно сказать, что процедура расчета выборки — это наука и искусство...»[13].

Названное противоречие между характером требований к мето- дико-инструментальному аппарату проектирования и реализации выборки, определяемому статистическими представлениями о ней, с одной стороны, и формами, в которых она реализуется практически, с другой — это лишь одно из множества проявлений общего противоречия, которое было заложено в социологию ее основателями и с которым мы сталкиваемся по сию пору. Это противоречие порождено стремлением социологии во всем уподобиться наукам природе на пути всемерного внедрения формально-логических, рациональных методов и процедур в свой теоретико-методологический и методико-инструментальный аппарат, якобы способствующих завоеванию ею статуса «подлинной» науки, и необычайной сложностью, неподатливостью социальной жизни, ее яростным сопротивлением при попытках втиснуть ее отображение в рациональные, однозначно строгие формальные конструкции.

Принимая это во внимание, рассмотрим суть вопроса.

Объект любого социологического исследования может быть представлен как определенная совокупность (множество) единиц наблюдения. Например, при опросах в подавляющем большинстве случаев единицами наблюдения являются люди — каждый человек в отдельности. Та часть населения, которая обладает юридическим правом голоса на выборах, представляет собой объект исследования для тех, кто изучает политические процессы и электоральное поведение населения. Для социолога, изучающего социальную структуру общества, в качестве объекта исследования выступает все взрослое население страны и т.д.

Известно, что достоверность получаемого знания определяется прежде всего высоким качеством исходной эмпирической фактуры, послужившей основой для формулирования итоговых содержательных результатов. В свою очередь, качество первичных данных самым непосредственным образом зависит от того, насколько полно в них представлены реальные значения характеристик каждой единицы множества, образующего объект исследования. Поэтому совершенно естественно стремление многих социологов (в особенности, начинающих) охватить все множество единиц наблюдения или максимально большее их количество, т.е. всех потенциальных избирателей, всех граждан и т.д. В соответствии с этой точкой зрения, идеальным представляется исследование, предполагающее сплошной охват всего множества единиц наблюдения.

Примером исследований, основывающихся на сплошном изучении всего множества единиц, образующих объект исследования, могут служить материалы текущего наблюдения ряда показателей, которые осуществляет Государственный комитет статистики. К ним, в частности, относятся рождаемость, смертность, число браков, разводов, пассажирооборот и т.д., все они предполагают сплошной учет соответствующих фактов. Сплошные исследования проводятся и социологами. Часто они используются при подготовке широкомасштабных перспективных решений по развитию предприятия или организации, проведении монографических исследований.

Сплошные опросы проводятся при изучении причин текучести кадров (опрашиваются все увольняющиеся с предприятия и вновь принимаемые). Можно привести и ставшие уже хрестоматийными примеры крупных территориальных сплошных социологических исследований. К ним, в частности, относится исследование профессиональных ориентаций молодежи

Новосибирской области, которое проводилось под руководством

В.Н. Шубкина в 1962—1970 гг. и основывалось на сплошных опросах всех выпускников всех школ Новосибирской области[14].

При всей внешней очевидности достоинств сплошных исследований в подавляющем большинстве случаев социолог вынужден решать проблему ограничения числа единиц наблюдения, которые включаются в эмпирическую базу исследования. Дело в том, что в тех случаях, когда объект состоит из нескольких тысяч и более единиц наблюдения, сплошное исследование требует:

^ огромных финансовых и материально-технических ресурсов; ^ создания громоздкого организационного механизма;

^ привлечения большого количества дополнительных сотрудников, как правило, неквалифицированных (для проведения интервью, анкетирования, наблюдения и т.д.);

^ длительного времени, необходимого для сбора, контроля, обработки и анализа собранного эмпирического материала.

Поэтому преобладающим видом исследований в социологии являются выборочные. Помимо дешевизны, оперативности, гибкости выборочные исследования обладают еще одним существенным достоинством: при тщательном соблюдении определенных правил и процедур они могут обеспечить получение более достоверных и глубоких результатов, чем сплошные. Связано это прежде всего с тем, что провести тотальный контроль качества фиксации первичной эмпирии невозможно. В то же время привлекаемый непрофессиональный актив вольно или невольно привносит в полевые материалы множество так называемого «информационного шума», полное выявление и устранение которого принципиально невозможно. При выборочном исследовании практически всегда можно гарантировать приемлемую достоверность эмпирической фактуры.

Однако при проведении выборочных исследований возникает другая, достаточно серьезная проблема — необходимость обеспечения репрезентативности первичных данных.

Под репрезентативностью информации понимается такое ее свойство, при котором обеспечивается приемлемый (допустимый, заданный) уровень отклонения количественных значений наиболее важных характеристик (критериев) некоторой части множества изучаемых объектов (выборочной совокупности) от их значений во всей совокупности (генеральной). Максимальная величина названного отклонения по какой-либо из критериальных характеристик образует ошибку репрезентации. Выборочная совокупность, ошибка репрезентации которой не превышает некоторой заданной величины (в социологии этот уровень принято определять в 5%), называется репрезентативной. Репрезентативность первичной социологической фактуры позволяет исследователю распространять на всю генеральную совокупность выводы и закономерности, обнаруженные в выборочной совокупности.

Выборочную совокупность можно в определенном смысле рассматривать как своеобразную модель, воспроизводящую в миниатюре генеральную совокупность. Однако никогда нельзя забывать, что это достаточно сильное упрощение, идеализация, так как выборка воспроизводит генеральную совокупность только по значениям критериальных характеристик. Значения остальных характеристик выборки могут довольно сильно отличаться от их значений в генеральной совокупности.

На репрезентативность выборки определяющее влияние оказывает высокое качество всех этапов и процедур ее реализации, в особенности — обоснование и расчет ее структуры и объема. Решение этой задачи называется проектированием выборки.

При проектировании выборки отчетливо усматриваются по крайней мере два взаимосвязанных аспекта: качественный и количественный. Качественный аспект формулируется как поиск системы признаков, моделирующих сущностное содержание и специфику исследуемого явления. Количественный аспект указывает на необходимость разработки определенных правил отбора оптимального объема единиц наблюдения.

Многие социологи, особенно начинающие, сводят проблему выборки лишь ко второму аспекту, т.е. решают ее в плане отбора единиц наблюдения. Неявно предполагается, что социология, как и статистика, имеет дело с большими совокупностями более или менее однотипных объектов, методы обобщенного описания которых давно и тщательно разработаны. За аксиому принимается случайный характер социологической эмпирической фактуры, для анализа и преобразования которой математическая статистика предлагает арсенал готовых, хорошо разработанных методов[15].

То есть теория выборки в социологии традиционно трактуется в своей классической (читай — статистической) постановке, а сама процедура выборки рассматривается как чисто математическая задача.

Такой статистический в своей основе подход к расчету выборки вполне правомерен, но он в каждом конкретном случае требует тщательного обоснования, так как множественность каких-либо фактов отнюдь не обязательно с неизбежностью имеет статистическую природу. Социальные процессы, с которыми имеет дело социолог, в еще меньшей степени, чем технологические операции, химические, биологические и т.п. явления, отвечают требованиям статистического подхода. Различия в поведении, мотивациях, взглядах людей не могут быть объяснены лишь случайными отклонениями от некоего «среднего» или «эталонного образца». Да и само понятие репрезентативности применительно к объектам социологического исследования часто бывает довольно трудно определить. Ведь в подавляющем большинстве случаев социолог при разработке выборки стоит перед проблемой ее расчета в условиях, когда границы объема генеральной совокупности размыты, а сведений о критериях, характеризующих ее структуру, либо недостаточно, либо совсем нет. Более того, именно структура генеральной совокупности часто и является главной целью исследования. (С этим хорошо знакомы социологи, основной предмет изучения которых — различные политические процессы, характер социальной и профессиональной дифференциации общества и т.п.).

Ясно, что в ситуации, когда нет возможности оценить ошибку выборки (главный статистический показатель ее качества), вопрос о ее репрезентативности (в статистическом смысле) остается открытым.

Итак, имеется множество факторов, вынуждающих социолога отказываться от проведения сплошного исследования объектов генеральной совокупности и привлекать к анализу только их часть. Однако между чисто сплошным и чисто выборочным исследованием существует еще промежуточный вариант, когда изучается существенно большая часть генеральной совокупности. Речь идет о так называемом методе большого массива. При его реализации в эмпирическую базу включаются либо те единицы генеральной совокупности, которые играют главную, решающую роль с точки зрения исследуемой проблемы, либо все, доступные для изучения. Например, при опросе люди могут отказаться от участия в нем, отсутствовать на месте по причине болезни, отъезда и т.п. При документальном исследовании какая-то часть документов может быть утеряна, засекречена и т.д. В любом случае предполагается, что не попавшая в эмпирическую базу исследования часть единиц генеральной совокупности не существенна для анализа проблемы в целом. С этой ситуацией социолог часто сталкивается при проведении экспертных опросов, контент-анализе различных видов СМИ, опросах на предприятиях и т.п. Принципиально проблема проектирования выборки и обеспечения ее репрезентативности при методе большого массива не возникает. В силу того, что по своей сути метод большого массива близок к сплошному исследованию, иногда он носит название несплошного исследования.

При реализации выборочного исследования социологу приходится считаться с ошибками выборки.

Как отмечалось, под ошибкой выборки понимаются отклонения значений определенных характеристик выборочной совокупности от их значений в генеральной. По происхождению ошибки выборки можно классифицировать на:

^ теоретико-методологические, обусловленные неадекватным представлением об объекте исследования и выработкой неверной стратегии отбора на концептуальном этапе исследования;

^ процедурные, возникающие при разработке модели выборки; ^ ошибки реализации, связанные с непосредственным отбором единиц выборочной совокупности.

По характеру воздействия на качество выборки различают систематическую и случайную составляющие ошибки выборки.

Систематическая компонента ошибки выборки возникает тогда, когда неверным оказывается сам принцип отбора. Это бывает обычно тогда, когда у исследователя формируется неадекватное представление об объекте исследования. Отсюда — неверный выбор критериев, объема генеральной совокупности, методики отбора единиц наблюдения и т.п. Например при исследовании политических ориентаций населения методика отбора предусматривает выборочный опрос жителей конкретной территории в рабочее время. Ясно, что состав тех жителей, которых встретят в домах интервьюеры днем, по своим базовым (и весьма важным для исследования!) характеристикам будет радикально отличаться от реальных значений этих характеристик всего взрослого населения данного района.

Систематическая ошибка представляет собой постоянную или закономерно изменяющуюся величину, обусловленную действием одной или нескольких причин. Теоретически ошибки, вызываемые различными причинами, могут частично погашать друг друга. Однако практически величина систематической компоненты ошибки выборки не уменьшается с увеличением объема выборочной совокупности. Поэтому опасность систематических ошибок заключается в том, что они вызывают отклонение значений критериев в одну сторону (увеличения или уменьшения). В связи с этим один из основоположников выборочного метода в социологии Дж. Гэллап говорил, что «ошибки в социологических исследованиях возникают не потому, что было опрошено мало людей, а потому, что были опрошены не те люди» (1940 г.).

Одну из специфических причин систематической ошибки выборки образуют так называемые труднодоступные единицы наблюдения. К ним, как правило, относятся младшие возрастные группы, представители редких социально-профессиональных групп (военнослужащие, управленцы, «новые русские», студенты и т.п.), национальностей, наиболее интеллектуально развитая часть населения, которая традиционно негативно относится к заполнению анкет и т.д.

Случайная компонента ошибки выборки обусловлена самим принципом выборки. Ее появление вызвано именно тем, что к исследованию привлекается только часть, а не все множество генеральной совокупности.

В отличие от систематической компоненты случайные ошибки менее опасны, так как они в большей или меньшей степени имеют тенденцию взаимно погашать друг друга. Поэтому величину случайной ошибки можно с помощью определенных методов свести к приемлемому минимуму.

В целом ошибки репрезентативности выборки зависят от трех факторов:

^ степени однородности генеральной совокупности по конкретному критерию;

^ объема выборки;

^ метода организации отбора.

Рассмотрим влияние каждого из них в отдельности.

Однородность объекта исследования по какому-либо признаку означает высокую близость или полную идентичность значений этого признака у всех единиц генеральной совокупности. Например, все абитуриенты, поступающие в вузы, образуют полностью однородное множество по признаку наличия у них среднего образования. Чем выше однородность генеральной совокупности по каким-либо критериям, тем меньшая по объему выборка может обеспечить приемлемый уровень репрезентации.

Объем выборки связан обратной зависимостью с величиной случайной ошибки: т.е. ее величина тем меньше, чем больше объем выборки. В основе этой зависимости — закон больших чисел. Формулируется он следующим образом: совокупное действие большого числа случайных факторов при некоторых весьма общих условиях приводит к результату, почти не зависящему от случая.

Более строгая математическая формулировка этого закона выглядит так: при больших п среднее арифметическое Yn = (х1 + х2 + + ... + хп ) / п независимых случайных величин х1, х2, ..., хп , имеющих одно и то же распределение с математическим ожиданием т = М(х), мало отличается от константы т, т.е. при любом сколь угодно малым е gt; 0 и п ^ ^ вероятность события

Р {^ - т | lt; е} = 1.

То есть это достоверное событие.

На базе этой теоремы разработана математическая теория выборочного метода, ядро которой составляют теоремы П. Чебышева, А. Ляпунова, Я. Бернулли, С. Пуассона. На ее основе с помощью аппарата математической статистики разработаны формулы, позволяющие определять объемы выборочных совокупностей из множества случайных событий при заданных значениях допустимой погрешности.

Некоторые социологи склонны превратно толковать закон больших чисел и стремятся охватить как можно большее число единиц наблюдения, полагая, что этот закон сможет «перемолоть» любые погрешности. Эти социологи испытывают большое почтение к статистическим формулам определения объема выборочной совокупности и доверяют им больше, чем содержательным соображениям, определяемым спецификой исследуемого явления. Однако в широкой практике при оценке объема выборочной совокупности большинство социологов руководствуются зависимостью, эмпирически установленной на основе многолетнего анализа реальных результатов Институтом Дж. Гэллапа (табл. 3.1).

Таблица 3.1

Зависимость между объемом выборки и точностью репрезентации

(уровень достоверности 95%)

Объём выборки

100

200

400

600

750

1000

1500

4000

Точность, %

± 11

± 8

± 6

± 5

± 4

± 4

± 3

± 2

Из этой таблицы, в частности, следует, что добиться отклонения 5% можно уже при объеме выборки 600 ед. Однако ошибка 5% — это граница допустимого диапазона, за пределы которого (по определению) может выйти 5% ед. выборочной совокупности. Поэтому в практике социологии предпочитают иметь определенный запас надежности и за исходный уровень ошибки принимают 3%. При этом базовый объем выборки становится равным 1500 ед. Этот же объем оказывается, как правило, оптимальным и с точки зрения репрезентации (наполненности) малочисленных групп в структуре выборочной совокупности (такими группами часто оказываются студенты, военнослужащие, управленцы и др.).

В зависимости от метода организации отбора выборки подразделяются на случайные и неслучайные.

Случайная выборка обеспечивает всем элементам генеральной совокупности равенство шансов попасть в выборку. Реализация этого вида выборки предполагает наличие списков (карточек) и нумерацию всех элементов генеральной совокупности.

В неслучайных выборках принцип равенства шансов не соблюдается.

Отбор единиц из генеральной совокупности в выборочную на практике осуществляется двумя способами: а) простым случайным отбором или б) механическим случайным отбором. Реализация любого способа требует учета двух принципов: 1) избегать смещенности результатов и 2) обеспечить минимум величины ошибки при имеющихся ресурсах. В настоящее время единственным способом избежать смещений результатов является строгое соблюдение методики случайного отбора. Соблюдение второго принципа заключается в таком подборе метода отбора, который бы обеспечивал оптимизацию двух факторов: ошибку выборки и величину затрат на ее проведение.

При простом случайном отборе каждый элемент генеральной совокупности имеет некоторую отличную от нуля вероятность попасть в выборку. Этот метод может быть реализован по принципу лотереи (который из-за своей чрезвычайной трудоемкости практически никогда не применяется и в социологии имеет исключительно теоретическое значение) или с помощью таблиц случайных чисел. Оба метода предполагают составление списка и предварительную нумерацию всех элементов генеральной совокупности.

Механический случайный отбор является самым распространенным способом. Он предполагает отбор из генеральной совокупности каждого ^го ее элемента. Номер первого элемента может быть определен случайным образом (например по таблице случайных чисел находят первое число в интервале от 1 до к) или же еще проще: по формуле k/2. Число k называется шагом систематического отбора и определяется как целая часть от деления объема генеральной совокупности на объем выборки.

k = N / п.

По сравнению с простым случайным отбором систематический отбор значительно проще и позволяет с большей точностью обеспечивать оптимальный уровень ошибки выборки. Однако необходимо иметь в виду, что этот метод может привести к существенным смещениям результатов, если в генеральной совокупности присутствует цикличность, кратная шагу выборки, или другие тенденции, способные оказывать систематическое влияние на результат. Например, пятиэтажные дома, построенные в 1950— 1960-е гг., так называемые «хрущевки», в каждом подъезде имеют по 20 квартир. Если при проектировании выборки k оказывается равным 20 и в объект исследования входят эти дома, то в выборку попадут одинаковые по своим статусным характеристикам квартиры. Понятно, что это приведет к возникновению систематической погрешности. 

<< | >>
Источник: Тавокин Е.П.. Основы методики социологического исследования: Учебное пособие. — М.: ИНФРА-М. — 239 с.. 2009

Еще по теме § 3. ВЫБОРОЧНЫЙ МЕТОД В СОЦИОЛОГИИ:

  1. 3. МЕТОДЫ И МЕТОДОЛОГИЧЕСКИЕ ПОДХОДЫ
  2. 4.1. ИССЛЕДОВАТЕЛЬСКИЕ СТРАТЕГИИ И МЕТОДЫ
  3. Функции выборочного метода
  4. Косвенные методы определения уровня репрезентативности
  5. Специальные проблемы применения выборочного метода в социологии
  6. Академгородок, Москва, первые Всесоюзные выборочные опросы
  7. Американский профессор социологии
  8. К ВОПРОСУ О МЕТОДОЛОГИИ ЭМПИРИЧЕСКОГО СОЦИОЛОГИЧЕСКОГО ИССЛЕДОВАНИЯ
  9. ВЫБОРОЧНЫЕ ИССЛЕДОВАНИЯ
  10. КОНКРЕТНЫЕ МЕТОДЫ СБОРА ДАННЫХ
  11. Глава 1 Исторический очерк становления метода опроса
  12. Глава 2 Познавательные возможности метода опроса