<<
>>

Многофакторные модели социальных процессов

До сих пор использование математических методов для прогнозирования основывалось на принципе «черного ящика» и не предполагало описания причинно-следственных связей. Сейчас пойдет речь о математических моделях, которые претендуют на выявление механизма взаимодействия различных социальных факторов.

Для описания структуры процесса можно воспользоваться аналитическими моделями, состоящими из уравнений, которые характеризуют взаимодействие между факторами, и игровыми и имитационными моделями, построенными на ином принципе.

Описание с помощью аналитических многофакторных моделей структуры социального процесса можно осуществить, исходя из двух методологических положений. Первое из них связано с сущностным анализом процесса, второе — с феноменологическим подходом к решению данной задачи. Первое положение предполагает знание не только существования и форм проявления взаимодействия между определенными социальными факторами, но и самой природы этого взаимодействия. Очевидно, здесь идет речь о моделировании социальных процессов на основе наиболее полного знания их сущности. Используя философскую терминологию, можно сказать, что в этом случае модели создаются на базе изучения динамических закономерностей, т.е. закономерностей, отражающих чаще всего глубинные, сущностные взаимодействия между небольшим числом факторов.

Нам известны многие динамические закономерности, например, определяющее значение социального положения индивидуума, классовой принадлежности в формировании его мировоззрения и ценностных ориентаций, возрастающая роль моральных стимулов трудовой деятельности при повышении уровня благосостояния, влияние занятий родителей на профессиональную ориентацию детей.

Математическое описание динамических закономерностей предполагает исследование взаимодействия изучаемых явлений относительно изолированно от других факторов. Поэтому примеры удачного использования математических моделей для описания динамических, «сущностных» закономерностей весьма ограничены, не говоря уже о том, что их объяснительная и прогностическая ценность является дискуссионной[807].

Важно при этом отметить, что, как правило,

параметры переменные в таких моделях редко получают числовые характеристики на основе статистической информации.

Аналитический тип моделей выступает в двух разновидностях: детерминистической и вероятностной. Детерминистическая модель предполагает строго функциональную, однозначную связь между факторами. Вероятностная модель строится на предпосылке о целесообразности оперировать вероятностными представлениями о взаимодействии факторов.

Наиболее ярким примером детерминистической «сущностной» модели в социологии является, по-видимому, модель миграции населения в ее различных разновидностях. Американскими авторами (Ст. Додд, Дж. Ципф и др.), попытавшимися использовать ньютоновский закон тяготения, была предложена модель, основывающаяся на следующей идее: в случае, если уровень заработной платы и возможности для трудоустройства распределены в двух городах одинаково, то обмен населением между обоими горо-

P ¦ P

дами пропорционален выражению 1              2              ,              где              Рг и Р2 характеризу

ют численность населения в первом и втором городе, а D — самое короткое расстояние между двумя городами (с учетом имеющихся видов транспорта). Эта модель неплохо согласовывалась в некоторых случаях с эмпирическими данными. Однако в целом она была подвергнута критике за свою «механистичность», особенно в трактовке понятия «расстояния». Было справедливо замечено, что одно и то же физическое расстояние по-разному воспринимается потенциальными мигрантами под влиянием факторов административного, этнического характера.

Эту же модель попытались использовать и экономисты (В. Леонтьев и др.) для описания обмена продукцией между двумя экономическими районами[808]. Отдельными исследователями предприняты попытки построения и других моделей, основывающихся на знании «сущностных» (а не вероятностных, феноменологических) закономерностей. Так, известны модели, описывающие процесс формирования общественного мнения и решений в группе, движения рабочей силы на предприятии[809].

До самого последнего времени аналитические модели «сущностного типа» не получили серьезного развития в социологии, несмотря на то, что число ученых, продолжающих верить в будущее таких моделей, остается достаточно большим.

Гораздо более широкое применение в социологии и социальной прогностике получили аналитические модели вероятностного, феноменологического характера. Авторы этих моделей, отказываясь от попыток отразить взаимодействие социальных факторов на глубинном, сущностном уровне, ограничиваются установлением самого факта существования связи между ними, а также формы и степени тесноты этой связи. Такой менее строгий подход, не требующий от исследователя знания механизма взаимодействия социальных факторов на уровне закона, позволяет (в известном смысле в порядке компенсации) оперировать одновременно многими факторами. Конечно, хорошо было бы «и то и другое», однако, как это часто бывает, приходится выбирать между этими двумя научными стратегиями.

Для решения задачи по описанию связей между различными явлениями используется главным образом аппарат математической статистики, который основывается на том, что исследователь не в состоянии выявить жесткие зависимости, что он не может отразить роль всех социальных факторов, связанных с изучаемым процессом и что поэтому полученные им результаты будут носить вероятностный характер. С элементами математической статистики, в частности, с регрессионным анализом, мы уже знакомились в связи с задачами выявления тенденций развития. Однако если для описания тенденций использовались уравнения регрессии с одной переменной в качестве аргумента, то теперь идет речь об уравнениях с большим числом переменных — аргументов. Более того, все чаще и чаще делаются попытки описать социальный процесс системой уравнений.

Приведем примеры многофакторной модели. Исследования материалов бюджетной и торговой статистики показали, что основными факторами, определяющими среднедушевые расходы семей рабочих и служащих на продовольственные товары (Y) являются денежные доходы в расчете на одного члена семьи (Xx) и объем сельскохозяйственной продукции, произведенной в личных подсобных хозяйствах на душу населения (X2). Если использовать статистические данные за ряд лет, то уравнение регрессии окажется следующим: = 204,8 + 0,43 Xj - 0,55 X2[810].

Коэффициент 0,43 означает, что увеличение среднедушевого дохода на один рубль приводит к возрастанию расходов на продовольствие на 0,43 рубля, в то время как увеличение объема сельскохозяйственной продукции на ту же величину ведет к уменьшению указанных выше расходов на 0,55 рубля.

Зная динамику среднедушевого дохода и личных подсобных хозяйств, можно предсказать размер расходов на продовольствие.

Параметры в аналитических многофакторных моделях получаются практически теми же методами, что и в моделях, описывающих тенденции развития.

Использование уравнений регрессии и целой системы уравнений для изучения взаимодействия социальных факторов предполагает решение большого числа важных методологических и методических проблем, кропотливую теоретическую работу и тщательное изучение накопленного эмпирического материала. Среди указанных проблем одной из важнейших является отбор факторов для анализа. Действительно, после того, как определен объект прогноза и решен вопрос о том, какие именно показатели будут выступать в качестве его количественных характеристик, приходится установить перечень факторов, способных оказать влияние на ход изучаемого процесса, а также на его отдельные стороны. Предположим, речь идет о построении модели для прогнозирования посещений кино. Динамика этого показателя зависит от множества факторов, таких, например, как возрастная структура населения, уровень образования отдельных возрастных групп, обеспеченность кинотеатрами и режим их работы, количество и качество новых фильмов, распространенность телевидения, характер телепередач.

Как бы ни были велики научные потенции исследования, как бы ни была велика мощь вычислительной техники, ученый вынужден ограничиться определенным числом переменных и выделить уже на стадии качественного анализа факторы основные и второстепенные. И здесь решающую роль играет уровень теоретической подготовки исследователей и знаний ими эмпирической информации, относящейся к объекту прогноза.

Для отбора переменных используются разные приемы. Одни из них принимаются на первоначальной поисковой стадии отбора, другие — на стадии экспериментальных расчетов. Так, иногда на первой стадии строят матрицы взаимного влияния факторов, целесообразность включения которых в те или иные уравнения модели и подлежит изучению.

Приведем здесь результаты

исследования текучести рабочей силы и покажем на его примере использование матрицы взаимовлияний (или смежности). Исследователями были выделены такие факторы, как возраст рабочего (в годах) — Хх, число лет жизни в Новосибирске — X2, общее образование (классы) — X3, общий стаж работы (в годах) — X4, стаж работы на последнем предприятии (в годах) — X5, число смененных предприятий — X6, жилая площадь на одного члена семьи (м2) — X7, продолжительность обучения последней специальности (месяцы) — X8, среднемесячная зарплата на предыдущем предприятии (руб.) — X9. В результате анализа был сделан ряд предположений о существовании связей между отдельными переменными. Они и получили отражение в следующей таблице (матрице):

Переменные, выступающие как факторы-аргументы (или факторы-причины)

Переменные, выступающие как факторы-функции (или факторы-следствия)

X1

X2

X3

X4

X5

X6

X7

X8

X9

X1

0

1

1

1

1

1

1

1

1

X2

0

0

0

0

1

0

0

0

0

X3

0

0

0

1

1

1

1

1

1

X4

0

0

0

0

0

1

1

1

1

X5

0

0

0

1

0

1

0

0

1

X6

0

0

0

0

0

0

0

0

1

X7

0

0

0

0

0

0

0

1

0

X8

0

0

0

0

0

0

0

0

1

X9

0

0

0

0

0

0

1

0

0

Из этой матрицы видно, что исследователи не исходят из того, что все факторы влияют друг на друга.

Например, по их мнению, число лет проживания в городе (Х2 по горизонтали) влияет только на стаж работы на данном предприятии (Х5 по вертикали), а вот возраст (X1) воздействует на все другие факторы, не испытывая, естественно, воздействия ни одного из них.

На основе матрицы или одновременно вместе с ней исследователь составляет так называемый граф связей, который, быть может, еще нагляднее создает представление о взаимодействии факторов на качественном уровне. Так, граф связи, соответствующий части матрицы, о которой шла речь выше (состоящей только


Из этого графа видно, например, что переменная Х1 влияет непосредственно на все переменные, в то время как переменная Х2 влияет только на Х5, а переменная Х3 — на Х5 и Х4.

Матрица смежности и соответствующий граф может быть объектом специального анализа, который позволяет в определенной мере углубить наши представления о структуре изучаемых явлений[811].

Растущее применение на стадии отбора переменных получает и экспертный метод. Если раньше почти всегда эта работа осуществлялась одним лицом, то теперь к ней начали привлекать нескольких специалистов — экспертов. К ним обращаются с просьбой не только высказать свое мнение о том, как классифицировать исходный перечень факторов, но и как приписать каждому фактору определенный вес, а также осуществить другие операции.

Рассмотрим теперь приемы, используемые на второй — экспериментальной — стадии подготовки модели. Благодаря расширению возможностей электронно-вычислительной техники можно осуществлять теперь ранее не реальные эксперименты, чтобы установить целесообразность включения той или иной переменной в модель. Решение о включении переменной в модель осуществляется чаще всего с помощью коэффициента множественной корреляции (или корреляционного отношения, если речь идет о нелинейных моделях). Корреляционный анализ покоится на одной фундаментальной и широко используемой в математической ста

тистике идее сопоставления друг с другом колебаний (вариаций) изучаемых признаков (показателей, переменных). Если эти сопоставления показывают, что численные значения одного признака варьируют одновременно с вариацией другого (или других) признака, возникает предположение, что между этими сравнимыми признаками существует связь, теснота которой измеряется различными разновидностями коэффициентов корреляции, способными принимать значения от 0 до 1.

Если вариация прогнозируемого показателя полностью зависит от вариации «объясняющих» переменных, то тогда речь идет о жестко функциональной связи, и коэффициент корреляции при линейной зависимости равен единице.

В последнее время приложены определенные усилия к повышению уровня анализа на стадии отбора переменных. Эти усилия направлены на существенное углубление исследования взаимодействия факторов, с целью добиться некоторого приближения к «сущностному» исследованию глубинных закономерностей.

Ученые отказываются от «слепого» применения методов математической статистики, которые предоставляют формальное право определять форму и тесноту связи между любыми факторами. Математический аппарат позволяет искать зависимость, скажем, между темпами роста числа телефонов и динамикой рождаемости, причем искусный в софистике человек может взять на себя смелость предложить содержательную трактовку этой связи.

В настоящее время в статистических исследованиях связи четко выделяются две методические проблемы. Одна из них связана с так называемой «лжекорреляцией». Дело в том, что динамические ряды, в которых, собственно говоря, и концентрируется историческая статистика, используемая для определения параметров уравнений, подразделяются на ограниченное число типов. Так, можно выделить, как уже отмечалось, ряды с повышающимся и понижающимся уровнями (кроме того, с известной условностью — ряды со стабильным уровнем, а также состоящие из циклически колеблющихся уровней). При таком небольшом числе типов динамических рядов существует высокая априорная вероятность, что любые два произвольно отобранных динамических ряда будут относиться к одному и тому же или прямо противоположному классу, и что поэтому между ними будет иметь место более или менее сильная корреляция, вроде той, которая установлена во многих странах между ростом числа телефонов и

снижением рождаемости. В статистической литературе уже давно зафиксированы многочисленные случаи параллельного изменения динамических рядов, между которыми по природе вещей не может быть никакой зависимости. Напомним, например, о зафиксированной «корреляции» между динамикой численности аистов и рождаемостью в Норвегии.

Другая методологическая проблема касается более тонких вещей. Речь идет о том, что существование видимой связи между двумя факторами нередко объясняется только тем, что оба они находятся под влиянием третьего фактора и вовсе не взаимодействуют друг с другом. Можно привести множество примеров, иллюстрирующих это положение. В одном из обследований было установлено, что число несчастных случаев с шоферами зависит от пола. Утверждалось, что с женщинами-шоферами несчастные случаи бывают реже, чем с мужчинами. Однако было выяснено, что в этом анализе игнорировалось расстояние, пройденное за год каждым водителем. Когда были сформированы группы водителей в зависимости от пройденного расстояния, то оказалось, что никаких причинно-следственных связей между числом несчастных случаев и полом нет.

Осознание того, что при изучении связи между двумя факторами всегда следует учитывать наличие «скрытой», ненаблюдаемой переменной, послужило толчком для нескольких плодотворных направлений в статистике и социологии. Прежде всего стала очевидной важность использования при обработке статистических данных методологического принципа, лежащего в основе эксперимента, — закрепление всех факторов, кроме изучаемых, на постоянном уровне. Конечно, решить задачу закрепления факторов в социологии в полной мере невозможно. Удается закрепить максимум три-четыре фактора. Закрепление факторов осуществляется по-разному. Один из путей связан с таким планированием выборочного обследования, при котором можно было бы формировать две группы лиц, имеющих значительное число одинаковых характеристик. Пока известно лишь небольшое число исследований, в которых был использован этот прием.

В тех случаях, когда выравненные выборки заранее запланировать не удается, исследователь может сформировать группы, выравненные по нескольким параметрам уже на анкетном материале. В нашей социологии такой метод наиболее интенсивно использовали Л. Гордон и Э. Клопов в книге «Человек

после работы». Сравнивая совокупности лиц, выравненных по нескольким характеристикам, они пришли к выводу, что в ряде случаев связь между социально-демографическими признаками носит чисто внешний характер. Так, например, при сравнении изменения структуры затрат времени на бытовые нужды в зависимости от среднедушевого дохода создается впечатление, что между этими показателями существует тесная связь. С повышением душевного дохода от низшей по доходу группы (до 50 рублей в месяц) до высшей (свыше 75 рублей) затраты на домашний труд уменьшаются с 33 часов 40 минут в неделю до 22 часов 20 минут.

«Лобовое» использование методов математической статистики дало бы высокий коэффициент корреляции. Однако в действительности связь между обоими показателями в очень большой степени обусловлена третьим, выступающим в данном случае в качестве внутреннего, латентного, фактором — семейным положением женщины. Дело в том, что на уровень душевого дохода решающее влияние оказывает не столько величина заработной платы, сколько размер семьи. Поэтому высокий душевой доход имеют семьи, не имеющие детей[812]. А наличие или отсутствие детей является как раз тем основным фактором, который определяет размер домашнего труда.

Важность закрепления всех факторов, кроме изучаемых, на постоянном уровне, привлекла внимание к так называемой частной корреляции. В отличие от обычного коэффициента корреляции коэффициент частной корреляции измеряет тесноту связи между двумя признаками при предположении, что все остальные отраженные в модели признаки закрепляются на среднем уровне. Приведем пример из материалов исследования текучести рабочей силы[813]. Авторы исследования определили как обычные, так и частные коэффициенты корреляции между признаками, включёнными в модель. Вот некоторые коэффициенты частной корреляции между показателем текучести (Х6) и всеми другими признаками:

Факторы

Величина коэффициента частной корреляции

Возраст (X1)

0,171

Продолжительность жизни в Новосибирске (X,)

0,058

Образование (Х3)

0,042

Общий стаж работы (Х4)

0,226

Стаж работы на последнем предприятии (Х5)

0,394

Жилая площадь на 1 члена семьи (X7)

0,006

Время освоения специальности (Х8)

0,020

Зарплата (Х9)

0,043

Наиболее высокая величина характерна для коэффициента, характеризующего связь между текучестью и стажем работы на последнем предприятии (при условии, что все остальные факторы находятся на среднем уровне). Другие коэффициенты оказались значительно меньше. Конечно, характер влияния стажа на текучесть будет существенно меняться в зависимости, с одной стороны, от среднего уровня таких показателей, как образование, возраст и др. и, с другой стороны, — от того или иного сочетания указанных закрепляемых показателей. В этой связи следует упомянуть направление, получившее название байесовской статистики. Здесь имеется в виду, в первую очередь, понятие условной вероятности, согласно которому при определении возможности какого-либо события необходимо учитывать информацию о событиях, уже совершившихся. Специальный аппарат, разработанный в рамках теории вероятностей, позволяет решить эту задачу.

Дальнейшее развитие методики анализа, ориентированного на поиск внутренних переменных, привело к появлению факторного анализа (включая такие его разновидности, как латентный), а также причинно-структурного анализа[814].

К числу важных методологических вопросов социологического моделирования относится проблема выделения переменных, относящихся к предшествующим периодам. Переменные такого типа можно условно считать независимыми — в том смысле, что величина их определена в прошлом, как бы относится к истории, и уже ничто не может изменить ее. Независимые величины такого рода возникают из-за явления запаздывания во взаимодействии социальных факторов друг с другом, играющего огромную роль в нашем мире. Если бы воздействие одного фактора на другой и адаптация осуществлялись мгновенно, мир был бы совершенно иным. Существование феномена запаздывания создает серьезные возможности для прогнозирования, в частности, для использования в этих целях так называемых рекурентных моделей. Рассмотрим модель, описывающую поведение производителя и потребителя:

St = a1+a2Pt-1 (уравнение производства определенного товара);

Dt = a3+a4Pt (уравнение спроса на этот товар).

Здесь St — объем производства, Dt. — размер спроса, Pt — цена товара, остальные величины — параметры.

Данная модель исходит из того, что в каждый период объем производства товара равен его спросу, т.е. St= Dt.

Пусть в условном примере параметры и цена в начальный (или нулевой) период оказались такими:

ах =100, а2=2, а3=131, а4=1, Р0 =10.

Тогда объем производства в первом периоде будет следующим: Sj=100+2x10=120.

Зная объем производства в первом периоде и учитывая, что объем производства и спроса равны, мы можем, используя второе уравнение, вычислить цену первого периода:

D1=131-1xPt =120; Р1=131-120=11.

Объем производства во втором периоде мы можем подсчитать, используя полученные только что сведения о цене товара в первый период:

S2=100+2x11=122.

Знание же объема производства во второй период позволяет нам выяснить цену этого же периода:

Р2=131-122=9.

В третьем периоде оба уравнения будут выглядеть следующим образом:

S2=100+2x9=118.

Р3=131-118=13.

В четвертом периоде:

S4=100+2x13=126; Р4=131-126=5.

Приведенная выше модель и есть пример рекурентной модели, которая может быть использована для прогноза.

Использование независимых переменных в моделях связано с особым методическим вопросом, получившим название «мультиколлинеарности». Речь идет о том, что некоторые переменные, включенные в модели, настолько тесно коррелированные друг с другом, что, по сути, исследователю нужно исходить из того, что у него гораздо меньше переменных, чем он первоначально думал. Если же исследователь игнорирует это обстоятельство, он попадает в неприятную в статистическом отношении ситуацию, при которой коэффициенты перед переменными теряют устойчивость и могут резко менять свои величины чаще при небольших изменениях в исходных данных. Из-за этого обстоятельства параметры уравнений регрессий могут быть лишены какого-либо содержания.

Явление мультиколлинеарности носит настолько серьезный характер, что само по себе способно вызвать сильный скепсис в отношении многофакторных моделей в социологии. Ведь здесь взаимозависимость независимых переменных является не исключением, а скорее правилом. Поэтому исследователь стоит перед выбором: либо отказаться от включения в модель взаимозависимых переменных и этим резко упростить описание процесса, либо идти, несмотря на использование некоторых специальных прие- мов,[815] на сильный риск и получать сомнительные параметры.

Наконец, еще несколько проблем чисто статистического характера. Практическое использование аналитических многофакторных моделей, как и трендовых, предполагает возможность численной оценки параметров. Для их получения применяют метод наименьших квадратов, максимального правдоподобия и другие. Ошибка прогноза измеряется так же, как и в трендовых моделях. Однако при оценке параметров многофакторной модели, состоящей из нескольких уравнений (даже тогда, когда ошибки этих уравнений некоррелированы), возникают новые проблемы. Дело в том, что в этом случае исследователь должен решать вопрос о соотношении числа переменных и уравнений (проблема идентифи

кации), о соотношении зависимых и независимых переменных, исходя не только из содержания изучаемых процессов, но и из чисто математико-статистических соображений. Это требование, повышая качество получаемых оценок, ухудшает модель, которую нужно поместить в прокрустово ложе жестких статистических требований.

Специального внимания требует и проблема объема выборки. При рассмотрении моделей, описывающих тенденции, уже отмечалась особая роль длины динамического ряда в получении оптимальных оценок. Для регрессионных моделей роль этого обстоятельства резко возрастает. Для вычисления ошибок, присущих коэффициентам уравнений регрессий и коэффициента корреляции знаменателем выступает разность между числом членов динамического ряда и числом переменных в модели (это показатель «степеней свободы»)[816]. Такую ситуацию можно объяснить тем, что на каждую единицу информации (в данном случае — член ряда) приходится определенная нагрузка в виде числа переменных, включенных в модель. Чем больше это число, тем ниже точность результатов из-за ограниченных информационных возможностей. Не удивительно, что при оценке качества прогностической модели эксперт первым делом выясняет «степень свободы», и убеждаясь, что она невелика, с предельным скепсисом относится к выдаваемым прогнозам.

Тот факт, что коэффициенты корреляции и регрессии во многих случаях не обладают свойством «воспроизводимости», часто мешает социологу доверять названным показателям[817]. К сожалению, в социологической литературе почти невозможно разыскать такие конкретные коэффициенты корреляции и регрессии, которые прочно вошли бы в научный оборот.

<< | >>
Источник: Шляпентох В.Э.. Проблемы качества социологической информации: достоверность, репрезентативность, прогностический потенциал. — М.: ЦСП. — 664 с.. 2006

Еще по теме Многофакторные модели социальных процессов:

  1. 13.7. Методы, используемые в процессе консалтинга
  2. 6.6. ШКОЛА СОЦИАЛЬНЫХ СИСТЕМ
  3. Материальные и духовные потребности
  4. СЛОВАРЬ ТЕРМИНОВ
  5. 2.9. Прогнозные оценки рыночной конъюнктуры
  6. 1.1. МОДЕЛЬ КАК ФОРМАЛИЗОВАННОЕ ВЫРАЖЕНИЕ ИНТЕРПРЕТАЦИИ ПОЛИТИЧЕСКОЙ ДЕЙСТВИТЕЛЬНОСТИ
  7. 3.3. БАЗОВАЯ ТЕХНИКА МЕТОДА АНАЛИЗА ИЕРАРХИЙ: ПРИМЕР ЭЛЕКТОРАЛЬНОГО ПРОЦЕССА
  8. Г.А. Комарова ОТЕЧЕСТВЕННАЯ ЭТНОГРАФИЯ И ЭТНОСОЦИОЛОГИЯ: ОПЫТ МЕЖДИСЦИПЛИНАРНОЙ ИНТЕГРАЦИИ
  9. Материальные и духовные потребности
  10. Глава 1.2. ПРЕДМЕТ И МЕТОД ТЕОРИИ ОРГАНИЗАЦИИ
  11. Глава 6.2 ОРГАНИЗАЦИЯ УПРАВЛЕНИЯ
  12. III. ИННОВАЦИИ -ОСНОВА РЕИНЖИНИРИНГА
  13. Многофакторные модели социальных процессов
  14. 2.1. Общество без социальных различий?!?