<<
>>

9.6. МНОЖЕСТВЕННАЯ КОРРЕЛЯЦИЯ

В приведенных выше примерах рассматривалась зависимость между двумя признаками, т. е. речь шла о так называемой парной корреляции. На практике же чаще всего изменение изучаемого признака зависит от действия нескольких причин.
В таких случаях изучение корреляционной связи не может ограничиться парными зависимостями, и в анализ необходимо включить другие признаки-факторы, существенно влияющие на изучаемую зависимую переменную. Одновременное изучение корреляции нескольких переменных проводится на основе использования методов множественной корреляции. Так, например, рассматривая уровни фондоотдачи на различных предприятиях одной отрасли, мы можем установить, что величина его зависит от размеров предприятия, удельного веса активной части фондов, степени изношенности фондов, степени их обновления и ряда других факторов.

Если обозначить факторы хи х2, х3, хт, то линейное уравнение множественной зависимости может быть записано так:

yXtiX2.....Хт =b0+biXi+b2X2-\-b3x3+ ...+Ьтхт. Обозначим номер

наблюдения (t=l, 2, 3,...,м), номер независимой переменной

0 = 1, 2, 3.....т).

Тогда матрицы результатов наблюдений можно записать так:

х\\ #12- - - ХШ Х2\ Х22- ? • Х2т

хз\ #32- • • хзт

Х=(Х^) =

#«1 Х.п2- • • Хп

Y=(Yi) =

У\

У2

Уп

207

206

Введем теперь матричные обозначения. Пусть X — матрица независимых переменных (факторов), размер которой определяется числом наблюдений п и числом переменных т. Y— вектор зависимой переменной.

Транспонируем матрицу X и обозначим ее Хт. Система нормальных уравнений в матричной форме записывается следующим образом:

XTXB = XTY,

где В — матрица-столбец из коэффициентов регрессии bo, bi, b2.....bm.

bo bi

B= b2

Для определения элементов матрицы В необходимо найти матрицу, обратную матрице ХТХ, т. е. (ХТХ)"! и вектор XTY: 2 Хц 2 ХцХг2 ' ' ' 2 ХцХт »' » » 2 УгХц i х*х= 2 xi2xn 2 xf2 - • -2 x^xim

г i i

2 XimXii 2 XimXi2''' 2 Xim i i i ; A7K= 2 ytxi2

i

• ? • a

i В уравнении регрессии обычно имеется свободный член, который мы обозначили Ь0. Чтобы найти оценку этого параметра, расширим матрицу X, введя в нее переменную xio=l. Тогда матрицу X в развернутом виде можно записать в следующем виде:

1 X2J ДГ22 ' " " *2m 1 ЛГ31 X32 • • ? X,

Х =

л3т

Тогда

1 ДГщ Хп2' •

п 2хг1 2Xf| 2xjf

2Xjm 2 Xi\Xim

• 2 xirrt

^,ХцХ{г

2 Xim

208

*TY=

2y<

2 У\Хц 2 ytXim

Следующим этапом будет определение матрицы (ХТХ)_1, обратной матрице ХТХ. Найдя обратную матрицу (Х^)-1, можно определить элементы матрицы В:

В= (XTXJ-^XTY).

После того как вычислены коэффициенты регрессии, запишем

Л

матричное уравнение: Y=XB, где Л

У1 ЬоХю biXl2 • ? • bmxxm Л ЬоХ20 btx2i • • ' ЬтХ2т У2 Л b0Xno &l*nl • • Уп

•bmXnm Y=

У — вектор-столбец значений результативного признака, полученных по уравнению регрессии. Остаточная сумма квадратов, т. е.

п Л

2(у,—К)2 может быть найдена следующим образом: 1 д л л л л л

(y-Y)T (y-Y) = YiY-Y'ry-yiY+yiY •

л

Используя матричные уравнения Y=XB и В= (XTX)w4XTY, получим:

YTY = YTY= (ХВ) TY=BTXTY.

Тогда остаточная сумма квадратов будет равна: BTXTY—2BTXTY+YTY=YTY - BTXTY. Зная параметры уравнения множественной зависимости, можно рассчитать значение индекса корреляции по следующей формуле:

1=

2

' о»,

(9.2Н

где S2A —дисперсия эмпирических значений относительно зна-у*1

чений, рассчитанных по корреляционному уравнению, которая определяется делением остаточной суммы квадратов на (я—т— 1); а2у — дисперсия эмпирических значений результативного признака.

По параметрам полученного уравнения мы можем оценить долю каждого из факторов в изменении уровня результативного показателя у. Это может быть сделано путем прямой оценки по

14. Заказ 47S9

209

величине коэффициентов регрессии при каждом из факторов, а также по коэффициентам эластичности Эх, и стандартизированным частным коэффициентом регрессии R-коэффициентам.

Коэффициенты уравнения множественной регрессии показывают степень влияния каждого фактора на анализируемый показатель при среднем уровне других факторов.

Частные коэффициенты эластичности показывают, насколько в среднем изменяется функция с изменением аргумента от среднего значения на один процент при фиксированном положении других переменных, и рассчитываются по формуле-

Эх. = bj -' у

Р-коэффициенты показывают, на какую часть среднего квадрати-ческого отклонения ау изменится зависимая переменная у с изменением соответствующего фактора на величину своего средне-квадратического отклонения oXJ- Этот коэффициент позволяет сравнивать влияние колеблемости различных факторов на вариацию исследуемого показателя.

fc=*r— • (9.22)

Л] ОУ

При построении многофакторных корреляционных моделей одной из предпосылок обоснованности конечных результатов является требование возможно меньшей коррелированности включенных в модель признаков-факторов (отсутствие мультиколли-неарности).

В случае наличия линейной зависимости между факторами система нормальных уравнений не будет иметь однозначного решения, в результате чего коэффициенты регрессии и другие оценки окажутся неустойчивыми. Кроме того, наличие взаимосвязи факторов затрудняет экономическую интерпретацию уравнения связи, так как изменение одного из факторов влечет, как правило, изменение факторов, с ним связанных. Для исключения муль-тиколлинеарности было предложено несколько методов. На практике чаще всего используют чисто эмпирический подход к решению этой проблемы1. Рассматривается матрица парных коэффициентов корреляции (индекс 0 присвоен результативному признаку у), по которой можно оценить степень взаимной коррелированности признаков-факторов (см. табл. 9.13).

Если величина парного коэффициента, учитывающего степень тесноты связи между двумя факторными признаками, по абсолютной величине 0,8 и более, то такие факторы считаются кол-линеарными. При построении модели в нее следует включать один из этих факторов. Величина совокупного коэффициента

210

ч

Таблица 9.13 ФАКТОРЫ У X, Х1 XM У 1 ПО НО . . . ОО . . . Г ТО Х\ ПО 1 П2 . . . ГЦ . . . Г ml Х2 П2 1 . . . Г» ? • • Гт2 ОО Гц ГЦ . . . 1 . . . rmf > • • XM Г ТО Гт! Гт2 . . . . . . 1 корреляции по значениям парных коэффициентов может быть определена следующим образом:

1 г10 г20 ' ' ' rm0 FLO 1 r12 ' ' " Гп1 ?20 r\2 1 " ' ' Гш2

#2=1-

rтО

ГТ2

1

1

'12

'1т

Г\2 1 •

Тт2

F ml ГТ2

1

(9.23)

Величина R2 называемая коэффициентом детерминации, показывает, какая часть общей дисперсии результативного признака обусловлена вариацией признаков-факторов, включенных в рассматриваемое уравнение корреляционной зависимости. Величина совокупного коэффициента корреляции изменяется в пределах от 0 до 1 и численно не может быть меньше, чем любой из образующих его парных коэффициентов корреляции. Для случая зависимости результативного признака от двух факторных признаков формула совокупного коэффициента корреляции имеет вид:

4*2 = У

2 2

г10+г го—2? 10 ? ГГО • Гц

(9.24)

' Расчет параметров уравнения зависимости для такого варианта можно вести по формулам, в которых используются уже вы

14*

211

численные значения парных коэффициентов корреляции и средних квадратических отклонений.

Так для уравнения вида yXl,n=b0+biXi+b2x2 параметры Оо. 0ь »2 могут быть найдены по следующим формулам:

6,=-

Ох, 1-Л2

1 12

, Су Г20 — Г10-Г\г

Ох, 1-Г2

2 12

b0=y-blxi-b2x2,

где оу, aXl, аХ2— средние квадратические отклонения соответственно признаков у, xi и х2; г10, г20, г12 — парные коэффициенты корреляции.

Для более глубокого исследования связей между явлениями целесообразно установить степень тесноты связи между результативным признаком у и каждым из факторных признаков при исключении влияния других факторных признаков.

Для решения поставленной задачи определяют так называемые коэффициенты частной корреляции, выявляющие степень «чистого» влияния факторного признака на результативный признак. Для расчета частных коэффициентов корреляции могут быть использованы парные коэффициенты корреляции. Для случая зависимости у от двух признаков можнр будет вычислить два коэффициента частной корреляции:

1) частный коэффициент корреляции ryXl.xl между результативным признаком у и фактором х\ при элиминировании фактора х2 показывает, какую часть колеблемость у, вызванная фактором х\, составляет в колеблемости у под действием всех факторов, кроме фактора х2.

Wx2 = ^=r2i2)(1_;22())

2) второй частный коэффициент корреляции ryXi.Xi характеризует зависимость результативного признака от фактора х2 при исключении влияния фактора Х\.

Г ухг-xi '?

У(1-г2.о)(1-г2,2)

Для общего случая частные коэффициенты корреляции можно определить таким образом:

г ' = \f

V*m+l*l. *2.....*m V l_#2m ' (9.25)

где R2m — коэффициент детерминации результативного признака у с комплексом факторных признаков хи х2.....xm; R2m+i—

коэффициент детерминации результативного признака у с комплексом признаков хи х2, хт, хт+и гухт+1.Х1>Х2,...>Хт—частный коэффициент корреляции у с факторным признаком xm+i при исключении влияния факторных признаков х\, х2, ... , хт.

При малых значениях rvxm+l.XilX......*m нет смысла вводить

в уравнение (т+1) фактор, так как эффективность нового уравнения регрессии, характеризующего зависимость от (m+l) факторов, возрастает незначительно.

Построение многофакторных регрессионных моделей позволяет дать количественное описание основных закономерностей изучаемых явлений, выделить существенные факторы, обусловливающие изменение экономических показателей, и оценить их влияние. В- основном полученные модели используются в двух направлениях —для сравнительного анализа и прогнозирования. Например, для выявления внутриотраслевых резервов повышения эффективности производства рассчитывается уравнение множественной зависимости, рассматриваемое в качестве экономико-статистической модели • анализируемого показателя эффективности и характеризующее основные закономерности в формировании этого показателя для совокупности предприятий отрасли. На основе такого уравнения можно проанализировать и сравнить влияние каждого фактора на повышение эффективности в среднем по отрасли. Разбив все предприятия на группы, различающиеся по условиям производства (например, крупные, средние, мелкие) или результатам производственной деятельности (например, передовые, средние, отстающие), можно с помощью модели соответствующего показателя эффективности сравнить результаты деятельности этих групп предприятий между собой и со средним отраслевым уровнем. Для этого в каждой выделенной группе находят средние значения результативных показателей и определяющих их величину факторов. Умножая разность средних значений одних и тех же факторных признаков по различным группам на величину соответствующих коэффициентов регрессии в многофакторной регрессионной модели, получим эффект влияния на результативный показатель разницы в уровнях факторов по группам. По результатам такого сравнения можно дать объективную оценку возможностей повышения эффективности производства и выявить внутрихозяйственные резервы в целом по . отрасли.

Применение регрессионных моделей в прогнозировании требует осторожности в тех случаях, когда мы сталкиваемся с выходом за границы значений признаков, на основе которых было рассчитано уравнение зависимости. Необходима проверка возможности экстраполяции, связанная с оценкой неизменности общих условий формирования уровней признаков в совокупности.

212

<< | >>
Источник: Т. В. Рябушкин. Общая теория статистики: Учебник/Т. В. Рябушкин, 0-28 М. Р. Ефимова, И. М. Ипатова, Н. И. Яковлева. — М.: Финансы и статистика. — 279 с, ил.. 1981

Еще по теме 9.6. МНОЖЕСТВЕННАЯ КОРРЕЛЯЦИЯ:

  1. 7.8. Множественная корреляция
  2. 7.4.1. Линейный коэффициент корреляции
  3. 7.4.2. Коэффициенты корреляции рангов
  4. 10.6. КОРРЕЛЯЦИЯ В РЯДАХ ДИНАМИКИ
  5. Коэффициент внутригнездовой корреляции
  6. 8.8. Корреляция рядов динамики
  7. 9.5. КОЭФФИЦИЕНТЫ КОРРЕЛЯЦИИ РАНГОВ
  8. График. (Поле корреляции, диаграмма рассеивания)
  9. 7.5.2. Параболическая корреляция
  10. 7.5.3. Гиперболическая корреляция
  11. 10.7. ТЕХНИКА НА ОСНОВЕ РАНГОВЫХ КОРРЕЛЯЦИЙ
  12. Понятие и признаки множественности преступлений