<<
>>

7.8. Множественная корреляция

При решении практических задач исследователи сталкиваются с тем, что корреляционные связи не ограничиваются связями между двумя признаками: результативным у и факторным л\ В действительности результативный признак зависит от нескольких факторных.

Например, инфляция тесно связана с динамикой потребительских цен, розничным товарооборотом, численностью безработных, объемами экспорта и импорта, курсом доллара, количеством денег в обращении, объемом промышленного производства и другими факторами.

В условиях действия множества факторов показатели парной корреляции оказываются условными и неточными. Количественно оценить влияние различных факторов на результат, определить форму и тесноту связи между результативным признаком у и факторными признаками х,, х2, ..., хк можно методами множественной (многофакторной) корреляции.

Многофакторный корреляционно-регрессионный анализ сводится к решению следующих задач: •

обосновать взаимосвязи факторов, влияющих на исследуемый показатель; •

определить степень влияния каждого фактора на результативный признак путем построения модели-уравнения множественной регрессии, которая позволяет установить, в каком направлении и на какую величину изменится результативный показатель при изменении каждого фактора, входящего в модель; •

количественно оценить тесноту связи между результативным признаком и факторами.

Математически задача сводится к нахождению аналитического выражения, наилучшим образом описывающего связь факторных признаков с результативным, т.е. к отысканию функции

У\Л,...Л =Д*1> *2’ **)•

Выбрать форму связи довольно сложно. Эта задача на практике основывается на априорном теоретическом анализе изучаемого явления и подборе известных типов математических моделей.

Среди многофакторных регрессионных моделей выделяют линейные (относительно независимых переменных) и нелинейные. Наиболее простыми для построения, анализа и экономической интерпретации являются многофакторные линейные модели, которые содержат независимые переменные только в первой степени:

ух = а0 + а1х] + а2х2 + ... + а^ск,

где а0 — свободный член;

а,, а2, ..., ак — коэффициенты регрессии; х,, х2, ..., хк — факторные признаки.

Если связь между результативным признаком и анализируемыми факторами нелинейна, то выбранная для ее описания нелинейная многофакторная модель (степенная, показательная и т.д.) может быть сведена к линейной путем линеаризации.

Параметры уравнения множественной регрессии, как и парной, рассчитываются методом наименьших квадратов, при этом решается система нормальных уравнений с (к + 1) неизвестным:

П П П П

П

= 1^/1-

/=1

а0п + а,1х;1 + а21х/2 + ... + акЛх1к = Хур /=1 /=1 /=1 !=] п п п п

.а<Ххп + й>2>л + а2^хпхп + ??? +

/=1 /=1 /=1 /=1

п п п п п

% + Я,Х*лХ,* + а2^ХпХ/к + ... + О X** = IУ/*,*- /=1 1=1 /=1 /=1 1=1

где х. . — значение у'-го факторного признака в /-м наблюдении; у. — значение результативного признака в /-м наблюдении

О' = 1, л).

Как правило, прежде чем найти параметры уравнения множественной регрессии, определяют и анализируют парные коэффициенты корреляции. При этом систему нормальных уравнений можно видоизменить таким образом, чтобы при вычислении параметров регрессии использовать уже найденные парные коэффициенты корреляции.

Для этого в уравнении регрессии заменим переменные у, хх, х2, ..., хк переменными /., полученными следующим образом:

у. — У ХЦ — х .

= , = (/? = 1, П, ] = 1, к).

У

Эта процедура называется стандартизацией переменных. В результате осуществляется переход от натурального масштаба переменных х{. к центрированным и нормированным отклонениям В стандартизированном масштабе среднее значение признака равно 0, а среднее квадратическое отклонение равно 1, т.е. 1. = О,

о = 1.

При переходе к стандартизированному масштабу переменных уравнение множественной регрессии принимает вид

{У ~ Р^1 + Рг?2 + + Р/А’

где (у = 1, к) — коэффициенты регрессии.

В этом уравнении [3-коэффициенты представляют собой стандартизированные коэффициенты множественной корреляции. Смысл их легко понять, если в уравнении регрессии вместо каждого кроме какого-либо одного, подставить его среднее значение (/у. = 0). Тогда соответствующий (3-коэффициент будет характеризовать изменение исследуемого показателя в зависимости от изменения одного фактора при постоянном уровне остальных. Иными словами, (3-коэффициент показывает, на какую часть сигмы (оу) изменилось бы значение результата, если бы соответствующий у'-й фактор изменился на сигму (ах ), а прочие факторы не изменились. 1

Кроме того, (3-коэффициенты позволяют оценить степень воздействия факторных признаков на результат. В силу того что все [3-коэффициенты выражены в одинаковых единицах измерения, при [32 > р3 фактор х2 сильнее влияет на результативный признак, чем фактор ху

Свободный член в стандартизированном уравнении отсутствует, так как

% = У - <»,*1 - й2*2 - - йЛ-

Параметры уравнения множественной регрессии в натуральном масштабе и уравнения регрессии в стандартизированном виде взаимосвязаны:

= ^“Р} V = к')-

1 а з Л ;

Нетрудно заметить, что это обычная формула коэффициента регрессии, выраженного через линейный коэффициент корреляции.

Стандартизированные коэффициенты множественной регрессии также вычисляют методом наименьших квадратов, который приводит к системе нормальных уравнений Гу\ = р.+ г\$г + ... + Гу1 II

ьГ

Ъз + Р2 + ... + гг$ к V II

та + Гк7 Рг + ... + Р* 1 "

где г. = — У— парный коэффициент корреляции резуль-

И П /=1 у 3

тативного признака у с у'-м факторным; 1

"

г; = — 2 — парный коэффициент корреляции у-го фак- п 1=1 торного признака с 1-м факторным.

После того как получено уравнение множественной регрессии (в стандартизированном или натуральном масштабе), необходимо измерить тесноту связи между результативным признаком и факторными признаками. Для измерения степени совокупного влияния отобранных факторов на результативный признак рассчитывают совокупный коэффициент детерминации Я15 и совокупный коэффициент множественной корреляции Я — общие показатели тесноты связи многих признаков независимо от формы связи.

Совокупный коэффициент детерминации Я16 характеризует долю вариации результативного признака, обусловленную изменением всех факторов, входящих в уравнение множественной регрессии.

Приведем несколько формул для расчета совокупного коэффициента детерминации. 1.

Аналогично индексу парной корреляции используется соотношение факторной и общей дисперсий (или остаточной и общей дисперсий)

82 2

Я2 = фа1стор /?2 = 1 _ °ост

V XXX 2 ’ ИЛИ /V I 2 ’

у,хгх2, ...,хк г У,хгх2, ...,хк А

У У

2

фактор

остаточная диспер-

сия, характеризующая отклонения фактических уровней результативного признака у( от рассчитанных по уравнению множественной регрессии (ух)г 2.

При линейной форме связи расчет совокупного коэффициента детерминации можно выполнить, используя парные коэффициенты корреляции:

„2 _ + + - + “кГукаХі

к — ,

у, хгх2,...,хк 0

У

где а,, а2, ..., ак — параметры уравнения множественной регрессии в натуральном масштабе. 3.

Легко вычислить совокупный коэффициент детерминации, используя уравнение регрессии в стандартизированном виде:

= Р.^1 + р2гу2 + - + Р кГук-

Совокупный коэффициент множественной корреляции Я представляет собой квадратный корень из совокупного коэффициента детерминации Я2. Пределы изменения совокупного коэффициента множественной корреляции: 0 < Я < 1. Чем ближе Л к 1, тем точнее уравнение множественной линейной регрессии отражает реальную связь. Иначе говоря, среди отобранных факторов присутствуют те, которые решающим образом влияют на результативный. Малое значение Я можно объяснить либо тем, что в уравнение множественной регрессии не включены существенно влияющие на результат факторы, либо тем, что установленная линейная форма зависимости не отражает реальной взаимосвязи признаков. Добиться адекватности модели множественной регрессии эмпирическим данным возможно, соответственно, либо включением в уравнение регрессии дополнительных, ранее не учитываемых факторов, либо построением нелинейной модели множественной регрессии.

Совокупный коэффициент множественной корреляции зависит не только от корреляции результативного признака с факторными, но и от корреляции факторных признаков между собой. Наличие между двумя факторами весьма тесной линейной связи (парный коэффициент корреляции превышает по абсолютной величине 0,8) называется коллинеарностью, а между несколькими факторами — мультиколлинеарностью.

Поясним эту зависимость для случая двух факторных признаков. Если при двухфакторном анализе в формуле расчета совокупного коэффициента корреляции выразить р-коэффициенты через парные коэффициенты корреляции, получим следующее выражение:

(7.48)

Из формулы (7.48) следует, что чем теснее связь результата с каждым фактором в отдельности, тем выше совокупный множественный коэффициент корреляции Я х х при условии, что составляющая этой формулы, содержащая г12 — парный коэффициент корреляции, мала, т.е. корреляция между факторами отсутствует.

Вообще говоря, отсутствие корреляционной связи между факторными признаками и наличие тесной связи между результативным и факторными признаками — условие включения этих факторных признаков в регрессионную модель.

Допустим, мы получили зависимость результативного признака только от фактора х,: уравнение регрессии ух = а0 + ахху Включая дополнительный факторный признак х2, мы полнее объясняем результат, т.е. уравнение регрессии ух = я0 + ^х, + а2х2 точнее описывает функцию. Однако если новая переменная х2 коррелирует с Хр то чем теснее эта корреляция, тем более вероятно, что включение дополнительного фактора в уравнение регрессии существенно не увеличит совокупный коэффициент множественной корреляции. Иначе говоря, чем выше межфакторная корреляция, тем ближе совокупный коэффициент множественной корреляции по значению к максимальному из парных ко-

У> х\ ’ х2

эффициентов корреляции. В этом случае включение в уравнение регрессии дополнительного фактора нецелесообразно. Если в модель включены мультиколлинеарные факторы, то уравнение регрессии неадекватно отражает реальные экономические взаимосвязи. В этом случае экономическая интерпретация коэффициентов регрессии и корреляции затруднена.

Проблема отбора факторных признаков и проблема мультиколлинеарности могут быть решены на основе многомерных статистических методов анализа (например, с помощью пошаговой регрессии).

Наряду с измерением совместного влияния отобранных факторов на результативный признак важно определить воздействие каждого фактора при элиминировании его взаимосвязи с остальными (что возможно, когда последние зафиксированы на постоянном уровне). Для решения данной задачи применяют частные коэффициенты детерминации

п2 п2 2

= У,х!,х2....,хк у,>:,,х2,...,хк_,

Л3", \ - К2 ’

где г ,г г , ч - частный коэффициент детерминации, ха-

У'лк ^Л|’Л2’

рактеризующий воздействие к-го фактора при элиминировании его взаимосвязи с остальными факторами;

Я2 т „ — коэффициент множественной детерминации,

У’л1 ’ Л2’ ? ? ?’л*

отражающий влияние всех включенных в анализ факторов;

г г — коэффициент множественной детерминации,

У,Х^Х2, ...,Хк1 тт

отражающий влияние всех факторов, кроме одного, воздействие которого отражает частный коэффициент детерминации.

Частный коэффициент детерминации характеризует долю вариации результативного признака, обусловленную воздействием данного фактора, при элиминировании его взаимосвязи с остальными факторами, включенными в анализ. В зависимости от количества факторов, влияние которых исключается, частные коэффициенты детерминации могут быть первого порядка (при исключении влияния одного фактора), второго порядка (при исключении влияния двух факторов) и т.д.

Частный коэффициент корреляции есть квадратный корень из частного коэффициента детерминации.

Для того чтобы оценить сравнительную силу влияния факторов, по каждому фактору рассчитывают частные коэффициенты эластичности

э = ^1. ^ = а д

У х] ' у > у '

где х . — среднее значение у'-го факторного признака; у — среднее значение результативного признака; а. — коэффициент регрессии приу'-м факторном признаке.

Расчет коэффициента эластичности дополняет экономический анализ. Данный коэффициент показывает, на сколько процентов следует ожидать изменения результативного показателя при изменении фактора на 1% и неизменном значении других факторов.

к

Сумма частных коэффициентов эластичности X Э. позволяет

;=1

оценить эластичность в целом при совокупном изменении факторов.

Рассмотрим методику корреляционно-регрессионного анализа на примере статистической обработки данных по предприятиям электросвязи (табл. 7.23).

Таблица 7.23

Основные производственные показатели предприятий электросвязи Номер

предприятия Чистая прибыль, тыс. руб.

У Численность обслуживаемого населения, млн чел.

*1 Рентабельность, %

*2 1 197 4,9 20 2 254 5,1 22 3 112 6,5 10 4 145 3,7 21 5 176 4,0 25 6 76 2,5 19 В качестве результативного признака возьмем чистую прибыль у. Основные факторы, влияющие на ее формирование: численность населения, обслуживаемого предприятием электросвязи х,, и рентабельность хт Линейная форма зависимости между признаками постулируется, и, следовательно, задача сводится к отысканию параметров уравнения

ух = а0 + в,х, + а2х2.

При линейной форме связи множественный корреляционнорегрессионный анализ проводится на основе информации о средних значениях признаков у, хр х2, их средних квадратических отклонениях а , аг , а и парных коэффициентах корреляции г.,

У ?*! ^2 /I

> г\т

Построим уравнение двухфакторной регрессии в стандартизированном масштабе и рассчитаем показатели тесноты связи (табл. 7.24).

Таблица 7.24

Расчетная таблица для определения параметров уравнения регрессии У *2 А 4 х,х2 ух, ух2 у2 197 4,9 20 24,0 400 98 965 3940 38809 254 5,1 22 26,0 484 112 1295 5588 64516 112 6,5 10 42,3 100 65 728 1120 12544 145 3,7 21 13,7 441 78 537 3045 21025 176 4,0 25 16,0 625 100 704 4400 30976 76 2,5 19 6,3 361 48 190 1444 5776 ЪУ = 5>, = 2>2 = ?х? = Е*22 = ЕХ,Х2 = = Х.ух2 = ?/ = = 960 = 26,7 = 117 = 128,3 = 2411 = 501 = 4419 = 19537 = 173646 Используя итоги расчетной таблицы (см. табл. 7.24) и известные формулы для расчета средних, дисперсий и парных коэффициентов корреляции:

X* 2 2 /-ч2 ху - *У

X = а = х — (х)\ г = ,

п ** схсу

вычислим показатели, необходимые для отыскания р-коэффици- ентов:

у = 160 тыс. руб., оу = 57,8 тыс. руб.;

х, = 4,45 млн чел., а = 1,2513 млн чел.;

*2 = 19,5%, ст^ = 4,6458%;

гу1 = 0,3392, гу2 = 0,5071, г,2 = -0,5806.

Система нормальных уравнений в стандартизированном виде может быть записана так:

0,3392 = 3, - 0,5806р2,

0,5071 = — 0,580бр, + р2.

Решая эту систему, находим: Р, = 0,9558, Р2 = 1,062.

Таким образом, можно записать уравнение регрессии в стандартизированном виде:

ty = 0,95587, + 1,062/г

Коэффициенты при /. показывают, что большее воздействие на чистую прибыль предприятия электросвязи оказывает рентабельность (Р2 > р,). С ее ростом на а при постоянной численности обслуживаемого населения чистая прибыль увеличивается на 1,062 своего среднего квадратического отклонения.

Переход от стандартизированного уравнения регрессии к уравнению регрессии в натуральном масштабе осуществляется по формулам

G

Qj = а0 = у — д,*, - а2х2.

xi

Найдем параметры искомого уравнения:

fli = —Pi = 7^,9553 = 44>15’ а 1,2513

*i

^ - ^ш'-062 ’13-21'

Х2

aQ = у — — а2х2 = 160 - 44,15-4,45 — 13,21-19,5 = —294.

Уравнение зависимости чистой прибыли предприятий электросвязи от численности обслуживаемого населения и рентабельности имеет вид

ух = -294 + 44,15л:, + 13,21хг

Оно показывает, что с ростом численности обслуживаемого населения на 1 млн чел. при исключении влияния второго фактора (рентабельности) чистая прибыль возрастает на 44,15 тыс. руб., а при неизменной численности населения с ростом рентабельности на 1% чистая прибыль повысится на 13,21 тыс. руб.

Коэффициент множественной детерминации для нашего примера окажется равным

К, х„ х2 = fVyi + hryi = °>9558 ' °>3392 + ]’062 ' 0>5071 = °’8627'

Отсюда коэффициент множественной корреляции

- Нм ? = 0>929'

Полученные значения коэффициентов множественной корреляции и детерминации, близкие к 1, свидетельствуют о том, что при построении двухфакторной модели учтены важные факторы увеличения чистой прибыли. При дополнительном включении факторов в анализ (для данного числа предприятий) может увеличиться совокупный коэффициент детерминации и, соответственно, уменьшиться остаточная дисперсия, доля которой в нашем примере мала:

°L= 1 - 0,8627 = 0,1373.

Следовательно, на долю неучтенных факторов приходится не более 13,73% дисперсии результативного признака.

Рассчитаем эластичность по каждому фактору и по их совокупности:

х 4 45 5

= в _1 = 44,15-^- = 1,23, у 160

„ 172 19,5

Э2 = а2~± = 13,21—— = 1,61, у 160

ЪЭ. = 2,84.

У=1

Эластичность по каждому фактору и в целом по совокупности больше 1, значит, чистая прибыль увеличивается в большей степени, чем факторы. С увеличением каждого фактора на 1% следует ожидать увеличения чистой прибыли на 2,84%.

Важный этап в построении моделей множественной регрессии и проведении корреляционно-регрессионного анализа — статистическая оценка точности и надежности параметров корреляции.

Для оценки значимости каждого коэффициента регрессии необходимо рассчитать значение /-критерия Стьюдента (отношение коэффициента регрессии к его средней ошибке):

=

расч

Средняя (стандартная) ошибка коэффициента регрессии может быть найдена приближенно:

где а2 — дисперсия результативного признака; к — число факторных признаков.

Коэффициент регрессии считается статистически з н а ч и - м ы м, если /^асч превышает /табл - табличное (теоретическое) значение /-критерия Стьюдента для заданного уровня значимости а и (п - к — 1) степеней свободы:

Напомним, что подобным образом рассчитывается ^-критерий Стьюдента и для оценки значимости коэффициента парной корреляции:

I Г*\

^расч 1

- г2

yj

где а 1

п - 2

Коэффициент парной корреляции считается значимым, если

* у —к— 1

расч табл

Вывод об адекватности всей модели и правильности выбора формы связи можно проверить с помощью /•’-критерия:

R2 п — к — 1

F

расч 1 - R2 к где R2 — совокупный коэффициент множественной детерминации.

Величина F ъ находится по таблицам (см. Приложение 8) при заданном уровне значимости а и числе степеней свободы v, = к, v2 = п — к — 1.

/-критерий представляет собой соотношение оценок факторной и случайной дисперсий, рассчитанных на одну степень свободы. Число степеней свободы для факторной дисперсии v, = к, для случайной v2 = п — к — 1. Если F ч > -FTa6jI, связь признается существенной.

Если факторных признаков много и число значений каждого из них велико, для корреляционно-регрессионного анализа применяют стандартные статистические программы.

Рассмотрим процедуру вычислений параметров множественной линейной регрессии на примере статистической программы Stadia. В качестве исходных данных вновь используем информацию о предприятиях электросвязи (см. табл. 7.23). Однако теперь возьмем 14 предприятий и количество факторных признаков увеличим до 7.

Для программы Stadia исходную информацию требуется представить в виде матрицы с размерами {к + 1)хл, в которой первые

А:столбцов соответствуют независимым переменным х. (j = 1, к), а (к + 1)-й столбец — результативному признаку (табл. 7.25). При этом каждый столбец содержит п значений факторов. В нашем Исходные данные о предприятиях электросвязи Номер

пред

прия

тия Капи

тали

зация,

млн

руб.

*1 Реали

зация,

тыс.

руб.

*2 Коли

чество

линий,

тыс.

*3 Численность населения, млн чел.

*4 Рента

бель

ность,

%

*5 Цифро-

виза-

ция,

%

*6 Из

нос,

%

*7 Чистая

при

быль,

тыс.

руб.

У 1 10369 2861 4009 8,6 26 11 49 736 2 3823 1006 1827 4,9 20 22 35 197 3 2662 1154 632 5,1 22 17 41 254 4 2328 1088 1192 6,5 10 13 39 112 5 2295 696 618 3,7 21 22 43 145 6 1615 715 569 4,0 25 24 41 176 7 1519 662 563 4,3 8 17 42 50 8 869 408 423 2,5 19 28 39 76 9 845 455 387 2,6 10 15 47 44 10 773 409 443 2,4 20 39 35 81 11 751 343 347 1,6 12 15 45 40 12 730 402 287 1,6 18 28 43 73 13 727 355 330 2,7 11 9 46 41 14 604 380 210 1,1 8 10 37 30 случае к = 7, п = 14, результативным признаком у является чистая прибыль, х,, х2, ..., х7 — факторные признаки.

Подсчет ведется для регрессионной модели

7

Ух = ао + X

М

Результаты расчета получают в следующем виде:

МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ Коэфф. ао а, а2 аз а4 а5 аб а7 Значение -162 0,00937 0,259 -0,000697 -22,4 6,51 -0,572 1,76 Ст. ошиб. 59,7 0,0193 0,0488 0,0294 5,35 1,35 0,882 1,21 Значим. 0,0341 0,646 0,0023 0,98 0,0062 0,0034 0,546 0,196 Множеств. Я Я2 Ст. ошиб. Я Значим. 0,99859 0,99718 14,289 303 0 Гипотеза 1: <Регрессионная модель адекватна экспериментальным данным>

Итак, модель зависимости чистой прибыли для 14 предприятий электросвязи от перечисленных семи факторных признаков согласно результатам вычислений выглядит следующим образом:

ух = -162 + 0,00937*, + 0,259х2 - 0,000697х3 - 22,4х4 +

+ 6,51х5 — 0,572х6 + 1,76ху.

Выбранные признаки практически полностью описывают вариацию результативного фактора, так как совокупный коэффициент множественной детерминации Л2 = 0,99718.

Однако полученная модель слишком громоздка. На практике обычно ограничиваются меньшим количеством наиболее существенных факторов. Отбор этих факторов можно осуществить с помощью процедуры пошаговой регрессии. Сущность этого метода состоит в последовательном включении факторов в уравнение регрессии и последующей проверке их значимости.

На первом этапе рассчитываются парные коэффициенты корреляции, представленные в виде корреляционной матрицы:

КОРРЕЛЯЦИОННАЯ МАТРИЦА Х1 *2 *3 *4 *5 *6 *2 0,982 *з 0,981 0,955 *4 0,851 0,903 0,844 *5 0,533 0,506 0,472 0,412 *6 -0,273 -0,305 -0,251 -0,281 0,455 *7 0,34 0,333 0,272 0,201 -0,012 0,512 У 0,974 0,97 0,931 0,811 0,652 -0,194 Из этой матрицы следует, что факторы х,, х2, х,, х4 мультикол- линеарны, так как их парные коэффициенты корреляции больше 0,8. Для получения адекватной модели необходимо устранить мультиколлинеарность. С этой целью переменные Хр Х2, х3 выводятся из рассмотрения. К остальным переменным применяется процедура пошаговой регрессии.

На первом шаге этой процедуры в модель автоматически вводится переменная х4, так как она имеет наибольший по абсолютной величине коэффициент корреляции с результативным признаком: \г^\ = 0,811.

*** МЕТОД ВКЛЮЧЕНИЯ. Шаг № 1, введена переменная: х4 Коэфф. ао аі Значение -115 71,1 Ст. ошиб. 62 14,8 Значим. 0,0855 0,0006 Множеств. Я Я2 Ст. ошиб. Р Значим. 0,81138 0,65834 111,19 23,1 0 Гипотеза 1: <Регрессионная модель адекватна экспериментальным данным>

Измен. Я8 Р Значим.

0,658 23,1 0,0006

Переменные в уравнении

Перемени. Коэфф, В Ст. ош. В Бета Р Значим.

х4 71,1 14,8 0,811 23,1 0,0006

Переменные не в уравнении Перемени. Коэфф. В Ст. ош. В Бета Р Значим. *5 11 4,46 0,383 6,08 0,0299 х6 0,784 3,97 0,0362 0,039 0,841 *7 8,61 7,18 0,203 1,44 0,255 В результате получаем однофакторную регрессионную модель:

ух = -115 + 71,1х4,

при этом Я2 = 0,65834, т.е. вариацией фактора х4 объясняется 65,8% вариации результативного признака.

Для уточнения модели регрессии на втором шаге в рассмотрение автоматически включается следующая переменная х5 с наибольшим частным коэффициентом корреляции. ** МЕТОД ВКЛЮЧЕНИЯ. Шаг № 2, введена переменная: х5 Коэфф. ао а, аз Значение -245 57,2 11 Ст. ошиб. 74 13,6 4,46 Значим. 0,0069 0,0017 0,0299 Множеств. Я Я2 Ст. ошиб. Р Значим. 0,88319 0,78002 93,185 19,5 0,0004 Гипотеза 1: <Регрессионная модель адекватна экспериментальным данным>

э2

Значим.

0,0299

Р

6,08

Измен. Я 0,122 Переменные в уравнении?

Перемени. Коэфф. х4 57,2 11

-7,61

10,3 Ст. ош. В Бета Р Значим. 13,6 0,653 17,7 0,0017 4,46 0,383 6,08 0,0299 менные не в уравнении Ст. ош. В Бета Р Значим. 3,71 -0,351 4,21 0,065 5,57 0,244 3,45 0,0904 Двухфакторная регрессионная модель имеет вид

ух = -245 + 57,2х4 + 11лг5.

В результате включения дополнительного фактора совокупный множественный коэффициент детерминации Я2 возрос до 0,78002. Увеличение Я2 свидетельствует о целесообразности включения Х5 в модель.

На этом процедура пошаговой регрессии для нашего случая прекращается, поскольку ни одна из оставшихся переменных не обеспечивает заданное минимальное значение /’-критерия. Кроме того, включение оставшихся переменных в уравнение существенно не увеличивает совокупный коэффициент множественной детерминации Я2.

Таким образом, мы получили, что результативный признак для 14 предприятий электросвязи — чистая прибыль — в основном зависит от двух факторов: численности населения, обслуживаемого предприятием х4, и рентабельности ху

<< | >>
Источник: Г.Л. Громыко. Теория статистики: Учебник. — Т11 2-е изд., перераб. и доп. - М.: ИНФРА-М,. - 476 с. — (Классический университетский учебник)., . 2005

Еще по теме 7.8. Множественная корреляция:

  1. 9.6. МНОЖЕСТВЕННАЯ КОРРЕЛЯЦИЯ
  2. 7.4.1. Линейный коэффициент корреляции
  3. 7.4.2. Коэффициенты корреляции рангов
  4. 10.6. КОРРЕЛЯЦИЯ В РЯДАХ ДИНАМИКИ
  5. Коэффициент внутригнездовой корреляции
  6. 8.8. Корреляция рядов динамики
  7. 9.5. КОЭФФИЦИЕНТЫ КОРРЕЛЯЦИИ РАНГОВ
  8. График. (Поле корреляции, диаграмма рассеивания)
  9. 7.5.2. Параболическая корреляция
  10. 7.5.3. Гиперболическая корреляция
  11. 10.7. ТЕХНИКА НА ОСНОВЕ РАНГОВЫХ КОРРЕЛЯЦИЙ
  12. Понятие и признаки множественности преступлений
  13. § 1. ПОНЯТИЕ И ПРИЗНАКИ МНОЖЕСТВЕННОСТИ ПРЕСТУПЛЕНИЙ