<<
>>

7.5.1. Парная линейная регрессия

Линейная зависимость — наиболее часто используемая форма связи между двумя коррелируемыми признаками, и выражается она, как указывалось ранее, при парной корреляции уравнением прямой:

ух = а0 + ахх. (7.27)

Гипотеза именно о линейной зависимости между х и у выдвигается в том случае, если значения результативного и факторного признаков возрастают (или убывают) одинаково, примерно в арифметической прогрессии.

Параметры aQ и а, отыскиваются по МНК следующим образом.

Согласно требованию МНК при линейной зависимости в формуле (7.26) вместо ух записываем его конкретное выражение: aQ + ахх. Тогда

S = ?(у — ?o — а\х)2 m'n-

Дальнейшее решение сводится к задаче на экстремум, т.е. к определению того, при каком значении aQ и ах функция двух переменных S может достигнуть минимума.

Как известно, для этого надо найти частные производные S по а0 и а]; приравнять их к нулю и после элементарных преобразований решить систему двух уравнений с двумя неизвестными.

В соответствии с изложенным найдем частные производные

?f^- = 2Х(У - ао ~ ?i*)(-l) = О,

. Ч

= 2Х(У - ао ~ а1*)(-*) = о.

Сократив каждое уравнение на —2, раскрыв скобки и перенеся члены с х в одну сторону, асу - в другую, получим

\пап + а,Ух = У.у,

0 2 V (7'28>

[а02,х + а^х = 2.ху.

Эта система называется системой нормальных уравнений МНК для линейного уравнения регрессии.

Для решения системы (7.28) по эмпирическим данным определяем число единиц наблюдения п, сумму значений факторного признака ?х, сумму их квадратов ^х2, а также сумму значений результативного признака ^у и сумму произведений

Подставив все эти суммы в систему нормальных уравнений, найдем параметры искомой прямой (линейного уравнения регрессии).

При этом указанные суммы можно определить двумя способами: •

по данным о значениях х и у каждой единицы совокупности

(по списку); •

по сгруппированным данным, представленным в виде корреляционной или иной таблицы.

Расчет параметров уравнения регрессии по индивидуальным данным

Рассмотрим расчет параметров уравнения регрессии между стоимостью основных фондов х и валовым выпуском продукции у по данным табл.

7.1, которые были использованы при расчете коэффициента Фехнера (см. подпараграф 7.2.1).

Исходные данные и расчет необходимых сумм показаны в табл. 7.16.

Предположим, что зависимость между показателями х и у линейная, т.е. ух = а0 + ахх. Параметры а0 и а, этого уравнения найдем, решив систему нормальных уравнений (7.28). Подставив в нее необходимые суммы, рассчитанные в табл. 7.16, получим

|Юа0 + 520а, = 1000,

[520а0 + 35624а, = 70244.

Решив последнюю систему уравнений, найдем, что я0 = —10,24, а, = 2,12. Отсюда искомое уравнение регрессии у по х будет

ух = -10,24 + 2,12х. Расчетная таблица для определения параметров уравнения регрессии по индивидуальным данным Основные фонды, млн руб.

X Валовой выпуск продукции, млн руб.

У х2 ху ?Ух =

= -10,24 + + 2,12х 12 28 144 336 15 16 40 256 640 24 25 38 625 950 43 38 65 1444 2470 70 43 80 1849 3440 81 55 101 3025 5555 106 60 95 3600 5700 117 80 125 6400 10000 159 91 183 8281 16653 183 100 245 10000 24500 202 1х = 520 Ъу = 1000 Ех2 = 35624 Ъху = 70244 Иух = 1000 Подставляя в данное уравнение последовательно значения х (12, 16, 25 и т.д.), находим теоретические (выравненные) значения результативного признака, т.е. ух, которые показывают, каким теоретически должен быть средний объем валового выпуска продукции при данной стоимости основных фондов х. (при прочих равных условиях для всех предприятий). Теоретические значения результативного признака ух приведены в последней графе табл. 7.16 (с округлением до целых).

Для нахождения а0 и а, при линейной зависимости могут быть предложены готовые формулы.

Так, на основе определителей 2-го порядка из системы нормальных уравнений (7.28) получим

, <а>-х*?> (7 29)

' »1* - ?*Е*

Формулу (7.29) для а{ можно представить и по-иному. Если в системе нормальных уравнений каждое уравнение разделить на п, получим

\а0 + ахх = у,

[а0х + а}х2 — ху.

Отсюда

_ ху - ху _ ху - ху

а, - = 5 , (7.30)

х2 - (х)2 а!

а0 = у - а,х. (7.31)

В рассматриваемом примере найдем параметр а] по формуле (7.29):

= 10-70244 - 520-1000 й] 10-35624 - 520-520 ’ '

_ _ _ х* _ 520 _ 1000

Рассчитав х - - —— =52 и у = —— = 100, легко

п 10 10

найти а0:

а0 = у - д, х = 100 - 2,12 • 52 = -10,24, т.е.

результат, как и следовало ожидать, тот же.

Параметр ах, т.е. коэффициент при х, в уравнении линейной регрессии называется коэффициентом регрессии.

Коэффициент регрессии показывает, на сколько (в абсолютном выражении) изменяется значение результативного признака у при изменении факторного признака х на единицу.

Наряду с коэффициентом регрессии в экономическом анализе часто используется показатель эластичности изменения результативного признака относительно факторного.

Коэффициент эластичности Э показывает, на сколько процентов изменяется в среднем результативный признак у при изменении факторного признака х на 1%. Обычно Э рассчитывают как отношение прироста (в %) результативного признака к приросту (в %) факторного признака.

Более точно коэффициент эластичности определяют на основе уравнений регрессии:

э = (7.32)

Эх ух

Эу

где —2- — первая производная уравнения регрессии у по х.

Эх

Коэффициент эластичности для большинства форм связи — величина переменная, т.е. изменяется с изменением значений фактора х. Так, для линейной зависимости ух = а0 + а^х Э = а. . ? (7.33) 1

а0 + а^х

Применительно к рассмотренному уравнению регрессии, выражающему зависимость объема валового выпуска от стоимости

основных фондов (ух = —10,24 + 2,12.x), коэффициент эластичности

э = - 2Л2* .

-10,24 + 2,12х

Подставляя в данное выражение разные значения х, получаем и разные значения Э. Так, например, при х = 50 коэффициент эластичности Э = 1,11, а при х = 80 соответственно Э = 1,09 и т.д. Это значит, что при увеличении основных фондов х с 50 до 50,5 млн руб., т.е. на 1%, валовой выпуску возрастет в среднем на 1,11% прежнего уровня; при увеличении х с 80 до 80,8 млн руб., т.е. на 1%, у возрастет на 1,09% и т.д.

Расчет параметров уравнения регрессии по сгруппированным данным

Когда наблюдение ведется над большим числом пар значений х и у, то, как указывалось ранее, данные удобнее располагать в виде аналитической или корреляционной таблицы, где указаны распределения по х и по у и, соответственно, их частоты / и /у.

При этом Х/с = Х/^ = п — общее число наблюдений.

При составлении и решении системы нормальных уравнений в этих случаях все суммы значений х и у, их произведений должны учитываться вместе с их весом, а именно:

\паа + я,Х*/х = Ъу/у,

{«о1*Л + а^х2/х = Тху/ху.

Рассмотрим расчет сумм, необходимых для решения данной системы при работе с корреляционной таблицей, на примере табл. 7.3, где приведено условное распределение 40 единиц по признакам х и у. В табл. 7.17 воспроизведены исходные условные данные и расчет необходимых сумм в дополнительных графах и строках.

Итак, п = 40 (Х/с = Х/^ = п), Xх/х = 176, Х*2/А. = 904’ Ъу/у = 560, X У% = 8500, X ху/ху = 2640.

Расчетная таблица для нахождения параметров уравнения регрессии по сгруппированным данным X 5 10 15 20 Итого / ХУ/х> 1 1 3 — — 4 4 4 35 3 2 3 7 — 12 36 108 435 5 — 3 9 4 16 80 400 1225 7 — — 5 3 8 56 392 945 Итого / 3 9 21 7 40 176 904 2640 У/у 15 90 315 140 ?у/у = 560 У% 75 900 4725 2800 Еу2/у = 8500 По заголовкам дополнительных граф (и строк) очевиден способ расчета указанных произведений и их сумм в таблице. Возможно, следует пояснить расчет 1хУ/ху- Эту величину можно вычислить по-разному. В табл. 7.17 сначала по каждой строке были найдены произведения, а затем их общая сумма. Так, по первой строке хУ/ху = 1 • 5 • 1 + 1 ? 10 • 3 = 35, по второй строке хУ/ху = 3-5-2 + 3-10-3 + 3-15-7 = 435 и т.д.

Подставим полученные суммы в систему:

Г40а0 + 176^ = 560,

[176а0 + 904а, = 2640.

Решив систему, находим параметры: а0 = 8,06; д, = 1,35. Отсюда искомое уравнение

ух = 8,06 + 1,35л:.

По данным корреляционной таблицы легко рассчитать и линейный коэффициент корреляции, в частности по формуле

ху — ху г = ,

а о

X у

где <зх и оу — соответственно среднее квадратическое отклонение в ряду х и в ряду у.

Из табл. 7.17 находим: —

2640 176 , , _ 560 = Ь2 - (У)2 = л/^12,5 - 142 = 4,06.

Отсюда

66-4,4-14

' = І.8Л06“ = °’6’

т.е.

между х и у связь средняя (умеренная).

Сопряженные уравнения

Часто зависимость между коррелируемыми показателями х и у такова, что каждый из них можно рассматривать в качестве и факторного, и результативного признака. Такими показателями, например, могут быть производительность и оплата труда.

Если первый показатель обозначить х, а второй — у, то уравнение регрессии можно записать и как у по х, т.е. ух, и как х по у, т.е. х В случае линейной зависимости это будет соответственно

ух = а0 + а,х и х = д' + а\у. Такие уравнения называются сопряженными.

При линейной зависимости между х и у коэффициенты корреляции для каждого из сопряженных уравнений можно записать соответственно как

ах ,°У

Гу!х а\ 0 ’ Гх!у а\ а • у х

Значения этих коэффициентов равны, т.е. гу/х = гх/у, параметры же сопряженных уравнений, естественно, не одинаковы. Однако, зная уравнение регрессии у по х (ух = д0 + ахх) и такие показатели, как х, у и г, при необходимости можно легко записать сопряженное уравнение, т.е. х по у (ху = а'0 + а\у).

Как определить параметры д'0 и а\1 Из записанных выше формул гу!х и гх!у нетрудно заметить, что квадрат линейного коэффициента корреляции равен произведению коэффициентов регрессии сопряженных уравнений, т.е. г2 = аха\. Отсюда, зная коэффициент регрессии одного уравнения и значение коэффициента корреляции между х и у (г), легко определить коэффициент регрессии сопряженного уравнения. Так, по уравнению ух = 8,06 + 1,35х, полученному по данным табл. 7.17, и зная, что при этом г = 0,6, можно определить а\ = г1!ах = 0,36/1,35 = 0,266. Затем, зная, что х = 4,4 и у =14, определяем а'0 = х - а\ у = 4,4 - 0,266 • 14 = 0,676. Отсюда искомое сопряженное уравнение регрессии х по у будет х = 0,676 + + 0,266у. Однако надо иметь в виду, что указанный метод расчета параметров сопряженного уравнения регрессии применим лишь при предположении, что оба уравнения линейные.

<< | >>
Источник: Г.Л. Громыко. Теория статистики: Учебник. — Т11 2-е изд., перераб. и доп. - М.: ИНФРА-М,. - 476 с. — (Классический университетский учебник)., . 2005

Еще по теме 7.5.1. Парная линейная регрессия:

  1. 3.1. Подготовка информации для проведения краткосрочного управленческого анализа
  2. 4.4. Методы планирования персонала
  3. 1. Статистика
  4. 9.3. УРАВНЕНИЕ РЕГРЕССИИ
  5. 9.4. ИЗМЕРЕНИЕ ТЕСНОТЫ КОРРЕЛЯЦИОННОЙ СВЯЗИ МЕЖДУ ДВУМЯ ПРИЗНАКАМИ
  6. 7.4.1. Линейный коэффициент корреляции
  7. 7.5. Нахождение уравнений регрессии между двумя признаками
  8. 7.5.1. Парная линейная регрессия
  9. 7.5.3. Гиперболическая корреляция
  10. 7.7. Оценка существенности коэффициента регрессии и уравнения связи
  11. 7.8. Множественная корреляция
  12. 8.7. Автокорреляция в рядах динамики
  13. Зависимая переменная и ее вариация
  14. 4 Результаты статистического анализа
  15. 1. Статистика
  16. 4.4. Методы планирования персонала
  17. 3.1. Подготовка информации для проведения краткосрочного управленческого анализа
  18. Раздел 3 ОСВОЕНИЕ РЕСУРСОВ РАЙОНА
  19. § 3. Парная линейная корреляция