<<
>>

7.7. Оценка существенности коэффициента регрессии и уравнения связи

Рассчитанные для ограниченного числа наблюдений параметры уравнения регрессии не являются единственно возможными, строго однозначными, поскольку представляют собой лишь оценку реальных параметров связи в генеральной совокупности.

По этой причине в каждом конкретном случае, найдя по эмпирическим данным параметры (оценки) уравнения регрессии, определяют их среднюю ошибку и с заданной вероятностью пределы, в которых эти параметры могут находиться.

Затем параметры проверяют на существенность (значимость).

Рассмотрим случай линейной зависимости, т.е. ух = а0 + а,х.

Расчет ошибок параметров а0 и а, основан на использовании остаточной дисперсии, характеризующей расхождение (отклоне- ние) между эмпирическими и теоретическими значениями результативного признака.

Средняя ошибка параметра а0

>ч - &Ї- <7'40)

а средняя ошибка параметра т.е. коэффициента регрессии,

ІСУ - Ух?

где а “

К п

Среднюю ошибку параметров а0 и о, можно записать и по- другому, на основе следующих преобразований.

Выразим остаточную дисперсию как разность между общей дисперсией результативного признака и межгрупповой (факторной):

_2 _ _2 я2

а — 0 — о,

ост у фактор

Разделив обе части равенства на а2, получим

о2 ,

ост _ 1 2

а;

Отсюда

= °2у(] ~ /'2)> ИЛИ °осг = ?

Подставив последнее выражение в формулы (7.40) и (7.41), получим

2

о„л/і — г

Ц = у, (7.42)

г2

о„л/і —

Ц. = -- (7-43) 1

ахл/л - 2

Рассчитав среднюю ошибку параметра и задавшись определенной вероятностью, а следовательно, и коэффициентом доверия t, можно определить доверительные интервалы для каждого параметра как а[ ±

Значимость параметра проверяется путем сопоставления его значения со средней ошибкой. Обозначим это соотношение как 7: _ а, ’ II а04п — 2 оу^1 - г2 _ а, арх4п - 2 о^лД - г2 (7.45)

(7.44)

Тогда

По значению 7 (в зависимости от объема наблюдений) и судят

о значимости параметра.

Особенно важно определять значимость параметра при х, т.е.

для коэффициента регрессии (а,), поскольку при этом определяется существенность самого фактора х, влияние его на вариацию результативного показателя (у).

При большом числе наблюдений (п > 30) параметр считается значимым, если > 3.

Если выборка малая, т.е. п < 30, фактическое (расчетное) / сопоставляется с табличным (критическим) 7-критерием Стьюден- та, определяемым для числа степеней свободы V = п — 2 и заданного уровня значимости а (0,05 или 0,01) по Приложению 9.

Если /факт > /табл, то параметр считается значимым.

В примере, приведенном на с. 247-249 (ух = 8,06 + 1,35л:), где п = 40, а, = 1,35, г = 0,6, ах = 1,8 и а = 4,06, средняя ошибка параметра а0 (свободного члена) равна [см. формулу (7.42)]

л/и - 2 л/40 т

/ = — = = 15,4.

14, 0,522

“О

В свою очередь средняя ошибка коэффициента регрессии (а.) будет

_ . 0,29,

о л/я - 2 1,8л/40 - 2

Так как /факт > 3 и для а0, и для ах, делаем вывод о значимости параметров.

В примере, приведенном на с. 244 (ух = —10,24 + 2,12х), где п — 10, для проверки значимости параметра а, = 2,12 фактическое (расчетное) / надо сравнить с табличным.

По данным табл. 7.16 рассчитаем сначала линейный коэффи-

циент корреляции г = а. — и необходимые для него значения а

1 /-г X

и ау по формулам ох = л]х2 - (х)2 и ау = -уу2 — (у)2. Воспользуемся суммами, полученными в табл. 7.16: = 520; ?У = 1000; ^х2 = 35624. Недостающую сумму квадратов игреков определим дополнительно:

]>>2 = 282 + 402 + 382 + 652 + 802 + 1012 + 952 + 1252 +

+ 1832 + 2452 = 142818.

Отсюда х = 52, у = 100, х2 = 3562,4, у2 = 14281,8. Следовательно,

= л/х2 - (х)2 = л/3562,4 - 522 = 29,3,

= Ь2 ~ (Я2 = л/14281,8 - 1002 = 65,4,

откуда

29 3 2

12-^- = 0 95 ’ 65,4 ’

Определим ?фактдля а у

8,6.

2,12-29,3^10 - 2 65,4т/1 - 0,952

а.аг4п - 2 { = —!—* _

0^1 - Г2

Далее по таблице Приложения 9 для числа степеней свободы V = п — 2 = 10 — 2 = 8 и уровня значимости а = 0,05 найдем ?табч= 2,306.

Так как ?факт = 8,6 больше табличного, можно сделать вывод о значимости коэффициента регрессии ау

Наряду с проверкой значимости отдельных параметров осуществляется проверка значимости уравнения регрессии в целом или, что то же самое, проверка адекватности модели.

Эта задача решается путем расчета /’-критерия Фишера и сопоставления его с табличным (критическим), /-"-критерий представляет собой отношение дисперсии теоретических значений результативного признака (факторной дисперсии) к остаточной дисперсии, каждая из которых рассчитана на одну степень свободы:

р= _5Фдкт_0р/(^ ~ ^ (у 46)

о0СТ'(п - т)

где т — число параметров в уравнении регрессии;

(т — 1) — число степеней свободы для факторной дисперсии (теоретических значений у); п — число наблюдений;

(и — т) — число степеней свободы для остаточной дисперсии.

Часто вместо числа параметров уравнения регрессии т принимается число коэффициентов регрессии к, которое на единицу меньше т, т.е. к = т — 1.

В этом случае формула /’-критерия записывается в виде

р ^фактор ^ ^фактор И — к — 1

о2 1(п - к — 1) а2 к

ОСТ 4 ' ОСТ

Не рассчитывая 8|актор и а2ст, порой удобнее пользоваться суммами квадратов соответствующих отклонений:

р= Ъ<УХ~ У? п - к - 1

Хсу, - ух)2 к

Если 5факт и о2ст разделить на общую дисперсию в эмпирическом ряду а2, получим соответственно

52

фактор 2 / 2 - ч

5— = Т| (или г для линеинои связи),

2 а2 — 82

% = -*? = 1 - л2 (или 1 - г2).

°у

Тогда

г г2 п - т г2 п - к - 1 ,п

г = , или г = ~ . (7.47) 1

- г2 т - 1 1 - г2 к '

Расчетное /’сопоставляется с табличным (критическим), определяемым для числа степеней свободы V, = т — 1 и у2 = п — т и заданного уровня значимости а. Если /грасч > Р1абл, уравнение значимо.

Проверим на значимость рассмотренное ранее уравнение регрессии ух = —10,24 + 2,\2х, для которого г= 0,95, п = 10, т = 2. Для данного уравнения

р = ? °’952 10 ~ 2 = 74 расч 1 - 0,952 2 -1

Находим табличное / (см. Приложение 8). Для а = 0,05, V, = 1 и У2 = 8 получаем /*табл = 5,32. Так как > /’та6л, то уравнение значимо.

<< | >>
Источник: Г.Л. Громыко. Теория статистики: Учебник. — Т11 2-е изд., перераб. и доп. - М.: ИНФРА-М,. - 476 с. — (Классический университетский учебник)., . 2005

Еще по теме 7.7. Оценка существенности коэффициента регрессии и уравнения связи:

  1. 6.1. Оценка стоимости предприятия с использованием метода дисконтированного поступления наличности
  2. РАЗРАБОТКА ПАРАМЕТРИЧЕСКОЙ ОЦЕНКИ
  3. 4.4.2.Обработка и оценка результатов экспериментов
  4. 1. Статистика
  5. 8.2. ПРОВЕРКА ГИПОТЕЗЫ О ПРИНАДЛЕЖНОСТИ «ВЫДЕЛЯЮЩИХСЯ» НАБЛЮДЕНИЙ ИССЛЕДУЕМОЙ ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ
  6. 9.3. УРАВНЕНИЕ РЕГРЕССИИ
  7. 9.4. ИЗМЕРЕНИЕ ТЕСНОТЫ КОРРЕЛЯЦИОННОЙ СВЯЗИ МЕЖДУ ДВУМЯ ПРИЗНАКАМИ
  8. 9.6. МНОЖЕСТВЕННАЯ КОРРЕЛЯЦИЯ
  9. 10.4. ВЫЯВЛЕНИЕ ОСНОВНОЙ ТЕНДЕНЦИИ РАЗВИТИЯ ОБЩЕСТВЕННЫХ ЯВЛЕНИИ (СГЛАЖИВАНИЕ И ВЫРАВНИВАНИЕ РЯДОВ ДИНАМИКИ)
  10. 10.6. КОРРЕЛЯЦИЯ В РЯДАХ ДИНАМИКИ
  11. 7.4.1. Линейный коэффициент корреляции
  12. 7.4.3. Коэффициент конкордации
  13. 7.5. Нахождение уравнений регрессии между двумя признаками
  14. 7.5.1. Парная линейная регрессия
  15. 7.5.3. Гиперболическая корреляция
  16. 7.7. Оценка существенности коэффициента регрессии и уравнения связи