<<
>>

8.7. Автокорреляция в рядах динамики

Во многих рядах динамики можно наблюдать зависимость /-го уровня yt от предшествующих yt_г Например, численность населения за определенный год зависит (при прочих равных условиях) от численности в предшествующие годы; то же можно сказать и о поголовье скота, численность которого в каждый год зависит от численности поголовья в предшествующие годы; урожайность сельскохозяйственных культур в отдельные годы также может быть связана с урожайностью в предшествующие периоды и т.д.

Зависимость между последовательными (соседними) уровнями ряда динамики называется в статистике автокорреляцией.

Исследование рядов на автокорреляцию — одна из частных, но важных задач при статистическом изучении рядов динамики. В частности, если установлено наличие автокорреляции, то эту зависимость можно выразить уравнением авторегрессии. В отдельных случаях приходится устранять влияние автокорреляции на взаимосвязь между исследуемыми показателями. Так возникает необходимость измерения автокорреляции.

Измерить автокорреляцию между уровнями ряда можно с помощью коэффициента автокорреляции г , исчисляемого по формуле парного линейного коэффициента корреляции

ху - ху

г =

G-G,

Коэффициент автокорреляции га можно рассчитывать либо между соседними уровнями, либо между уровнями, сдвинутыми на любое число единиц времени т. Этот сдвиг, именуемый временным лагом, определяет порядок коэффициента автокорреляции: 1-го порядка при т-1, т.е. между соседними уровнями; 2-го порядка при т = 2, т.е. при сдвиге уровней на два периода, и т.д.

Рассмотрим коэффициент автокорреляции 1-го порядка.

Если исходные фактические уровни ряда, относящиеся к определенному моменту времени (или периоду) /, обозначить через у, то сдвинутые уровни (в зависимости от направления сдвига) соответственно обозначают у!+, или ]. Тогда формулу коэффициента автокорреляции можно записать в двух вариантах:

г = Мл±1—M+L- (8.22)

а а

У, У'+1

г = Мы—(8,23)

а о о

у, У,-1

Мы отдаем предпочтение формуле (8.23), поэтому все дальнейшие рассуждения и расчеты будут связаны с ней. Нетрудно представить, что при достаточно большом числе уровней ряда п значения средних уровней и средних квадратических отклонений у исходного и сдвинутого рядов практически совпадают, т.е.

У' = у,_х и ст = о .

или тождественную ей

х2

Используя эти равенства и отдавая предпочтение средней у, и дисперсии о2 , рассчитанным для всех п членов исходного ряда, получим приближенную формулу коэффициента автокорреляции

^ = ^ 2 ? (8-25) 1

~п(У,)

Ъу2-п{у,)2

Чтобы иметь возможность пользоваться формулами (8.24) и (8.25) для коротких рядов, у которых первый и последний уровни отличаются незначительно, сдвинутый (укороченный) ряд условно дополняют, принимая ух = уп (чтобы сдвинутый ряд не укорачивался и чтобы средний уровень и дисперсия одного ряда были соответственно равны среднему уровню и дисперсии второго ряда).

Рассмотрим расчет коэффициента автокорреляции на примере.

Пример. Предположим, известны данные о поголовье коров в одном из регионов. Исходные данные и расчет необходимых величин для подстановки в формулы (8.24) и (8.25) приведены в табл. 8.29 (дополненные данные в сдвинутом ряду взяты в скобки).

Таблица 8.29

Расчет величин для определения коэффициента автокорреляции 1

-го порядка Год Поголовье коров на начало года, тыс. голов (фактические уровни)

У, Уровни, сдвинутые на один год

У!-\ У,У,-\ >>,2 1993 4,2 (5,3) 22,26 17,64 1994 4,0 4,2 16,80 16,00 1995 4,3 4,0 17,20 18,49 1996 4,2 4,3 18,06 17,64 1997 4,3 4,2 18,06 18,49 1998 4,4 4,3 18,92 19,36 1999 4,5 4,4 19,80 20,25 2000 4,8 4,5 21,60 23,04 2001 5,0 4,8 24,00 25,00 2002 5,3 5,0 26,50 28,09 X 45,0 45,0 203,20 204,0 По итоговым данным табл. 8.29 находим:

45 т т 204

у' = То = 4,5; = 4,5 = 20’25; у> = 20,4; —

угух 2

°2у, = У? ~(У,)2 = 20,4-20,25 = 0,15; = 20,32.

Подставляя полученные значения в формулу (8.24), имеем

г = = 20,32-20,25 =

с2 0,15 ’ '

Тот же результат получим и по формуле (8.25):

Г = IУгУ,^ ~п(У,)2 = 203,2-10-4,52 = 0 ^ I

у)-п{у,? 204-10-4,52

Найденное значение коэффициента автокорреляции само по себе еще не говорит о наличии или отсутствии автокорреляции. Его необходимо сравнить с критическим.

Существуют специальные таблицы, в которых для разного числа членов ряда п и разных уровней значимости а определена критическая область проверяемой нулевой гипотезы (об отсутствии автокорреляции между уровнями ряда).

Одна из таких таблиц, составленная Р. Андерсоном, приведена в Приложении 7.

Фактическое значение коэффициента автокорреляции га сравнивается с табличным (критическим) при 5- или 1-процентном уровне значимости. Если фактическое (расчетное) значение га меньше табличного, то гипотеза об отсутствии автокорреляции в ряду может быть принята. Если же фактическое значение г больше табличного, то нулевая гипотеза отвергается и делается вывод о наличии автокорреляции.

Сравним рассчитанное в нашем примере значение коэффициента автокорреляции га = 0,47 с табличным при 5-процентном уровне значимости. По таблице Приложения 7 находим, что для л =10 при а = 0,05 критическое значение коэффициента автокорреляции равно 0,360. Так как рассчитанное нами значение г (0,47) больше табличного (0,360), то с вероятностью Р= 0,95 (Р= 1 — а) можно сделать вывод о наличии автокорреляции в исследуемом ряду (хотя с вероятностью 0,99 такой вывод сделать нельзя, поскольку для а = 0,01 критическое значение коэффициента корреляции равно 0,525).

(При отрицательном коэффициенте автокорреляции фактическое и табличное значения сравниваются по модулю.) Часто приходится решать вопрос о наличии или отсутствии автокорреляции не между уровнями ряда, а между их отклонениями от тренда или от среднего уровня, т.е. между так называемыми остаточными величинами. Сумма таких остаточных величин и средняя из них равны нулю.

Из формулы (8.25) видно, что для рядов, у которых средний уровень равен нулю (у =0), коэффициент автокорреляции примет следующий вид:

г

X У? '

Поскольку обычно через у обозначают уровни ряда, то во избежание путаницы в обозначениях для остаточных величин предпочтительнее использовать символ е(. Тогда формула коэффициента автокорреляции для остаточных величин примет вид X е,е,_

г =

(8.26)

1=7

п

Хе?

/=| Кроме показателя га [см. формулу (8.26)], для обнаружения автокорреляции между соседними остаточными величинами часто используется критерий, разработанный Дурбиным и Ватсоном (в иной транскрипции Дарбиным и Уотсоном) и носящий их имена.

Критерий Дурбина — Ватсона, обозначаемый как с! (иногда ОИ7), рассчитывается по формуле

(8.27)

(=1

Этот показатель можно связать с формулой (8.26) коэффициента автокорреляции для остаточных величин. Так, если предпо-

я л

дожить, что X = X е,_1> т0> возведя в квадрат числитель крите- 1=2 1=2 рия с{, можно записать X еЛ-

1=7

2(1- гЛ) = 2-2га.

1 -

Хе?

Г=1

2Х е, -2Х е,е,_ а = ,=2.

п ,-2

Хе2

Г = 1

Очевидно, что если автокорреляция отсутствует, т.е. = 0, то с1= 2. Если же имеет место полная автокорреляция, т.е. га равен 1 или —1, то значение й будет соответственно 0 или 4.

Более точное суждение об отсутствии автокорреляции в остаточных величинах е, дает таблица, в которой для разного числа наблюдений п и числа независимых переменных в уравнении регрессии V определены верхние й2 и нижние с1х критические границы критерия й. Такая таблица приведена в Приложении 5.

Для проверки нулевой гипотезы об отсутствии автокорреляции в остаточных величинах рассчитанное фактическое значение с1 сравнивается с табличными и й2. 1)

если с1 > ё2 (до 4 — й2), гипотеза об отсутствии автокорреляции принимается; 2)

если с1 < с1 р гипотеза об отсутствии автокорреляции отвергается; 3)

если йх < й < с12 или (4 - с12) < с1 < (4 - с?,), ничего определенного сказать нельзя и требуется дальнейшее исследование (например, уточнение уравнения тренда, увеличение числа наблюдений и пр.); 4)

если ё > (4 — о',), имеет место отрицательная автокорреляция.

Для иллюстрации расчета критерия Дурбина — Ватсона с1, а также г& воспользуемся данными табл. 8.15 (о производстве мяса в России).

На основе фактических и выравненных уровней рассчитаем остаточные величины ?, = у, — У, и проверим их на автокорреляцию. Все расчеты показаны в табл. 8.30.

Таблица 8.30

Расчет величин для исчисления коэффициента автокорреляции га и критерия Дурбина - Ватсона с/ Год Производство мяса, млн т У, Вырав

ненные

уровни

У, Остаточные величины

Е' = У'-У' е,-| е,Е,-1 1991 9,4 9,28 0,12 — — 0,0144 — 1992 8,3 8,43 -0,13 0,12 -0,0156 0,0169 0,0625 1993 7,5 7,58 -0,08 -0,13 0,0104 0,0064 0,0025 1994 6,8 6,73 0,07 -0,08 -0,0056 0,0049 0,0225 1995 5,9 5,88 0,02 0,07 0,0014 0,0004 0,0025 ? 37,9 37,90 0 -0,0094 0,0430 0,0900 При аналитическом выравнивании рядов динамики остаточные величины проверяются на автокорреляцию.

Цель проверки — определить адекватность подобранной функции (линии тренда), используемой для отражения тенденции развития в исследуемый период. Если в остаточных величинах обнаруживается автокорреляция, это признак неадекватности выбранного уравнения тренда.

Итак, коэффициент автокорреляции для г1 по данным табл. 8.30

П

= = -00094 =

‘ и °'043

м

Далее обращаемся к таблице Приложения 7 и находим, что для п = 5 и а = 0,05 критическое значение отрицательного коэффициента автокорреляции равно -0,753. Так как рассчитанное фактическое значение г (по модулю) меньше критического (0,218 < 0,753), делаем вывод об отсутствии автокорреляции в остаточных величинах.

Рассчитаем для этой же цели критерий Дурбина — Ватсона:

X (е/ — е/-]) п по

ё = ^т = 2,09.

" 2 0,043

Xе/

/=1

Полученное значение ё близко к 2, что свидетельствует об отсутствии автокорреляции в остаточных величинах.

К такому же выводу придем, обратившись к таблице Приложения 5. Она начинается с п — 15, но все, что относится к п = 15, может быть использовано и для п < 15. Поскольку в нашем примере для выравнивания использовалась линейная функция с одной переменной ?, то в таблице Приложения 5 находим значение с12 в графе, где V = 1. Для п = 15 верхняя граница с12 = 1,36. Рассчитанное же нами й = 2,09. Так как с! > с12 (и не превосходит величину 4 — с12 = 2,64), гипотеза об отсутствии автокорреляции в остаточных величинах принимается, чем подтверждается и адекватность уравнения тренда.

Нахождение уравнения авторегрессии

В рядах динамики, в которых обнаружена автокорреляция между уровнями ряда, каждый уровень у можно рассматривать как функцию предыдущих значений уровней. Уравнение, выражающее эту зависимость, называется уравнением авторегрессии.

Наиболее простой формой зависимости между соседними уровнями ряда может служить линейная функция, выраженная уравнением

у\ = а0 + а,у(_,. (8.28)

Уравнение регрессии, которое связывает исходные уровни ряда с теми же уровнями, сдвинутыми на определенный лаг, определяется по общим правилам регрессионного анализа.

Параметры уравнения авторегрессии (8.28) с лагом в один год находим, решая систему нормальных уравнений

Г па0 + а^У,_х = 1УГ Ь>5>м + а^-\ = 2>Л-г

При этом следует иметь в виду, что поскольку сдвинутый ряд у(_] содержит на один уровень меньше, чем исходный ряд, то все расчеты сумм необходимо проводить для одного и того же числа членов ряда, а именно для (п — 1).

Продолжим рассмотрение примера, приведенного в табл.

8.29, и найдем для него уравнение авторегрессии. Скорректировав с учетом сдвига итоговые данные, рассчитанные в табл. 8.29, получим следующие значения величин, необходимых для решения системы нормальных уравнений:

п = 9; =40,8; 5>,_,=39,7; 1у2_, = 175,91; 5>,у,_, = 180,94.

Подставив их в систему уравнений, получим

Г 9 а0 + 39,7а, = 40,8,

[39,7а0 + 175,91а, = 180,94,

откуда находим а0 = —0,87 и а, = 1,225.

Таким образом, авторегрессионная модель будет иметь вид

у' = -0,87 + 1,225у,_г

Подставляя в найденное уравнение значения уровней у(_]г находим у', т.е. теоретическое поголовье коров для каждого года на основе данных за предыдущий год (табл. 8.31).

Из табл. 8.31 видно, что начиная с 1997 г. теоретические уровни, рассчитанные по авторегрессионной модели 1-го порядка, практически совпадают с фактическими уровнями, т.е. найденное линейное уравнение достаточно хорошо отражает характер зависимости между последовательными уровнями ряда. Год Поголовье коров, тыс. голов Год Поголовье коров, тыс. голов фактическое

У, теоретическое

у. фактическое

У, теоретическое

у; 1993 4,2 — 1998 4,4 4,4 1994 4,0 4,3 1999 4,5 4,5 1995 4,3 4,0 2000 4,8 4,6 1996 4,2 4,4 2001 5,0 5,0 1997 4,3 4,3 2002 5,3 5,3 Более сложной формой линейной авторегрессионной зависимости будет такая, при которой значение уровня в каждый момент т.е. у', характеризуется зависимостью одновременно от нескольких предшествующих уровней, т.е.

у! =/(У,_Р У,-2’ Уг-и).

или

у; = а0 + ахУ)_х + а2у(_2 + ... + ату,_т, где т — число уровней ряда, включенных в уравнение в качестве переменных и определяющих порядок авторегрессии.

Авторегрессионные модели различного порядка можно оценить с помощью остаточных дисперсий, рассчитываемых между фактическими и теоретическими уровнями, исчисленными по уравнениям авторегрессии разного порядка. Предпочтение следует отдать уравнению авторегрессии с таким числом т, при котором остаточная дисперсия минимальна.

<< | >>
Источник: Г.Л. Громыко. Теория статистики: Учебник. — Т11 2-е изд., перераб. и доп. - М.: ИНФРА-М,. - 476 с. — (Классический университетский учебник)., . 2005

Еще по теме 8.7. Автокорреляция в рядах динамики:

  1. Глйва 7. Ряды динамики
  2. 7.1. Сущность и виды рядов динамики Характеристика и классификация динамических рядов
  3. 7.2. Аналитические показатели ряда динамики
  4. 7.3. Средние показатели ряда динамики
  5. 7.4. Графическое изображение рядов динамики Диаграммы
  6. Расчет индексов сезонности в рядах динамики с тенденцией развития (к переменной средней)
  7. ГЛАВА 10 РЯДЫ ДИНАМИКИ
  8. 10.1. ВИДЫ РЯДОВ ДИНАМИКИ, ИХ ПОСТРОЕНИЕ, ГРАФИЧЕСКОЕ ИЗОБРАЖЕНИЕ
  9. 10.2. ПОКАЗАТЕЛИ РЯДА ДИНАМИКИ
  10. 10.3. СРЕДНИЕ ХАРАКТЕРИСТИКИ РЯДА ДИНАМИКИ
  11. 10.4. ВЫЯВЛЕНИЕ ОСНОВНОЙ ТЕНДЕНЦИИ РАЗВИТИЯ ОБЩЕСТВЕННЫХ ЯВЛЕНИИ (СГЛАЖИВАНИЕ И ВЫРАВНИВАНИЕ РЯДОВ ДИНАМИКИ)
  12. 10.6. КОРРЕЛЯЦИЯ В РЯДАХ ДИНАМИКИ
  13. Глава 8 АНАЛИЗ РЯДОВ ДИНАМИКИ
  14. Понятие о рядах динамики. Их виды
  15. Сопоставимость уровней и смыкание рядов динамики