<<
>>

8.5. Методы выявления основной тенденции (тренда) в рядах динамики

Как уже отмечалось, уровни ряда динамики формируются под влиянием взаимодействия многих факторов, одни из которых, будучи основными, главными, определяют закономерность, тенденцию развития, другие — случайные — вызывают колебания уровней.

Можно сказать, что динамика ряда включает три компоненты: •

долговременное движение (так называемый тренд); •

кратковременное систематическое движение (например, сезонные колебания); •

несистематическое случайное движение, вызывающее колебания уровней относительно тренда.

Изучая ряды динамики, исследователи пытаются разделить эти компоненты и выявить основную закономерность развития явления в отдельные периоды, т.е. выявить общую тенденцию в изменении уровней рядов, освобожденную от действия случайных факторов. С этой целью (устранить колебания, вызванные случайными причинами) ряды динамики подвергают обработке.

Существует несколько методов обработки рядов динамики, помогающих выявить основную тенденцию изменения уровней ряда, а именно: метод укрупнения интервалов, метод скользящей средней и аналитическое выравнивание. Во всех методах вместо фактических уровней при обработке ряда рассчитываются иные (расчетные) уровни, в которых тем или иным способом взаимо- погашается действие случайных факторов и тем самым уменьшается колеблемость уровней. Последние в результате становятся как бы «выравненными», «сглаженными» по отношению к исходным фактическим данным. Такие методы обработки рядов называются сглаживанием или выравниванием рядов динамики.

Метод укрупнения интервалов

Простейший метод сглаживания уровней ряда — укрупнение интервалов, для которых определяется итоговое значение или средняя величина исследуемого показателя. Этот метод особенно эффективен, если первоначальные уровни ряда относятся к коротким промежуткам времени. Например, если имеются данные

о ежесуточной погрузке грузов по какой-либо железной дороге за месяц, то, естественно, в таком ряду возможны значительные колебания уровней, так как чем меньше период, за который приводятся данные, тем больше влияние случайных факторов.

Чтобы устранить это влияние, рекомендуется укрупнить интервалы времени, например до 5 или 10 дней, и для этих укрупненных интервалов рассчитать общий или среднесуточный объем погрузок (соответственно по пятидневкам или декадам).

В ряду с укрупненными интервалами времени закономерность изменения уровней будет более наглядной.

Пусть, например, имеются следующие данные о выпуске продукции на предприятии по месяцам за год (в сопоставимых ценах): Месяц 1 2 3 4 5 6 7 8 9 10 11 12 Выпуск продукции, млн руб. 5,1 5,4 5,2 5,3 5,6 5,8 5,6 5,9 6,1 6,0 5,9 6,2 Укрупним интервалы до трех месяцев и рассчитаем суммарный и среднемесячный выпуск продукции по кварталам. Новые данные будут выглядеть следующим образом: Квартал Выпуск продукции, млн руб. общий среднемесячный I 15,7 5,23 II 16,7 5,57 III 17,6 5,87 IV 18,1 6,03 Очевидно, что новые данные более четко выражают закономерность изменения выпуска продукции за год — увеличение из квартала в квартал.

Метод скользящей средней

По сути метод скользящей средней несколько схож с предыдущим, но в данном случае фактические уровни заменяются средними уровнями, рассчитанными для последовательно подвижных (скользящих) укрупненных интервалов, охватывающих т уровней ряда.

Например, если принять т = 3, то сначала рассчитывается средняя величина из первых трех уровней, затем находится средняя величина из второго, третьего и четвертого уровней, потом из третьего, четвертого и пятого и т.д., т.е. каждый раз в сумме трех уровней появляется один новый уровень, а два остаются прежними. Это и обусловливает взаимопогашение случайных колебаний в средних уровнях. Рассчитанные из т членов скользящие средние относятся к середине (центру) каждого рассматриваемого интервала.

Рассмотрим данный метод сглаживания на конкретном примере, характеризующем динамику выпуска продукции за 12 месяцев на одном из предприятий (табл. 8.12). Сглаживание будем осуществлять по трем членам (уровням).

Таблица 8.12

Расчет скользящей средней по трем членам Месяц Выпуск продукции, тыс. ед. Скользящая сумма трех уровней Скользящая средняя из трех уровней Январь 82 — — Февраль 79 246 82,0 Март 85 244 81,3 Апрель 80 243 81,0 Май 78 234 78,0 Июнь 76 226 75,3 Июль 72 226 75,3 Август 78 218 72,7 Сентябрь 68 216 72,0 Октябрь 70 212 70,7 Ноябрь 74 210 70,0 Декабрь 66 — — Сглаженный ряд (см.

последнюю графу табл. 8.12) более наглядно показывает тенденцию к снижению уровней из месяца в месяц, которая в исходном ряду несколько затушевывалась скачкообразными колебаниями уровней. Эффект сглаживания, устраняющего колебания уровней за счет случайных причин, хорошо виден также при графическом изображении фактических и сглаженных уровней (рис. 8.6).

Сглаживание методом скользящей средней можно проводить по любому числу членов т, но удобнее, если т — нечетное число, так как в этом случае скользящая средняя сразу относится к конкретной временной точке — середине (центру) интервала. Если же и - четное, то скользящая средняя относится к промежутку между временными точками: например, при сглаживании по четырем членам средняя из первых четырех уровней будет находить-

\

\

о

а.

О

8

9 10 И 12

2 3 4 5 6 7

Месяцы

Рис. 8.6. Динамика выпуска продукции за год

ся между второй и третьей датой, следующая средняя - между третьей и четвертой и т.д. Тогда, чтобы сглаженные уровни относились непосредственно к конкретным временным точкам (датам), из каждой пары смежных промежуточных значений скользящих средних находят среднюю арифметическую, которую и относят к определенной дате (периоду). Такой прием двойного расчета сглаженных уровней называется центрированием.

Недостатком метода скользящей средней является то, что сглаженный ряд «укорачивается» по сравнению с фактическим с двух концов: при нечетном т на (т — 1)/2 с каждого конца, а при четном — на т/2 с каждого конца. Применяя этот метод, надо помнить, что он сглаживает (устраняет) лишь случайные колебания. Если же, например, ряд содержит сезонную волну, она сохранится и после сглаживания методом скользящей средней.

Кроме того, этот метод сглаживания, как и укрупнение интервалов, является механическим, эмпирическим и не позволяет выразить общую тенденцию изменения уровней в виде математической модели.

Аналитическое выравнивание

Более совершенный метод обработки рядов динамики в целях устранения случайных колебаний и выявления тренда — выравнивание уровней ряда по аналитическим формулам (или аналитическое выравнивание).

Суть аналитического выравнивания заключается в замене эмпирических (фактических) уровней у. теоретическими уг которые рассчитаны по определенному уравнению, принятому за математическую модель тренда, где теоретические уровни рассматриваются как функция времени: у( = /(?)•

При этом каждый фактический уровень у. рассматривается как сумма двух составляющих: у. =/(0 + е;, где /(/) = у, — систематическая составляющая, отражающая тренд и выраженная определенным уравнением, а — случайная величина, вызывающая колебания уровней вокруг тренда.

Задача аналитического выравнивания сводится к следующему: •

определение на основе фактических данных вида (формы) гипотетической функции у, =/(/), способной наиболее адекватно отразить тенденцию развития исследуемого показателя; •

нахождение по эмпирическим данным параметров указанной функции (уравнения); •

расчет по найденному уравнению теоретических (выравненных) уровней.

В аналитическом выравнивании наиболее часто используются следующие простейшие функции: •

линейная (прямая): у1 = ай + а^\ •

показательная: у, = а0а[;

а\ •

гиперболическая: у, — о0+—; •

парабола 2-го (или более высокого) порядка: у, = а0+а^ + + а/\

т •

ряд Фурье: У' = ай + '5_1(аксо$1с1 + Ькых\Ш).

к=1

Здесь у, — теоретические (выравненные) уровни (читается: «игрек, выравненный по /»), г1 — условное обозначение времени (1, 2, 3, ...), а0, а,, а2 — параметры аналитической функции, к — число гармоник (при выравнивании по ряду Фурье).

Выбор той или иной функции для выравнивания ряда динамики осуществляется, как правило, на основании графического изображения эмпирических данных, дополняемого содержательным анализом особенностей развития исследуемого показателя (явления) и специфики разных функций, их возможности отразить те или иные нюансы развития. Определенную вспомогательную роль при выборе аналитической функции играют также механические приемы сглаживания (укрупнение интервалов и метод скользящей средней).

Частично устраняя случайные колебания, они по- могают более точно определить тренд и выбрать адекватную модель (уравнение) для аналитического выравнивания.

Кроме того, в результате многолетнего опыта использования аналитического выравнивания рядов динамики наработаны некоторые правила или, вернее, условия использования перечисленных простых уравнений, которыми полезно руководствоваться при выборе функции. 1.

Так, выравнивание по прямой линии (линейной функции) у, = а0 + о, / эффективно для рядов, уровни которых изменяются примерно в арифметической прогрессии, т.е. когда первые разности уровней (абсолютные приросты) А = у! — у._, более или менее постоянны. 2.

Если вторые разности уровней (ускорения) более или менее постоянны, то такое развитие хорошо описывается параболой 2-го порядка у, = а0 + а^ +а2Г2. Если постоянны п-с разности уровней, можно использовать параболу и-го порядка у, = = а0 + а,/ + я2/2 + ... + ап?", позволяющую «улавливать» перегибы, изломы в кривой, смену направлений изменения уровней. Парабола 2-го порядка отражает развитие с ускоренным или замедленным изменением уровней ряда. 3.

Если при последовательном расположении / (меняющемся в арифметической прогрессии) значения уровней меняются в геометрической прогрессии, т.е. цепные коэффициенты роста примерно постоянны, то такое развитие можно отразить показательной функцией у, = о()а|. 4.

Если обнаружено замедленное снижение уровней ряда, которые по логике не могут снизиться до нуля, для описания ха-

а,

рактера тренда выбирают гиперболу вида у, = а0 + — и т.д.

Если по тем или иным причинам уровни эмпирического ряда трудно математически описать одной функцией, следует разбить исследуемый период на отдельные части и затем выровнять каждую часть по соответствующей кривой.

Нередко один и тот же эмпирический ряд можно выровнять по разным аналитическим формулам (например, по линейной функции и гиперболе или по линейной и показательной функции) и получить при этом довольно близкие результаты.

Чтобы решить вопрос о том, использование какой кривой дает лучший результат, обычно сопоставляют суммы квадратов отклонений эмпирических уровней от теоретических, рассчитанных по разным функциям, т.е. Х(У~У,)2- Та функция, при которой эта сумма квадратов меньше, считается более адекватной, приемлемой. Однако сравнивать непосредственно суммы квадратов отклонений можно в том случае, если сравниваемые уравнения имеют одинаковое число параметров. Если же число параметров т разное, то каждую сумму квадратов делят на разность (п — т), выступающую в роли числа степеней свободы, и сравнивают уже квадраты отклонений уровней, рассчитанные на одну степень свободы (т.е. остаточные дисперсии на одну степень свободы).

Параметры искомых уравнений при аналитическом выравнивании могут быть определены по-разному. Чаще всего их определяют, решая систему нормальных уравнений, полученных методом наименьших квадратов. Но возможны и другие приемы.

Рассмотрим выравнивание рядов динамики по некоторым аналитическим функциям и методы определения их параметров.

Выравнивание по линейной функции у{ = а{) +й,/. Воспользуемся данными о производстве мяса в России за 1991—1995 гг. (табл. 8.13) и попытаемся определить закономерность изменения уровней в данном периоде в виде уравнения тренда, т.е. осуществим аналитическое выравнивание ряда.

Таблица 8.13

Производство мяса в России за 1991—1995 гг. Год 1991 1992 1993 1994 1995 Итого Условное обозначение года 1 1 2 3 4 5 Производство мяса у, млн т 9,4 8,3 7,5 6,8 5,9 2> = = 37,9 Поскольку в данном ряду уровни меняются примерно в арифметической прогрессии, есть все основания принять уравнение тренда в виде линейной функции. Наша задача — определить параметры а0 и ах искомого уравнения по эмпирическим данным.

Существует несколько методов определения параметров гипотетической линейной функции тренда. Рассмотрим их в порядке возрастания сложности. 1.

Самым простым является метод составления и решения системы двух уравнений по значениям двух конкретных уровней ряда. Используем его в нашем примере (см. табл. 8.13). Так, ведя отсчет времени от первого года (1991), обозначим условно все временные точки через 7 и придадим им значения 1, 2, 3, 4, 5. Взяв любые два значения уровней, можно по этим двум точкам построить уравнение прямой (как бы провести прямую через две точки)

Уг = °о+в1*-

Например, если взять первый и четвертый уровни, т.е. 1991 и 1994 гг., для которых ? соответственно равно 1 и 4, а уровни — 9,4 и 6,8, можно записать следующую систему:

|с0 + ахЛ = 9,4,

|а0 + а, • 4 = 6,8.

Решая эту систему, находим, что ах =—0,87, а а0= 10,27. Отсюда искомое уравнение тренда будет у( = 10,27 — 0,87?. Это приближенная модель тренда. Подставляя в уравнение значения I = 1, 2, 3, 4, 5, получаем выравненные (теоретические) значения уровней:

У\ = 9,4; У2 = 8,53; у3 = 7,66; у4 = 6,79; У5 = 5,92.

Этот метод отыскания параметров прост, но он не дает однозначного ответа. Если взять значения других двух уровней, то параметры уравнения будут несколько иные. Так, если взять второй и пятый уровни, получим систему уравнений

|а0 +2 а, = 8,3,

[гз0 -(-5ЙГ, = 5,9.

Решив эту систему, получим уравнение тренда у = 9,9 — 0,8/, в соответствии с которым теоретические уровни будут иметь следующие значения, несколько отличающиеся от полученных выше при / = 1 и < = 4:

у, = 9,1; у2 = 8,3; у3 = 7,5; у4 = 6,7; у5 = 5,9.

Кроме того, сумма выравненных уровней и в первом и во втором случае расчета по двум точкам не совпадает с суммой эмпирических значений. Чтобы значения параметров были меньше подвержены случайностям, можно усреднить параметры двух уравнений, найденные по разным парам точек. Тогда в нашем примере а0 = (10,27 + 9,9)/2 = 10,085 и а] = [-0,87 + (—0,8)]/2 = = —0,835, а уравнение тренда с усредненными параметрами у, = 10,085 — 0,835?, по которому теоретические уровни будут иметь следующие значения:

У\ = 9,25; у 2 = 8,415; у3 = 7,58; у4 = 6,745; у5 = 5,91. 2.

Другой метод нахождения параметров линейного тренда заключается в следующем: эмпирический ряд разбивают на две части (желательно равные) и для каждой из них определяют суммарные значения уровней и времени. При этом выдвигается требование, чтобы суммы эмпирических и теоретических (выравненных) уровней были равны или, что одно и то же, чтобы сумма отклонений фактических уровней от теоретических, рассматриваемых как средние, была равна нулю, т.е.

КУ-У,) = Х(у-а0-а,О = О,

где у — эмпирические (фактические) уровни; у, = а0 + а^ — теоретические уровни.

Раскрыв скобку и перенеся в правую часть равенства ^у, получим ий0 + = 2>.

Рассчитав такие суммарные показатели для двух частей исследуемого ряда, получим систему двух уравнений, решение которой и даст параметры искомого уравнения тренда.

Применим этот метод к нашему примеру (см. табл. 8.13).

Разобьем ряд на две части: 1) 1991—1993 гг.; 2) 1994—1995 гг.

Для первой части =1 + 2 + 3 = 6, для второй = 4 + + 5 = 9. Соответственно, для первой части ^\У = 9,4 + 8,3 + 7,5 = = 25,2, для второй Х2у = 6,8 + 5,9 = 12,7.

Таким образом, можно записать

(За0 +6 ах = 25,2,

|2й0+9а1 = 12,7.

Решив эту систему, находим: а0 = 10,04 и а, = —0,82.

Отсюда уравнение тренда

У, = 10,04 - 0,82/.

Подставив в уравнение значения / = 1, 2, 3, 4, 5, получим теоретические (выравненные) уровни:

р, = 9,22; у 2 = 8,4; у3 = 7,58; у4 = 6,76; у5 = 5,94,

сумма которых (?у( = 37,9) совпадает с суммой эмпирических уровней, что не наблюдалось, когда уравнение строилось по двум уровням (точкам). Во всех найденных уравнениях а, (коэффициент при 0 характеризует средний годовой абсолютный прирост (в данном случае убыль) производства мяса. И хотя значения ах несколько отличаются в отдельных уровнях, полученных при выборе разных точек (периодов), все они близки к —0,8 млн т. 3.

Наиболее распространенный метод нахождения параметров аналитического уравнения при выравнивании рядов динамики — метод наименьших квадратов (МНК) (см. подпараграф 7.5.1). При этом методе учитываются все эмпирические уровни и должна обеспечиваться минимальная сумма квадратов отклонений

эмпирических значений уровней у от теоретических у,, т.е.

Х(у-.Р,)2-> min.

В частности, при выравнивании по прямой вида у, = а() + aft параметры а0 и а, определяются путем решения системы нормальных уравнений, полученной методом наименьших квадратов (с заменой х на О,

\naQ + а JLt =

|a02> + aj^l2 =

где п — количество уровней ряда;

t — порядковый номер в условном обозначении периода или момента времени; у — уровни эмпирического ряда.

Определим этим методом (МНК) параметры линейного тренда в рассматриваемом примере (см. табл. 8.13), для чего исходные данные и все расчеты необходимых сумм представим в табл. 8.14.

Таблица 8.14 Расчет теоретических уровней линейного тренда Год Производство мяса, млн т

У Условное

обозна

чение

времени

t /2 yt Выравненные (теоретические) уровни

У, = Ю,13 - - 0,85? (у - у,)2 1991 9,4 1 1 9,4 9,28 0,0144 1992 8,3 2 4 16,6 8,43 0,0169 1993 7,5 3 9 22,5 7,58 0,0064 1994 6,8 4 16 27,2 6,73 0,0049 1995 5,9 5 25 29,5 5,88 0,0004 /7=5 Ъу = 37,9 YJ = 15 II

<4-

W II I» =

= 105,2 2$ = = 37,9 ЕС' - у,)2 =

= 0,0430 Приняв в качестве гипотетической функции теоретических уровней прямую у, = а0 + аопределим параметры последней, для чего решим систему нормальных уравнений, в которую подставлены найденные в итоговой (последней) строке табл. 8.14 суммы:

|5а0 + 150,= 37,9,

|l5o0 + 55а, = 105,2.

Решение этой системы возможно любыми известными читателю способами. Существуют готовые формулы для а, и а{)\

п = f?yt-'Lt'Zy = 'Zy'Lt2 -'LtJ.yt 1 л1/2-(102’ 0 nZ'2-(I02 '

Для а0 есть еще более простой расчет:

Ту Т /

ап = у-ал, или ап = а,—. (8.6)

I и п ' п

В нашем примере

5 105,2-15-37,9 п ос 37,9 ,ЛОСЧ15 а. = = = -0,85, ап = — (-0,85)-— = 10,13. 1

5-55-15 0 5 5

Отсюда искомое уравнение тренда

у, = 10,13 - 0,85/. (8.7)

Подставляя в полученное уравнение значения /=1,2, 3, 4, 5, определяем теоретические уровни (см. предпоследнюю графу табл. 8.14).

Сравнивая значения эмпирических и теоретических (выравненных) уровней, видим, что они очень близки, т.е. можно сказать, что найденное уравнение весьма удачно характеризует основную тенденцию изменения уровней именно как линейную функцию. Об этом свидетельствует и сумма квадратов отклонений у от у, (см. последнюю графу табл. 8.14), на основе которой рассчитывается среднее квадратическое отклонение от тренда

1(У~У,)2 ,

а _ (где т _ число параметров в уравнении тренда),

\ п—т

используемое для оценки адекватности подобранной линии тренда.

Система нормальных уравнений и, соответственно, расчет параметров а0 и о, упрощаются, если отсчет времени ведется от середины ряда. Например, при нечетном числе уровней серединная точка (год, месяц) принимается за нуль. Тогда предшествующие периоды обозначаются соответственно —1, —2, —3 и т.д., а следующие за средним (центральным) — соответственно 1, 2, 3 и т.д.

При четном числе уровней два серединных момента (периода) времени обозначают —1 и +1, а все последующие и предыдущие, соответственно, через два интервала: ±3, +5, +7 и т.д.

При таком порядке отсчета времени (от середины ряда) ?/ = О, поэтому система нормальных уравнений упрощается до следующих двух уравнений, каждое из которых решается самостоятельно:

_ V Ху

пао Ху =* ао ,

ТУ, <8-8>

«,І>2 = ІУ( => «, =

Используем этот прием выравнивания для нашего примера (табл. 8.15).

Таблица 8.15

Расчет теоретических уровней (при счете времени от середины ряда) Год Производство мяса, млн т У /2 У‘ Выравненные уровни уг = 7,58 — 0,85/ 1991 9,4 -2 4 -18,8 9,28 1992 8,3 -1 1 -8,3 8,43 1993 7,5 0 0 0 7,58 1994 6,8 1 1 6,8 6,73 1995 5,9 2 4 11,8 5,88 ? 37,9 0 10 -8,5 37,90 Подставив найденные суммы в указанные уравнения, получим (с учетом того, что п = 5):

37 9

5 а0 = 37,9 => а0 = -у- = 7,58,

10а, = - 8,5 => о, = -0,85.

Отсюда искомое уравнение тренда

у, = 7,58 - 0,85/. (8.7а)

В последней графе табл. 8.15 приведены теоретические уровни, рассчитанные по уравнению (8.7а) (путем подстановки в него значений / = —2, —1, 0, 1, 2). Они полностью совпадают с теоретическими уровнями, рассчитанными в табл. 8.14 по уравнению (8.7).

Коэффициент регрессии в уравнениях (8.7) и (8.7а), естественно, имеет одинаковое значение (а, = — 0,85) и характеризует среднее годовое изменение (уменьшение) производства мяса в России за период 1991 — 1995 гг. В то же время параметр а0 (свободный член) различен, поскольку отсчет ведется от разного периода. Поэтому каждый раз, записывая уравнение тренда, необходимо указывать, от какой временной точки ведется счет.

Рассмотрим пример упрощенного решения системы уравнений при четном числе уровней. В табл. 8.16 приведены исходные данные о производстве яиц в России за 1996—2001 гг. и расчет показателей, необходимых для определения параметров уравнения тренда в форме линейной функции у, = а0 + д

Таблица 8.16

Выравнивание ряда динамики по линейной функции (при счете времени от середины ряда и четном числе уровней) Год Производство яиц, млрд шт.

У I г2 У1 Выравненные уровни у, = 33,2 + 0,32/ 1996 31,9 -5 25 -159,5 31,6 1997 32,2 -3 9 -96,6 32,2 1998 32,7 -1 1 -32,7 32,9 1999 33,1 1 1 33,1 33,5 2000 34,1 3 9 102,3 34,2 2001 35,2 5 25 176,0 34,8 п = 6 = 199,2 м

о =

= 70 2> = = 22,6 ЕР, = 199,2 Поскольку ]?/ = 0, то для нахождения параметров а0 и а] используем формулы (8.8):

_ _ 199,2 _ _ 22,6

й° п 6 ’ И °х X/2 70

Отсюда искомое уравнение тренда

у, = 33,2 + 0,32/.

Подставляя в данное уравнение значения 1= —5, —3, —1, 1, 3, 5, получаем теоретические значения уровней (см. последнюю графу табл. 8.16).

Выравнивание по показательной функции у1 = а{)а[. Как уже отмечалось, выравнивание по показательной функции проводится, в основном, когда уровни ряда меняются в геометрической прогрессии, т.е. цепные коэффициенты роста более или менее постоянны.

Нетрудно заметить, что логарифм показательной функции представляет собой линейную функцию 1ёу! = + Поэтому, если заменить уровни ряда их логарифмами, параметры а0 и а{ можно определить (через их логарифмы), решая следующую систему нормальных уравнений, полученную методом наименьших квадратов:

(8.9)

пЧай +

1ёя0Х? + ]ёаЁ(2 = Х^ёУ

или при счете от середины ряда (когда = 0)

\n\ga0 = Л\ёу,

I, (8Л°)

Откуда

= Х^ёУ „ . „ = Х^ёУ п И 'ёй| -?(2 '

Рассмотрим выравнивание по показательной функции на условном примере, характеризующем численность населения одного из городов России за 1996—2002 гг. (табл. 8.17).

Таблица 8.17 Выравнивание уровней ряда по показательной функции Год Численность населения на 1 января, тыс. чел.

У ЫУ ,2 ^ёУ 'е У, Вырав

ненные

уровни

У, 1996 108,3 2,0346 -3 9 -6,1038 2,0362 108,6 1997 111,8 2,0484 -2 4 -4,0968 2,0482 111,8 1998 115,1 2,0611 -1 1 -2,0611 2,0602 114,9 1999 118,5 2,0737 0 0 0 2,0722 118,1 2000 121,7 2,0853 1 1 2,0853 2,0842 121,4 2001 124,7 2,0955 2 4 4,1910 2,0962 124,8 2002 128,0 2,1072 3 9 6,3216 2,1082 128,3 п = 7 1^ = У = Е/ = о Е'2 = Е/1 ёУ = 218 Я = М

II = 828,1 = 14,5058 = 28 = 0,3362 = 14,5054 = 827,9 Логарифмируя уровни ряда у и ведя счет от середины ряда, рассчитываем в табл. 8.17 все необходимые суммы, на основе которых определяются сначала логарифмы параметров а0 и а,, а затем и сами параметры уравнения тренда:

?lg у 14,5058 lgaQ = = —-— = 2,0722, отсюда а0 = 118;

X'lgy 0,3362 пло

lg я, = 2 = — = 0,012, отсюда а. = 1,028.

2^t 2.6

Следовательно,

lg у, = 2,0722 + 0,012/, а искомое уравнение

у, = 118 ? 1,028'.

Для расчета выравненных уровней удобнее пользоваться формулой логарифмов, т.е. lgi', = 2,0722 + 0,012/. Подставляя в эту формулу значения / = —3, —2, —1,0, 1,2, 3, находим lgi',, а затем по таблицам логарифмов у,.

Так, для 1996 г.

lg у, = 2,0722 + 0,012(—3) = 2,0362, отсюда у, = 108,6; для 1997 г.

lg у, = 2,0722 + 0,012(—2) = 2,0482 , отсюда у, = 111,8 и т.д.

Логарифмы выравненных уровней и сами уровни приведены в двух последних графах табл. 8.17. Судя по тому, что эмпирические уровни у весьма близки к теоретическим у,, можно сделать вывод

о том, что показательная функция подходит для отражения данного тренда.

При выравнивании по показательной функции значение параметра а, практически характеризует средний темп роста исследуемого показателя в рассматриваемый период. Так, в нашем примере я, = 1,028 означает, что численность населения города за 1996-2002 гг. увеличивалась ежегодно в среднем в 1,028 раза (или, если перевести в проценты и вычесть 100%, можно сказать, что средний годовой темп прироста населения за указанный период составлял 2,8%).

Выравнивание по параболе 2-го порядка у, = а0 + a}t+ а/. Парабола 2-го порядка как уравнение тренда может быть использована для выравнивания таких рядов, уровни которых сначала возрастают, а затем снижаются (или наоборот), или в рядах, где вторые разности уровней примерно постоянны. Обычно при этом ориентируются по графическому изображению эмпирических данных.

Параметры искомого уравнения тренда а0, ах и а2 определяют, решая систему нормальных уравнений, полученных методом наименьших квадратов:

иа0+а,Х/ + й25>19 = ]•>,

' а^ + а^Р+а^Р = (8.11)

а^2 + а^Р +а2^ = ^у(2

или при счете от середины ряда (когда = 0) па0+а2

' = Ъуи (8-12)

а0Х?2+й2Х^4 = 1>2.

Выравнивание по параболе 2-го порядка проиллюстрируем на примере данных о числе незанятых граждан России, состоявших на учете в службах занятости в первой половине 1996 г. Исходные данные и расчет показателей, необходимых для решения системы нормальных уравнений (8.12), приведены в табл. 8.18.

Таблица 8.18

Выравнивание ряда динамики по параболе 2-го порядка (при счете времени от середины ряда) Месяц Число незанятых в 1996 г. на конец месяца, млн чел.

У I1 /4 У! уг2 Выравненные уровни

У, = 3,01 + +0,018? — - 0,009/2 Январь 2,70 -5 25 625 -13,50 67,50 2,70 Февраль 2,87 -3 9 81 -8,61 25,83 2,88 Март 2,97 -1 1 1 -2,97 2,97 2,98 Апрель 3,06 1 1 1 3,06 3,06 3,02 Май 2,97 3 9 81 8,91 26,73 2,98 Июнь 2,87 5 25 625 14,35 71,75 2,88 п = 6 2у = Ег = Е?2 = 1'4 = ЬУ,= = 17,44 = 0 = 70 = 1414 = 1,24 = 197,84 = 17,44 Подставляем в систему (8.12) полученные в табл. 8.18 итоговые показатели:

6о0+70а2 = 17,44,

70о, = 1,24, 70а0+1414а2 = 197,84.

1,24

70

Отсюда

0,018.

Решая совместно первое и третье уравнения системы, находим а2 - -0,009 и а0 = 3,01.

Следовательно, искомое уравнение тренда

у, = 3,01 + 0,018/-0,009Г\

Подставляя в него значения / = —5, —3, —1, 1, 3, 5, определяем теоретические (выравненные) уровни (см. последнюю графу табл. 8.18). Сравнивая их с эмпирическими уровнями, отмечаем, что они почти полностью совпадают, т.е. парабола 2-го порядка — вполне адекватная функция для отражения основной тенденции (тренда) изменения уровней за исследуемый период, что подтверждает и рис. 8.7.

ч

^ -5 1

у 3,1

х

ч

^ 3,0

?2,9

г

я

2 2,8

Парабола 2-го порядка может иметь и иной вид. Так, если значения уровней сначала убывают, а затем возрастают, то вместо выпуклости кривая будет иметь вогнутость. Рассмотрим выравнивание по такой кривой данных о добыче угля в России за 1995—2001 гг. Исходные данные и расчет показателей, необходимых для решения системы нормальных уравнений (8.12), приведены в табл. 8.19.

Таблица 8.19

Выравнивание ряда динамики по параболе 2-го порядка (при счете времени от середины ряда) Год Добыча угля, млн т У t /2 Г4 yt yt2 Выравненные

уровни

я = 241,6 + + /+ З/2 1995 263 -3 9 81 -789 2367 265,6 1996 257 -2 4 16 -514 1028 251,6 1997 245 -1 1 1 -245 245 243,6 1998 232 0 0 0 0 0 241,6 1999 250 1 1 1 250 250 245,6 2000 258 2 4 16 516 1032 255,6 2001 270 3 9 81 810 2430 271,6 п = 7 2> = Е/ = ?/2 = Xt4 = Zyt = M

V:

II М

II = 1775 = 0 = 28 = 196 = 28 = 7352 = 1775,2 Подставляем в систему (8.12) полученные в табл. 8.19 итоговые показатели:

7я0+28а2 = 1775,

? 28а, = 28,

28с0+196а2 = 7352.

Решив систему, имеем ах = 1, а2 = 3, а0 = 241,57 ~ 241,6. Следовательно, искомое уравнение тренда добычи угля в России за 1995—2001 гг. (при отсчете времени от середины ряда) составило —

241,6 + / + 3?2.

Подставляя в него значения (= —3, —2, —1, 0, 1, 2, 3, находим теоретические (выравненные) уровни (см. последнюю графу табл. 8.19). На рис. 8.8 приведены фактические и выравненные уровни добычи угля в России за 1995—2001 гг. 270 --

^ / Выравненные уровни

*? 260 ?? s

S„ 250 ??

R

5

240 --

« 240 -

| 230 -

220 -- 1995 1996 1997 1998 1999 2000 2001 Годы

Рис. 8.8. Фактические и выравненные уровни

добычи угля в России за 1995-2001 гг.

Выравнивание по гиперболе yt = а0 + а, -. Гипербола как урав-

нение тренда может быть использована для выравнивания таких рядов, уровни которых сначала резко снижаются, а затем это снижение замедляется.

па0+а= Л у,

Параметры искомого уравнения в виде гиперболы, т.е. а0 и а,, определяем, решая следующую систему нормальных уравнений, полученных методом наименьших квадратов:

(8.13)

В качестве примера выравнивания по гиперболе могут быть использованы приводимые в табл. 8.20 данные о производстве шерсти (в физическом весе) в России за период 1995—2001 гг. Учитывая характер изменения уровней ряда, выдвигаем гипо-

тезу о гиперболическом тренде у, — а0+а,у. Необходимые для 1

ГО2

решения системы уравнений (8.13) суммы Х~> X ~ , Х)',

рассчитаны в табл. 8.20. Подставляя их в систему (8.13), получаем

7 aQ + 2,59а, = 399,

2,59а0 + 1,5099а, = 184,2. Выравнивание данных о производстве шерсти в России по гиперболе Год Производство шерсти, млн т У 1

/ (Я У

1 Выравненные

уровни

У, = 32,5 + _1_ 66,3 / 1995 93 1 1,00 1,0000 93,0 98,8 1996 77 2 0,50 0,2500 38,5 65,5 1997 61 3 0,33 0,1089 20,3 54,5 1998 48 4 0,25 0,0625 12,0 49,0 1999 40 5 0,20 0,0400 8,0 45,8 2000 40 6 0,17 0,0289 6,7 43,5 2001 40 7 0,14 0,0196 5,7 42,0 п = 7 Ъу = 399 ^7 =

= 2,59 -

= 1,5099 *7“

= 184,2 ЪУ, = 399,2 Решив систему, имеем а0 тренда

32,5 и а, = 66,3. Отсюда уравнение 66,3

У, = 32,5 +

ґ

Подставляя в данное уравнение значения / = 1, 2, 3, 4, 5, 6, 7, определяем теоретические (выравненные) уровни ряда. Они показаны в последней графе табл. 8.20 и на рис. 8.9. (Расхождение между Хуи на ОД вызвано округлениями при расчетах параметров а0 и и самих у(.)

120 ??

(по гиперболе)

э

о

й

н

и

§

а

м

8

О

О.

С

60

40

20

1995 1996 1997 1998 1999 2000 2001 Годы

Рис. 8.9. Динамика производства шерсти в России Выравнивание с помощью ряда Фурье. Особое место в аналитическом выравнивании динамических рядов занимает выравнивание с помощью ряда Фурье, в котором уровни можно выразить как функцию времени следующим уравнением:

т

У, — aQ + X (akcoskt + bksinkt). (8.14)

к=\

Выравнивание по формуле (8.14) рекомендуется проводить в тех случаях, когда в эмпирическом ряду наблюдается периодичность изменения уровней. В этом случае периодические колебания уровней динамического ряда можно представить в виде синусоидальных колебаний. Поскольку последние представляют собой гармонические колебания, то синусоиды, полученные при выравнивании по ряду Фурье, называют гармониками различных порядков. Показатель к в уравнении (8.14) определяет число гармоник. Обычно при выравнивании по ряду Фурье рассчитывают несколько гармоник (чаще не более 4) и затем уже определяют, с каким числом гармоник ряд Фурье наилучшим образом отражает изменения уровней ряда.

При выравнивании по ряду Фурье периодические колебания уровней динамического ряда представлены в виде суммы нескольких синусоид (гармоник), наложенных друг на друга.

Так, при к = 1 ряд Фурье будет иметь вид

у, = aQ + ах cos / + й, sin t, а при к = 2, соответственно,

у, = а0 + о, cos t + bx sin t + a2 cos 2t + b2 sin 21

и т.д.

Параметры уравнения теоретических уровней, определяемого рядом Фурье, находят, как и в других случаях, методом наименьших квадратов. Приведем без вывода формулы, используемые для исчисления параметров ряда Фурье:

„ = Ъ1. п = 2Х-У cos 22>sinfr

4 к ’к (8.15)

и п К п К п

Последовательные значения / обычно определяются от 0 с увеличением (приростом), равным ——, где п — число уровней эмпи-

п

рического ряда. Например, при п = 10 временные точки / можно записать следующим образом:

2л 2л 2л 2л 2л 2л 2л 2 л 2л

То1; То "ш ш'4; То Тоб; То То Ш'9-

или (после сокращения)

тс 2л Зл 4л 6л 7л 8л 9л

’ У’ Т’ Т’ Т’ к’ Т’ Т’ Т’ Т'

При п = 12 значения t, соответственно, будут

л л л 2л 5л 7л 4л Зл 5л 11л

’ 6' У’ Г Т: ~б ’ п’ Т: Т: Т: Т; “б”'

Значения sin kt и cos kt удобно расположить в таблице. Например, в табл. 8.21 приведены значения sin kt и cos kt (k = 1 и k = 2) для n = 12.

Выравнивание по ряду Фурье часто дает хорошие результаты в рядах, содержащих сезонную волну.

Проиллюстрируем выравнивание по ряду Фурье на условном примере данных о продаже зимней одежды в одном из районов в 2002 г. В табл. 8.22 приведены исходные данные (графы 1—3) и расчет показателей, необходимых для получения уравнений первой и второй гармоник (k = 1 и к = 2). Итак,

„ = = 552 = 0

п 12 ’

_ 25>cos/ _ $>cos? _ -66,24 _ п 6 6

2$>sin/ $>sin> 34,43 ПЛ

Ь{ 5,74.

п 6 6

Отсюда

1У, — 46 — 11,04cos t + 5,74sin t.

Подставляя в данное уравнение значения cos t и sin t (из табл. 8.21), получаем теоретические значения объема продажи зимней одежды по месяцам, показанные в графе 6 табл. 8.22. Как видно, теоретические значения J/t, рассчитанные по уравнению первой гармоники, заметно отличаются от эмпирических у. Поэтому попытаемся определить уравнение второй гармоники, т.е.

2у, = а0 + ах cos / + ft, sin f + a2 cos 21 + ft2sin 2t. Значения sin kt и cos kt (для n = 12) 1 cos ? cos 21 sin t sin 21 0 1 1 0 0 п/6 0,866 0,5 0,5 0,866 я/3 0,5 -0,5 0,866 0,866 п/2 0 -1 1 0 2я/3 -0,5 -0,5 0,866 -0,866 5я/6 -0,866 0,5 0,5 -0,866 я -1 1 0 0 7я/6 -0,866 0,5 -0,5 0,866 4я/3 -0,5 -0,5 —0,866 0,866 Зтс/2 0 -1 -1 0 5я/3 0,5 -0,5 -0,866 -0,866 11 я/6 0,866 0,5 -0,5 -0,866 Таблица 8.22

Выравнивание по ряду Фурье Месяц t Продано зимней одежды, тыс. руб.

У у cos 1 у sin t i У, у cos 21 у sin It 2 У, 1 2 3 4 5 6 1 8 9 1 0 37 37,0 0 35 37 0 37,9 2 к/6 40 34,64 20,0 39,3 20 34,64 39,6 3 я/3 44 22,0 38,1 45,5 -22 38,1 43,0 4 тс/2 52 0 52,0 51,7 -52 0 43,8 5 2я/3 46 -23,0 39,84 56,5 -23 -39,84 56,2 6 5я/6 70 -60,62 35,0 58,4 35 -60,6 61,0 7 я 60 -60,0 0 57,0 60 0 59,9 8 7я/6 48 -41,57 -24,0 52,7 24 41,57 53,0 9 4я/3 46 -23,0 -39,84 46,5 -23 39,84 44,0 10 Зл/2 38 0 -38,0 39,3 -38 0 36,4 11 5я/3 36 18,0 -31,17 35,5 — 18 -31,18 35,2 12 11я/6 35 30,31 — 17,5 33,6 17,5 -30,31 36,2 n = 12 ? 552 -66,24 34,43 551,0 17,5 -7,78 551,2 Расчеты, необходимые для нахождения параметров а2 и Ь2, также приведены в табл. 8.22.

Итак,

'Zycos2t 17,5 t ?>>sin2r -7,78 = —— - — = 2,9; Ь2 - - - Отсюда уравнение второй гармоники 2у, = 46 — 11,04cos t + 5,74sin t + 2,9cos 21 — 1,3 sin 21.

Подставляя в данное уравнение значения cos t, sin /, cos It, sin 21 (см. табл. 8.21), получаем теоретические значения 2yt (см. последнюю графу табл. 8.22).

Нетрудно заметить, что теоретические значения 2уг, рассчитанные по уравнению второй гармоники, более близки к эмпирическим уровням, чем хуг Об этом свидетельствует и сумма квадратов отклонений теоретических значений от эмпирических: — jjp,)2 =

= 286,88, 1(у -2у,)2 = 232,22.

Аналогично рассчитывают параметры уравнения с применением третьей и четвертой гармоник и проверяют близость теоретических значений к эмпирическим.

В заключение отметим, что выравнивание играет важную роль в анализе рядов динамики. Правильный подбор типа кривой для определения тренда представляет не только теоретический, но и практический интерес, в частности при прогнозировании.

Однако обработка рядов динамики (любым способом) дает эффект только при достаточно большом числе уровней ряда.

Следует отметить, что найденные уравнения тренда часто используют для прогнозирования методом экстраполяции, т.е. распространения в будущее закономерности развития, выявленной в прошлом, в исследованном периоде. Однако экстраполировать ряд по уравнению тренда можно только тогда, когда есть уверенность в том, что выявленная и описанная уравнением тренда закономерность развития устойчива и сохранится в будущем, т.е. что условия, в которых происходили изучаемые явления в определенном периоде в прошлом, стабильны и предположительно не изменятся в ближайшем будущем, на которое экстраполируется ряд.

<< | >>
Источник: Г.Л. Громыко. Теория статистики: Учебник. — Т11 2-е изд., перераб. и доп. - М.: ИНФРА-М,. - 476 с. — (Классический университетский учебник)., . 2005

Еще по теме 8.5. Методы выявления основной тенденции (тренда) в рядах динамики:

  1. Раздел I ОСНОВНЫЕ ТЕНДЕНЦИИ РАЗВИТИЯ ЗАПАДНОГО ОБЩЕСТВА В XX в.
  2. § 9. Способы и методы выявления и установления случаев пиратства
  3. 15.5. Методы выявления тенденций развития науки и техники на базе анализа массивов документов
  4. Расчет индексов сезонности в рядах динамики с тенденцией развития (к переменной средней)
  5. 10.4. ВЫЯВЛЕНИЕ ОСНОВНОЙ ТЕНДЕНЦИИ РАЗВИТИЯ ОБЩЕСТВЕННЫХ ЯВЛЕНИИ (СГЛАЖИВАНИЕ И ВЫРАВНИВАНИЕ РЯДОВ ДИНАМИКИ)
  6. 10.6. КОРРЕЛЯЦИЯ В РЯДАХ ДИНАМИКИ
  7. Основные показатели изменения уровней ряда
  8. 8.5. Методы выявления основной тенденции (тренда) в рядах динамики
  9. Основные тенденции и перспективы развития
  10. §4. Основные тенденции преступности в современной России
  11. 15.5. Методы выявления тенденций развития науки и техники на базе анализа массивов документов
  12. Глава шестая ОСНОВНЫЕ ТЕНДЕНЦИИ СОЦИАЛЬНО-ЭКОНОМИЧЕСКОГО РАЗВИТИЯ (КОНЕЦ XVIII В.—1860 Г.)
  13. §3.   ОСНОВНЫЕ ТЕНДЕНЦИИ ТЕРРОРИЗМА В МИРЕ И В РОССИИ
  14. § 2. Виды статистических группировок