4.4.2.Обработка и оценка результатов экспериментов
Для решения поставленных в исследовании задач при системном подходе могут быть использованы в комплексе различные методы обработки материалов эксперимента: •
экономико-статистические методы; •
расчетно-аналитические методы; •
экономико-математические и другие методы.
Рассмотрим содержание последних методов, которые в меньшей мере встречаются в экономической литературе, но широко используются в экономических и других исследованиях. В основе обработки материалов эксперимента экономико-математическими методами лежит регрессионный анализ,
? = а Ь х уб. у ^ а+Ьхи ~ с 1 п х объединяющий практические ме-
= а+Ьх’гся3 27. у=а + 'ч,.'/.. Л тоды исследования зависимостей
=а + Ьтл ЕЗ. у = ся между величинами по статисти-
= а+Ь V"” ?9. >- = а+Ь ческим данным. Проблема рег
- а 1 Ь х ’0 у—а+ъуТ+са рессии в математической статис-
6 уг=а+ь/1 31. у = а+дх3^с тике характерна отсутствием до -
г у-а+Ьх* с ?'Т статочной информации о распре-
Я. г а-(-Ь 5:-1-с -об х 33. V к в этой связи, основными 9.
у = а — с.? х -г С а;;1 я ;.!4. у = а +1: /х*-;- с /Т задачами регрессионного анали- 10.
у а-Ь \/х"+^ зЬ * 35. у = а + Ь/>: - ^ к'Т- за являются следующие:
! 1. у - а Ь л с а! п х 36. у = ? + Ь/ л--т-с уТ" • выбор модели регрессии (см.
VI V = а - Ъ У7~ с si п к 37. у - а Ь л.г ?! ? с перечень функций, применяе-
13 у ^-Ылл+мЬи ^1. у - а ? | ? Ь;'* + с ла мых для аналитического вырав-
\1 у = л 40' У —+Ь.:*+с/** • оценка параметров выбранной 16
V = а —Ь Л? Н- с 1 е к 41 у ^1^ ^?' модели методом квадратов; 17
у а — У* -|-1; (? к 42, у=а—Ь/х— с / V У • проверка статистических
$ у ' Ь ^ с * 44 у а+Ьх“+с,' • проверка адекватности модели. 1
= а~*~^ >'чя "гС 31 4.С5 у - а ^ ь | л с/ т/Т Для выбора необходимого
20. у - 4-г- ?.?'** -г- с (й X 40- у ^ а+Ъ [ е X+4: уТ ввда модели надо сформулировать
-1. у = а-ь'ил-Нс!п л ^ ь г х+•"' у'Т" требования, которыми она долж-
22.
у =^а мVч+?:; 1п и у а в х на удовлетворять: адекватность'М. у=а + Ь V х-гс |ц л 4!>, у = а-НгхЧ-с,'V * Под адекватностью по-
25. у = а+Ь ^Т+с х 50. у = а+Ъ х+е./ у'Т нимается способность модели
предсказывать результаты эксперимента с требуемой точностью. Простота - элемент относительный и считается самым удобным в этом плане - алгебраические полиномы.
Функции, применяемые для аналитического выравнивания:
Как видно, сложность модели повышается с ростом степени полинома, а, следовательно, количеством определяемых неизвестных коэффициентов. Так, полином г-й степени
80
от двух факторов содержит С2 +г неизвестных параметров, а полином г-й степени от “п”
факторов содержит С'п+г неизвестных параметров.
Поэтому, повышая степень полинома и получая, тем самым, более адекватную модель, надо помнить о значительном увеличении ее сложности. В этой связи, на практике чаще всего ограничиваются полиномами первой или второй степени, с использованием метода наименьших квадратов.
Рассмотрим более подробно наиболее распространенный метод аналитического выравнивания, т.е. нахождения математической функции, которая точно описывает тенденцию изменений. Наиболее ответственными этапами при этом являются: выбор формы кривой (математической функции); определение показателей, дающих количественную характеристику тенденций; оценка достоверности расчетов.
Выбор математической функции осуществляется перебором функций, применяемых для аналитического выравнивания и построением графика. Общий вид графика, как правило, позволяет установить: имеет ли динамический ряд отчетливо выраженную тенденцию; если да, то является ли эта тенденция плавной; каков характер тенденций (монотонная или немонотонная, возрастающая или убывающая). Большое внимание выбору математической функции (формы кривой) уделено в работе Е.М. Четыркина1. Если уравнения, использованные для исследования, имеют одинаковое число параметров, то считается возможным отдавать предпочтения тем функциям, у которых сумма квадратов отклонений исходных данных (табличных значений) откликов “у ” от соответствующих значений откликов “уп”, вычисленных по модели, была бы минимальной:
N
(6.1)
В этом состоит требование метода наименьших квадратов.
Мы считаем, что способ наименьших квадратов в маркетинговых расчетах (исследованиях) лучше использовать для прямой и парабол любого порядка. Хуже использовать для экспонент разных модификаций, логарифмических, логических, кривых и гипербол разных модификаций. Динамика получаемых в эксперименте данных может быть довольно сложной, поэтому ее не всегда возможно выразить элементарными аналитическими функциями (прямая, парабола и т.п.). В этом случае приходится придерживаться более сложных сочетаний, использовать как бы комбинированные функции.Наши исследования показывают, что для повышения обоснованности и достоверности выравнивания с целью более точного выявления сложившейся тенденции, желательно проводить расчет по нескольким аналитическим функциям и, на основе экспертных и статистических оценок, определить лучшую форму связи 2.
После определения формы связи и выбора подходящих математических функций, задача сводится к определению показателей, которые дадут количественную характеристику. Необходимо определить параметры уравнений связи. Решение системы линейных уравнений позволяет найти коэффициенты регрессий и, следовательно, полностью определить требуе - мую зависимость. Заметим, однако, что использование той или иной математической функции требует составления и решения системы линейных уравнений, порядок которой равен числу искомых коэффициентов. 1
хйоиЭёеГ A.I. Noaoenoe^aneea iaofau 1ЭТаГТ?ёЭТааГеу. 1.:1977. 2
ТоЭаиёеГ Г.А. ЁТм'ё&ёПГау уёТГТТё^&Пёау То&Гёа оЭаёоТЭТа ТГйжпёТаТ оЭаёоТЭ- ГТаТ дааТаа. 1аб0Г?ааГапё .: "ЁаЭ&ёеу", 1988 - 182П.
81
Для полного факторного плана и линейной функции отклика можно обойтись без решения системы, а определить коэффициенты модели, записанной в относительных переменных по простым соотношениям.
Ограничимся только случаем двух факторов.
Для линейной модели
у = Ь0 + Ь1х1+ Ь2х2 (6.2)
базисными являются функции ^0=1, _Р1=х1, Е2=х2. Для относительных переменных, модель, очевидно, также будет линейной, но, вообще говоря, с некоторыми другими коэффициентами:
У = а0 + а?1+а2У2 (6.3)
Матрица планирования для полного двухуровневого факторного эксперимента с двумя факторами приведена в табл.1.
Ух + У 2 _±_Уз + У 4 4
Новые коэффициенты модели определяются непосредственно по этой матрице, а именно, коэффициент “а0” равен среднему арифметическому значению откликов. Для нахождения коэффициента “а.” надо сложить попарные произведения элементов столбца V . и столбца У, а затем полученную сумму разделить на число опытов:
Ух + У 2 - Уз - У4 4
Ух - У2 + Уз + У4
ао = ^ (6.4)
a = 4 (6.5)
ao = 4 (66)
Математическая модель в естественной форме получается обратным переходом от относительных переменных к натуральным.
Так же легко вычисляются коэффициенты линейной модели для любого числа факторов и произвольной матрицы планирования, удовлетворяющей свойствам ортогональности, симметричности и условию нормировки.
Выбрав математическую модель, в дальнейшем надлежит дать статистический анализ уравнения регрессии, который включает в себя две основные задачи: оценка значимости коэффициентов регрессии и проверка адекватности математической модели. Для решения этих задач надлежит предположить: •
что факторы хр х2,...,хк изменяются с пренебрежимо малой ошибкой по сравнению с ошибкой в определении отклика “у”; •
что случайные величины “уи” независимы и имеют нормальное распределение; •
что дисперсии “уи” одинаковы и равны Б2 (у).
Вообще говоря, достаточно считать, что дисперсии “у ” однородны. Соответствующая характеристика однородности дисперсий называется дисперсией воспроизводимости и обозначается S2(y). Для проверки однородности нескольких дисперсий и вычисления дисперсии воспроизводимости, каждый из опытов проводят несколько раз.
Предположим, что г-й опыт проведен “п” раз, и пустьу (1), у (2), ...у (п) - результаты г-й серии опытов. По ним можно определить среднее значение откликов в г-м опыте
82
(6.7) число степеней свободы (6.8)
n
и несмещенную оценку дисперсии отклика в 1-м опыте
(6.9)
r =n-1
В качестве дисперсии воспроизводимости 82(у) берется среднее взвешенное дисперсией /-го опыта с весами, равными числу степеней свободы 1-го опыта, т.е.
N
(6.10)
N
n=1
Проверка однородности дисперсий ?>2п при равномерном дублировании проводится по критерию Кохрена, а при неравномерном - по критерию Бартлетта. Указания по применению этих критериев можно найти в литературе по регрессивному анализу.
Оценка значимости коэффициентов регрессии осуществляется исходя из принятой математической модели - “Как следует из формулы (6.2), коэффициенты “Ь ” математической модели являются линейными комбинациями случайных величин “у ”, распределенных по нормальному закону. Это позволяет использовать для проверки значимости коэффициентов “Ь ” регрессии критерий Стьюдента.
При обработке рядов динамики, отражающих исследуемое явление, наиболее часто встречающимися математическими моделями (зависимостями) являются: прямолинейные, параболлистические, гиперболические, выражаемые уравнениями:
у = ах + Ь; (6.11)
у = ах2 + Ьх + с; (6.12) a
+ b
y
x
(6.13)
Применение отмеченных выше уравнений, не исчерпывает всех возможных случаев.
В дальнейшем, в соответствии с выбранной математической моделью (уравнением), составляется система нормальных уравнений. Для этого избранное уравнение связи последовательно умножается на переменные, стоящие при постоянных параметрах “а”, “Ь” и т. д. и значения переменных берутся под знак суммы.
Например, требуется составить систему нормальных уравнений для математической модели типа:
у = ах2 + Ьх + с
Первое уравнение найдем путем умножения исходного на х2:
Xух2 = а-Хх4 + ЬХ х3 + с -Xх2
Второе уравнение получим, умножив исходное на х:
X ух = а-Х х3 + ЬХ х2 + с-Х х
83
Третье уравнение получим, умножив исходное на 1:
X у = а-Х х2 + Ь-Х х + с-п,
где п - количество точек (опытов), по которым производится расчет выравненной линии (отклика).
Таким образом, получена система трех нормальных уравнений с тремя параметрами
а, Ь, с, которые и требуется найти.
Для решения системы нормальных уравнений строится вспомогательная таблица, в которой рассчитываются значения всех переменных, стоящих под знаком сумм.
Подставив эти значения в систему и решив ее обычным способом, находим искомые параметры (коэффициенты регрессии) математической модели и окончательный вид уравнения связи.
Проверка адекватности регрессионной модели позволяет установить, будет ли построенная модель предсказывать значения отклика (у) с той же точностью, что и результаты эксперимента. Обязательным условием при этом является ненасыщенность плана эксперимента. Это значит, что число проводимых опытов должно быть больше числа искомых коэффициентов модели, т.е.
N > т+1.
Для оценки адекватности вычисляется остаточная дисперсия Б2ост., характеризующая рассеяние экспериментальных точек от точек, полученных по уравнению регрессии:
1 N -
$ ост-= N - т -1 ^(уп - уп) (6Л4)
где уп - экспериментальные значения отклика в п-м опыте, а
уп = 2Ь]Е]П = ^Ь]^/хп1 ,хп2’???’Хпк) - значение отклика в п-м опыте, рас- 1
=0 1—1
считанное по уравнению регрессии.
Проверка адекватности модели осуществляется с помощью Ж-распределения. С этой целью образуется отношение остаточной дисперсии к дисперсии воспроизводимости:
2
S
~ ост
расп? $ 2 (у) (6*15)
которая сравнивается с критическим значением ^-распределения Ж ., полученным по таблице (распределением дисперсионного отношения Фишера) при заданном уровне значимости “а” и степени свободы г=^т-1 для числителя и г2 = Пд-1 - для знаменателя.
ЕслиЕ ? ., то гипотеза об адекватности принимается и математическая модель
расп кр 7 1-
может быть использована для описания объекта. В противном случае - гипотеза отвергается.
Чтобы упростить проверку на адекватность, в практике часто считают достаточным, чтобы выполнялось неравенство Ж < 0,1- 0,2
расп. 7 7
и в этом случае модель предполагается адекватной.
И так, подведем итог исследования в маркетинговой службе, для чего перечислим основные этапы нахождения математической модели по опытным данным (данным наблюдений): 1.
Разделение параметров объекта исследования на факторы x1,x2,???,xk и отклики
УГУТ-УП 2.
Определение диапазона варьирования факторов а<х. <Ь., где I = 1,2,....,к
84 3.
Переход к относительным переменным ш. 4.
Выбор вида математической модели; установление числа искомых коэффициентов т+1. 5.
Выбор плана проведения эксперимента. 6.
Проведение эксперимента по составленному плану. Запись экспериментальных данных. 7.
Использование метода наименьших квадратов для получения коэффициентов функций (Ук). 8.
Оценка значимости коэффициентов. 9.
Проверка адекватности. 10.
Интерпретация результатов и их примечание для дальнейшего исследования.
Приведенный перечень этапов только приближенно отражает реальную последовательность действий при исследовании, так как многие этапы оказываются взаимосвязанными. Кроме того, в ряде случаев приведенный выше перечень этапов следует дополнить: 1.
Предварительным анализом входных данных (подобно тому, как производят очистку рядов динамики при техническом нормировании). 2.
Проверкой статистических гипотез о нормальном распределении входных параметров, об их статистической независимости. 3.
Проверкой значимости множественного коэффициента корреляции и т.п.
Для обработки результатов эксперимента в настоящее время существует большое количество программных средств для различного класса вычислительных машин.
В качестве примера, рассмотрим прогноз потребности предприятий, занимающихся лесозаготовками, в тракторах ОАО ”ОТЗ” на основании разработанной нами методики, т.е. по уравнению:
N = а + ВО,
у
где N - годовое количество сбыта тракторов ОАО ”ОТЗ” в расчете на 1 млн.мЗ объема лесозаготовок;
О - годовой объем лесозаготовок, млн.м3:
а, Ь - коэффициенты, учитывающие изменения функции тренда.
Данная функция прогнозирования обосновывается характером изменения годового
гг.
ЗН? гта тракте см.рис.4
ТТЙЙРР
2 Ж-
У. N }?ИЫЗД(Ж
ештлРи
= а? /7..+._e-.Z 'ТЗАпв^кечаие
чщцтш
h'i.ItO*. (N) шт.
1 т * iM'UfHlHiWV 04 !WW- тр:)к-
^?ШЗвляе
(Hjfj )ъема лес л )заготовок за нормфп>ных период 1990
\y Hhlp^FL- :м йУШ^ога гсль-Ьюлццу и1 йакоди' i IftMfcW я nip^/УАчы стЬ1гЙш\ ко^ед^упу • 26Я,9 9116 33,7 91 16 72307,2 31,9
Таблица 1992 23ЭЛ 6349 26.7 17,У
10.7 6349 31 26 1276 556У1.6 | 27,4
304« 5,2 j ]Si,2
14137,2 ! 10,1 1 ЮТ 174,6 3 126 1904
1995 1 1 й,9 И 4,6 I27fi 1237 ? 10,8 1237
556 13133,2 | 9.5
902^,0 j 6,6 i 1996 у;,о 556 53 У32321 Ц40,*
i
J--- Итого:
1997
199Я 11314,1
100,0
105-110 ?32321 12:37195-4 под
1.9.
85
Решаем систему нормальных уравнений:
32321 = а-1314,1 + ?-287196,4 140,8 = а-7 + ?-1314,1 Находим, что а = -7,183, Ь = 0,1454
Таким образом, искомое уравнение связи годового сбыта тракторов ОАО ”ОТЗ” в расчете на 1млн.м3 объема лесозаготовок имеет вид N = -7,183+0,1454-2
Прогнозируемое количество сбыта тракторов ОАО “ОТЗ” в год определяется по уравнению: Ы=Ы -О и составит:
у ^
для 1997 г. - Ы= (-7,183+0,1454 100) = 736 штук для 1998 г. - N=(-7,183+0,1454-105) = 849 штук N=(-7,183+0,1454 110) =969 штук Как показывает опыт работы лесозаготовителей в 1995 и 1996 гг., ожидаемые объемы добычи лесопродукции фактически не были достигнуты. Так, в 1995 г. при ожидаемом объеме лесозаготовок 119 млн.м3, фактически было заготовлено 114,6 млн.м3 (96,3%); в 1996 г. при ожидаемом объеме лесозаготовок 114,млн.м3, фактически было заготовлено 95 млн.м3 (83,33%).
В результате сложившихся обстоятельств на лесозаготовках в 1997 г. следует ожидать, что ожидаемый объем лесозаготовок в 100 млн.м3 будет фактически не более 85-90 млн.м3 (в среднем принимаем 87,5 млн.м3). Для этой ситуации прогнозируемый сбыт тракторов ОАО “ОТЗ” в 1997 году превысит N = (-7,183+0,1454Ч87,5) -87,5= 485 единиц.
Для 1998 г., соответственно, прогнозируемый сбыт тракторов ОАО “ОТЗ” составит: ^ (-7,183+0,1454-102) = 780 единиц Г ty.iu (Qi - Q) (Q.-Q'r (Nvi-Nj,) (gi-QK-4-i-Ni) 19У0 116?3 13525,69 15.0 225,00 1 744,50 1991 SI V2 6393,44 13,6 184,96 1104.32 1492 5fJ?4 2540,16 Найдем коэффициент корреляции между объемами лесозаготовок и количеством сбыта тракторов ОАО “ОТЗ” в расчете на 1 млн.м3 в период с 1990 г. по 1996 г. по формуле:
2Щ - 0-Ы - Ы.)
т =
VШ - 0)2- Ы - ыу) 2
Промежуточные вычисления расположим в виде таблицы 4.10.
Таблица 4.10.
Вычисляем среднее:
0 = 1314,1 / 7=187,7 N =140,8 / 7= 20,1
У
Заполняем столбцы и, суммируя элементы в соответствующих столбцах, находим: 2
(0-0)2 = 41501,24
Т(Ыу-Ы)2 = 834,85 Ш-Я)- Ы.-Ыу) = 5853,17
Подставляя вычисленные значения в выражение , получаем:
5853,17 5853,17
г = , = — = 99,44
741501,24-834,85 5886,20
Вывод: между объемами лесозаготовок и количеством сбыта тракторов в расчете на 1 млн.м3 объема лесозаготовок в период с 1990 года по 1996 год существует тесная положительная линейная корреляционная связь.
Среднеквадратическое отклонение по данному хроноряду имеет следующий вид:
834,85
О = — = 11,8
7 -1
Ошибка средней арифметической, (%)
О - 100 11,8-100
р = ^ = = 22,2%
л/п- N 47- 20,1
Еще по теме 4.4.2.Обработка и оценка результатов экспериментов:
- 12.2. Методы тестирования, тренинга и проведения имитационных игр
- 3.2 Методы, применяемые на этапе диагностики проблемы и формулировки критериев и ограничений
- 3.4.3. Методы прогнозирования
- 4.4.2.Обработка и оценка результатов экспериментов
- Основные этапы проведения изменений
- 1. «ЧЕЛОВЕК ИЛИ МАШИНА» В КРИМИНАЛИСТИЧЕСКОЙ НАУКЕ И ПРАКТИКЕ ВОЗНИКНОВЕНИЕ ПРОБЛЕМЫ
- МЕТОДЫ ГРУППОВОЙ КРЕАТИВНОЙ РАБОТЫ
- Основные этапы проведения изменений
- 12.2. Методы тестирования, тренинга и проведения имитационных игр
- 3.2 Методы, применяемые на этапе диагностики проблемы и формулировки критериев и ограничений
- 3.4.3. Методы прогнозирования
- 4.4.2.Обработка и оценка результатов экспериментов
- § 1. ПОЛУЧЕНИЕ, НАКОПЛЕНИЕ И ОБРАБОТКА ИНФОРМАЦИИ