7.5. Нахождение уравнений регрессии между двумя признаками
Измерить корреляционную связь между признаками х и у и найти форму этой связи, ее аналитическое выражение (математическую модель) — две важные, неразрывные и дополняющие друг друга задачи корреляционно-регрессионного анализа.
Их можно рассматривать в разной последовательности. В настоящем учебнике сначала рассмотрены методы выявления корреляционной связи и измерения ее тесноты, а теперь перейдем к нахождению уравнений связи (регрессии).Найти уравнение регрессии — значит по эмпирическим (фактическим) данным математически описать изменения взаимно коррелируемых величин.
Уравнение регрессии должно определить, каким будет среднее значение результативного признака у при том или ином значении факторного признака х, если остальные факторы, влияющие на у и не связанные с х, не учитывать, т.е. абстрагироваться от них. Другими словами, уравнение регрессии можно рассматривать как вероятностную гипотетическую функциональную связь средней величины результативного признака у со значениями факторного признака х.
Уравнение регрессии можно также назвать теоретической линией регрессии. Рассчитанные по уравнению регрессии значения результативного признака называются теоретическими, обычно обозначаются ух (читается: «игрек, выравненный по х») и рассматриваются как функция от х, т.е. ух = Дх). (Иногда для простоты записи вместо ух пишут у или у-)
Найти в каждом конкретном случае тип функции, с помощью которой можно наиболее адекватно отразить ту или иную зависимость между признаками х и у, — одна из основных задач регрессионного анализа.
Выбор теоретической линии регрессии часто обусловлен формой эмпирической линии регрессии; теоретическая линия как бы сглаживает изломы эмпирической линии регрессии. Кроме того, необходимо учитывать природу изучаемых показателей и специфику их взаимосвязей.
Для аналитической связи между х и у могут использоваться следующие простые виды уравнений:
а) ух = а0 + а{х (прямая);
б) ух = а0 + я,х + ^х2 (парабола 2-го порядка);
в) ух = а0 + а, (гипербола);
г) ух = а^а13 (показательная функция*);
д) ух = а0 + а, ^ х (логарифмическая функция);
й
е) у = -х (логистическая функция) и др. 1
+ е 0 1
Обычно зависимость, выражаемую уравнением прямой, называют линейной (или прямолинейной), а все остальные - криволинейными.
Выбрав тип функции, по эмпирическим данным определяют параметры уравнения.
При этом отыскиваемые параметры должны быть такими, при которых рассчитанные по уравнению теоретические значения результативного признака у были бы максимально близки к эмпирическим данным (или, что то же самое, минимально от них отличались).Существует несколько методов нахождения параметров уравнения регрессии. Наиболее часто используется метод наименьших квадратов (МНК). Его суть заключается в следующем требовании: искомые теоретические значения результативного признака ух должны быть такими, при которых бы обеспечивалась минимальная сумма квадратов их отклонений от эмпирических значений, т.е.
S = ХсУ - Ух)2 -> min (7.26)
(минимизируются квадраты отклонений, поскольку Х(У — j^) = 0).
Поставив данное условие, легко определить, при каких значениях а0, а] и т.д. для каждой аналитической кривой эта сумма квадратов отклонений будет минимальной.
Еще по теме 7.5. Нахождение уравнений регрессии между двумя признаками:
- Соотношение между двумя подразделениями общественного производства.
- Экономика Германии в период между двумя мировыми войнами
- 9.2. СТАТИСТИЧЕСКИЕ МЕТОДЫ ВЫЯВЛЕНИЯ НАЛИЧИЯ КОРРЕЛЯЦИОННОЙ СВЯЗИ МЕЖДУ ДВУМЯ ПРИЗНАКАМИ
- 9.3. УРАВНЕНИЕ РЕГРЕССИИ
- 9.4. ИЗМЕРЕНИЕ ТЕСНОТЫ КОРРЕЛЯЦИОННОЙ СВЯЗИ МЕЖДУ ДВУМЯ ПРИЗНАКАМИ
- 9.6. МНОЖЕСТВЕННАЯ КОРРЕЛЯЦИЯ
- 7.1. Понятие корреляционной зависимости
- 7.2.3. Изучение связи между качественными признаками на основе таблиц сопряженности
- 7.3. Показатели тесноты связи между двумя качественными признаками
- 7.4. Показатели тесноты связи между двумя количественными признаками
- 7.5. Нахождение уравнений регрессии между двумя признаками
- 7.5.1. Парная линейная регрессия
- 7.5.2. Параболическая корреляция
- 7.5.3. Гиперболическая корреляция
- 7.6. Теоретическое корреляционное отношение как универсальный показатель тесноты связи