<<
>>

7.5. Нахождение уравнений регрессии между двумя признаками

Измерить корреляционную связь между признаками х и у и найти форму этой связи, ее аналитическое выражение (математическую модель) — две важные, неразрывные и дополняющие друг друга задачи корреляционно-регрессионного анализа.

Их можно рассматривать в разной последовательности. В настоящем учебнике сначала рассмотрены методы выявления корреляционной связи и измерения ее тесноты, а теперь перейдем к нахождению уравнений связи (регрессии).

Найти уравнение регрессии — значит по эмпирическим (фактическим) данным математически описать изменения взаимно коррелируемых величин.

Уравнение регрессии должно определить, каким будет среднее значение результативного признака у при том или ином значении факторного признака х, если остальные факторы, влияющие на у и не связанные с х, не учитывать, т.е. абстрагироваться от них. Другими словами, уравнение регрессии можно рассматривать как вероятностную гипотетическую функциональную связь средней величины результативного признака у со значениями факторного признака х.

Уравнение регрессии можно также назвать теоретической линией регрессии. Рассчитанные по уравнению регрессии значения результативного признака называются теоретическими, обычно обозначаются ух (читается: «игрек, выравненный по х») и рассматриваются как функция от х, т.е. ух = Дх). (Иногда для простоты записи вместо ух пишут у или у-)

Найти в каждом конкретном случае тип функции, с помощью которой можно наиболее адекватно отразить ту или иную зависимость между признаками х и у, — одна из основных задач регрессионного анализа.

Выбор теоретической линии регрессии часто обусловлен формой эмпирической линии регрессии; теоретическая линия как бы сглаживает изломы эмпирической линии регрессии. Кроме того, необходимо учитывать природу изучаемых показателей и специфику их взаимосвязей.

Для аналитической связи между х и у могут использоваться следующие простые виды уравнений:

а) ух = а0 + а{х (прямая);

б) ух = а0 + я,х + ^х2 (парабола 2-го порядка);

в) ух = а0 + а, (гипербола);

г) ух = а^а13 (показательная функция*);

д) ух = а0 + а, ^ х (логарифмическая функция);

й

е) у = -х (логистическая функция) и др. 1

+ е 0 1

Обычно зависимость, выражаемую уравнением прямой, называют линейной (или прямолинейной), а все остальные - криволинейными.

Выбрав тип функции, по эмпирическим данным определяют параметры уравнения.

При этом отыскиваемые параметры должны быть такими, при которых рассчитанные по уравнению теоретические значения результативного признака у были бы максимально близки к эмпирическим данным (или, что то же самое, минимально от них отличались).

Существует несколько методов нахождения параметров уравнения регрессии. Наиболее часто используется метод наименьших квадратов (МНК). Его суть заключается в следующем требовании: искомые теоретические значения результативного признака ух должны быть такими, при которых бы обеспечивалась минимальная сумма квадратов их отклонений от эмпирических значений, т.е.

S = ХсУ - Ух)2 -> min (7.26)

(минимизируются квадраты отклонений, поскольку Х(У — j^) = 0).

Поставив данное условие, легко определить, при каких значениях а0, а] и т.д. для каждой аналитической кривой эта сумма квадратов отклонений будет минимальной.

<< | >>
Источник: Г.Л. Громыко. Теория статистики: Учебник. — Т11 2-е изд., перераб. и доп. - М.: ИНФРА-М,. - 476 с. — (Классический университетский учебник)., . 2005

Еще по теме 7.5. Нахождение уравнений регрессии между двумя признаками:

  1. Соотношение между двумя подразделениями общественного производства.
  2. Экономика Германии в период между двумя мировыми войнами
  3. 9.2. СТАТИСТИЧЕСКИЕ МЕТОДЫ ВЫЯВЛЕНИЯ НАЛИЧИЯ КОРРЕЛЯЦИОННОЙ СВЯЗИ МЕЖДУ ДВУМЯ ПРИЗНАКАМИ
  4. 9.3. УРАВНЕНИЕ РЕГРЕССИИ
  5. 9.4. ИЗМЕРЕНИЕ ТЕСНОТЫ КОРРЕЛЯЦИОННОЙ СВЯЗИ МЕЖДУ ДВУМЯ ПРИЗНАКАМИ
  6. 9.6. МНОЖЕСТВЕННАЯ КОРРЕЛЯЦИЯ
  7. 7.1. Понятие корреляционной зависимости
  8. 7.2.3. Изучение связи между качественными признаками на основе таблиц сопряженности
  9. 7.3. Показатели тесноты связи между двумя качественными признаками
  10. 7.4. Показатели тесноты связи между двумя количественными признаками
  11. 7.5. Нахождение уравнений регрессии между двумя признаками
  12. 7.5.1. Парная линейная регрессия
  13. 7.5.2. Параболическая корреляция
  14. 7.5.3. Гиперболическая корреляция
  15. 7.6. Теоретическое корреляционное отношение как универсальный показатель тесноты связи