<<
>>

7.6. Теоретическое корреляционное отношение как универсальный показатель тесноты связи

Как уже отмечалось, нахождение уравнения регрессии и измерение тесноты связи между двумя (или более) показателями — две неразрывно связанные и дополняющие друг друга стороны исследования корреляционных зависимостей в статистике.

Измерить тесноту связи между коррелируемыми величинами — значит определить, насколько вариация результативного признака обусловлена вариацией факторного (факторных) признака.

Ранее были рассмотрены показатели, с помощью которых можно выявить наличие корреляционной связи между двумя признаками х и у и измерить тесноту этой связи: коэффициент Фехнера, ранговые коэффициенты корреляции Спирмэна и Кендэла, линейный коэффициент корреляции и др.

Наряду с ними существует универсальный показатель — корреляционное отношение (или коэффициент корреляции по Пирсону), применимое ко всем случаям корреляционной зависимости независимо от формы этой связи.

Следует различать эмпирическое корреляционное отношение и теоретическое.

Как уже отмечалось ранее (см.

с. 210—212), эмпирическое корреляционное отношение рассчитывается по аналитической группировке (или корреляционной таблице) на основе правила сложения дисперсий как корень квадратный из отношения межгрупповой дисперсии результативного признака 52 к общей дисперсии результативного признака о2, т.е.

Гб2" _ ЇХ (УІ - У )2

Лэмп~1(а$’ ИЛИ Цэмп ~ Ії(У, ~ У)2 '

Теоретическое корреляционное отношение Лхео^ определяется на основе выравненных (теоретических) значении результативного признака ух, рассчитанных по уравнению регрессии (для любой формы связи).

Теоретическое корреляционное отношение представляет собой относительную величину, получаемую в результате сравнения среднего квадратического отклонения в ряду теоретических значений результативного признака со средним квадратическим отклонением в ряду эмпирических значений (или корень квадратный из отношения дисперсий теоретического и эмпирического ряда значений результативного признака).

Так как суммы теоретических и эмпирических значений результативного признака совпадают, т.е.

ІУХ = Ху, то и среднее значение признака у этих рядов одинаково — у.

Если обозначить дисперсию эмпирического ряда игреков через о2 (или Иу), а теоретического ряда - через 52 (или 2)- ), то каждая из них выразится формулами

?> = а2 = а п = §2 = ^0^.

у у п у* п

Сравнивая вторую дисперсию с первой, получим теоретический коэффициент детерминации

«2 = 2 ?(Ух ~

Лтеор ^ С2/ ИЛИ Т1тор Х(^.-7)2'

Если учесть, что а2 (или Ву) — дисперсия эмпирического ряда игреков — характеризует вариацию результативного признака за счет всех факторов, включая и фактор х, т.е. измеряет общую вариацию величины у, а дисперсия теоретического ряда, т.е. 52 (или В- ) характеризует вариацию результативного признака за

У X

счет вариации только фактора х (при прочих равных условиях), то отношение второй дисперсии к первой, т.е. коэффициент

2 52

детерминации ті = —у, показывает, какую долю в общей дис-

Персии результативного признака занимает дисперсия, выражающая влияние вариации фактора х на вариацию у.

В основе исчисления и эмпирического и теоретического корреляционного отношения лежит правило сложения дисперсий, согласно которому в первом случае (при расчете т| по группировке) общая дисперсия равна сумме межгрупповой дисперсии и средней из групповых, т.е. о2 = 82 + о2. Во втором случае (при расчете Г| по уравнению регрессии) в качестве межгрупповой дисперсии выступает дисперсия теоретических значений результативного признака, т.е. 82 = В- , которую можно назвать факторной ^Фактор’ поскольку она отражает влияние фактора х на вариацию у, а вместо средней из групповых дисперсий принимается остаточная дисперсия о2ст, отражающая влияние на вариацию результативного признака всех остальных факторов (кроме х), не учтенных в модели (в уравнении регрессии), т.е. остаточная дисперсия отражает необъясненные расхождения между эмпирическими и

2

= 1(УХ - У) теор 110

ИЛИ Т]

Извлекая корень квадратный из коэффициента детерминации, получаем теоретическое корреляционное отношение

теоретическими значениями результативного признака и рассчитывается по формуле 2

Ъ(У, - Ух)2

а = —.

п

Таким образом, общая дисперсия эмпирического ряда у равна сумме факторной и остаточной дисперсий:

_ с2 , „2

О — О, -г О ,

у фактор ост5

а теоретическое корреляционное отношение с 2 фактор

(7.38)

л

?теор

Факторную дисперсию можно выразить как 8фактор = а2 — а2ст.

Подставив это выражение в формулу (7.38), получим еще одну формулу для вычисления корреляционного отношения: л

'теор

І

і

2

(7.39)

В последнем виде корреляционное отношение при криволинейной форме связи обычно называют индексом корреляции.

Корреляционное отношение (индекс корреляции) может находиться в пределах от 0 до 1, что хорошо видно из формул (7.38) и (7.39).

Если результативный признак всецело зависит от фактора х (т.е. связь функциональная), то выравненные (теоретические) значения результативного признака ух совпадают с эмпирическими у. Тогда 5фактор = а2у, или а2ст = 0, и корреляционное отношение т| = 1, что означает полную зависимость вариации у от вариации х.

Если же фактор х не оказывает никакого влияния на вариацию у, то общая дисперсия о2 совпадает с дисперсией остаточной о2 ,

1 9 У ОСТ

т.е. су = аост, и в этом случае г) = 0. Это означает, что признак у не коррелирован с фактором х.

Таким образом, чем ближе значение л к 1, тем теснее связь между вариацией у их. И наоборот, чем ближе 11 к 0, тем зависимость слабее. Обычно при т| < 0,3 говорят о малой зависимости между коррелируемыми величинами, при 0,3 < г) < 0,6 — о средней, при 0,

6 < Т| < 0,8 — о зависимости выше средней и при г| > 0,8 —

о большой, сильной зависимости.

Корреляционное отношение применимо как для парной, так и для множественной корреляции независимо от формы связи. В этом смысле его можно назвать универсальным показателем тесноты связи.

Покажем расчет теоретического корреляционного отношения как меры тесноты связи по данным табл. 7.18. Исходные данные и расчет дополнительных показателей, необходимых для исчисления т|, приведены в табл. 7.22.

Таблица 7.22

Расчетная таблица для нахождения корреляционного отношения Внесено Урожайность, ц/га органи

ческих

удобре

ний,

т/га

X факти

ческая

У рассчитанная по уравнению регрессии

Ух 1 >4 1 1 =4 1 Ух~У (у*-у)14 У~Ух (У-Ух)2 1 2 3 4 5 6 1 8 9 1 16 16,2 -4 16 -3,8 14,44 -0,2 0,04 2 19 18,5 -1 1 -1,5 2,25 0,5 0,25 3 20 20,4 0 0 0,4 0,16 -0,4 0,16 4 22 21,9 2 4 1,9 3,61 ОД 0,01 5 23 23,0 3 9 3,0 9,00 0 0 Хх = = 15 5> = = 100 О

0

II

ч

1

и 0 30 0 29,46 0 0,46 В данном примере общая средняя урожайность

- 100 ™ / у = —— = = 20 ц/га.

п 5

Общая дисперсия (дисперсия ряда эмпирических значений результативного признака)

_2 _ Х(У - У)2 _ 30 _ ^

о 6,

у п 5

факторная дисперсия (дисперсия ряда теоретических значений результативного признака)

Данное значение т)теор = ^>99 характеризует очень тесную зависимость изменения урожайности от изменения количества внесенных удобрений.

Такой же результат получим, используя формулу индекса корреляции (7.39).

Данные для остаточной дисперсии о2ст рассчитаны в графе 9 табл. 7.22.

Вообще в таблице должно соблюдаться следующее равенство:

1(У - У)2 = I(Ух - У)2 + 1(У - Ух)2.

В нашем примере незначительные расхождения (30 29,46 + 0,46) объясняются округлением значений параметров уравнения регрессии и самих ух.

Итак, остаточная дисперсия в нашем примере равна

Х(У - Ух)2

п

Отсюда

а

ост

Л

?теор

Как уже отмечалось, теоретическое корреляционное отношение позволяет измерять тесноту зависимости при любой форме связи.

Нетрудно доказать, что при линейной зависимости теоретическое корреляционное отношение тождественно линейному коэффициенту корреляции, т.е. Г1теор = г. Для этого преобразуем формулу

Учитывая, что при линейной зависимости ух = а0 + ахх и

у =а0 + а,х,

?(а0 + а,* - а0 - а,х)2 _ а^(х - х)2

п п

= а,

= г.

11 еор

Отсюда

ст

Линейный коэффициент корреляции в виде г — а. —— высту-

°У

пает в роли стандартизированного коэффициента регрессии, т.е. показывает, на сколько «сигм» изменится в среднем у при увеличении х на одну «сигму» (среднее квадратическое отклонение в ряду х).

о

Из формулы г = а. —— путем преобразований и замены а. мож-

но получить и другие модифицированные формулы линейного коэффициента корреляции, уже рассмотренные в параграфе 7.4. Так, например, согласно формуле (7.30)

_ *У ~~ *У

Тогда

°х _ ху — ХУ

о о о

У X у

т.е. мы имеем формулу линейного коэффициента корреляции (7.13), которую раньше получили другим способом.

<< | >>
Источник: Г.Л. Громыко. Теория статистики: Учебник. — Т11 2-е изд., перераб. и доп. - М.: ИНФРА-М,. - 476 с. — (Классический университетский учебник)., . 2005

Еще по теме 7.6. Теоретическое корреляционное отношение как универсальный показатель тесноты связи:

  1. 297. В отношении каких работников установлены особенности привлечения к дисциплинарной ответственности и в чем они состоят?
  2. 7.2.3. Экономическая добавленная стоимость как система показателей, используемая в рамках концепции «акционерной стоимости»
  3. 6.7. Индексы как обобщающие показатели социально-экономического развития
  4. 9.4. ИЗМЕРЕНИЕ ТЕСНОТЫ КОРРЕЛЯЦИОННОЙ СВЯЗИ МЕЖДУ ДВУМЯ ПРИЗНАКАМИ
  5. 7.3. Показатели тесноты связи между двумя качественными признаками
  6. 7.4. Показатели тесноты связи между двумя количественными признаками
  7. 7.6. Теоретическое корреляционное отношение как универсальный показатель тесноты связи
  8. 1.3. Экологические отношения как предмет экологического права
  9. Н.Р. Кравчук ЛИЗИНГОВЫЕ ОТНОШЕНИЯ КАК ПРЕДМЕТ ГРАЖДАНСКО-ПРАВОВОГО РЕГУЛИРОВАНИЯ
  10. Глава I. Общественная природа правового отношения. Правовое отношение как особый вид общественных отношений
  11. Глава I. СОЦИАЛИСТИЧЕСКИЕ ОБЩЕСТВЕННЫЕ ОТНОШЕНИЯ КАК ОБЪЕКТ ПРЕСТУПЛЕНИЯ
  12. Глава 2. Общественные отношения как объект преступления
  13. 7.2.3. Экономическая добавленная стоимость как система показателей, используемая в рамках концепции «акционерной стоимости»