<<
>>

9.5. КОЭФФИЦИЕНТЫ КОРРЕЛЯЦИИ РАНГОВ

Применение линейного коэффициента корреляции для оценки степени тесноты связи между признаками особенно в той части, которая связана с оценкой его существенности, является обоснованным лишь в условиях нормального или близкого к нормальному распределению признаков в изучаемой совокупности.

Кроме того, как видно из приводимых выше формул, для определения величины линейного коэффициента корреляции необходимо знать численные значения соответствующих величин аргументов и функции. В некоторых же случаях мы можем встретиться с такими качествами, которые не поддаются выражению числом единиц. Эти обстоятельства заставляют прибегать к использованию так называемых «непараметрических» методов, позволяющих измерить интенсивность связи как между количественными признаками, форма распределения которых отличается от нормальной, так и между качественными признаками. В основу непараметрических методов положен принцип нумерации вариант статистического ряда. Каждой единице совокупности присваивается порядковый номер в ряду, который будет упорядочен по уровню признака. Таким образом, ряд значений признака ранжируется, а номер каждой отдельной единицы считается ее рангом. Можно получить предварительное представление о наличии или отсутствии связи между признаками, если сопоставить последовательность взаимного расположения рангов факторного и результативного признаков. Для этого ранги индивидуальных значений факторного признака располагают в порядке возрастания, и если ранги результативного признака обнаруживают тенденцию к увеличению, можно предполагать наличие прямой связи; если же с увеличени

201

?00

ем величины рангов факторного признака величины рангов результативного признака уменьшаются, то это свидетельствует о возможном наличии между изучаемыми признаками обратной связи.

Коэффициенты корреляции, основанные на использовании рангов, были предложены К- Спирмэном и М. Кендэлом. Коэффициент корреляции рангов Спирмэна основан на рассмотрении разности рангов значений аргумента и функции d. Рассчитаем дисперсию переменной d, соответствующей разности между рангами переменной х и у, т. е.

di^Xi—yi , где t=l, 2,3.....п.

Рассмотрим дисперсию переменной d—а2:

п 2

2d*

а2 = —--(d)2 , где d=x-y. -

_ Подставим вместо d,- величины Xi—yt и вместо ~d разность х—у. Тогда

2 1

2 (*-г/02

а\ =

d п

(х-у)2=а2 +а2 -2 (—1 xiyi-xy ) * v \ п 1. )

Как известно, линейный коэффициент корреляции можно определить по формуле

1 «

— 2 Xitji—x у

г _ П 1_

•XV —-— '

Тогда последнее слагаемое можно записать так:

2 ( ~ 2 Xiyi-xy ) =2rxv-axau

откуда

о2а=о2х—2rxyoxav+а2у ,

И 2 2 2

°х +<*у —Od

r*v= 2axov--

Применительно к рангам значений аргументов -и функции aj и о2 характеризуют дисперсию натурального ряда чисел от 1

до и, которая составляет— (л2—1), а ~х=у~= 17+1

12 , 2

Отсюда дисперсия разности рангов

v

I 1

Подставим величины о2 и а2 =а2 202

в формулу (9.16). Тогда

™ 2

6 2di

Г xv — 1

'*V~ 1 n(n2—1)

и получим формулу коэффициента корреляции рангов Спирмэна, который часто обозначают р:

6Id,

р=1---- (9.17)

Рассмотрим определение коэффициента Спирмэна на следующем примере.

Для построения многофакторной корреляционной модели производительности труда было отобрано 15 факторов, которые обозначим соответственно хи х2, х3, xf,..., Хц, ль- По результатам экспертной оценки степени влияния факторов на уровень производительности труда специалисты присвоили факторам следующие ранги:

факторы xt х3 х3 jc4 хь хв хч Xg Хд Хю хп хп х13 JCj4 Х1Ъ

ранги экспертов 7 4 1 3 14 13 10 12 5 9 8 2 11 1о 6

После расчета коэффициентов корреляции интенсивность влияния отобранных факторов оценивалась следующими рангами:

m

факторы хх jca х3 х4 х6 хв xt х8 х9 х10 xlt х13 х13 хи х№

ранги после расчета коэффициентов

корреляции 4 6 3 7 15 11 14 12 1 13 5 2 9 10 8

Возникает вопрос: насколько точно результаты экспертной оценки предугадали действительную степень влияния факторов на уровень производительности труда?

Расчеты для получения коэффициента р представим в табл. 9.11.

6-128

п-=1--=0,772.

v 15(225-1)

Согласно полученному коэффициенту корреляции рангов Спирмэна между данными экспертной количественной оценки влияния факторов на уровень производительности труда существует довольно тесная зависимость1.

М. Кендэл предложил еще одну меру связи между переменными хну (коэффициент корреляции рангов Кендэла — х):

2т=-—--где S=P+Q (9.18)

п(п— 1)

203

Т а б л и ц а 9.11

Фа к. тор

*1

Х2

Х3

хк

х-в

х6

ХА

Ранг по экспертной оценке

7 4 1 3 14 13 10 12

Ранг

по величине коэффициента корреляции

4 6 3 7 15 11 14 12

Разность рангов

"l I

3 2 2 4 1 2 4 0

9 4 4

16 1 4

16 0

Фактор

X» ХЮ Хц Хп

Ххз

ХЦ

Xtb

Итого

Ранг по экспертной оценке

5 9 8 2 11 15 6

Ранг

по величине коэф-фици ента корреляции

1

13 5 2 9

10 8

Разность рангов

14 I

Для вычисления т надо упорядочить ряд рангов переменной х, приведя его к ряду натуральных чисел. Затем рассматривают последовательность рангов переменной у:

ранг факторов по экспертной оценке (х) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

ранг факторов по величине коэффициента корреляции

(У) 3 2 7 6 1 8 4 5 13 14 9 12 11 15 10

Для нахождения S (9.18) находят два слагаемых: Р и Q. При определении слагаемого Р нужно установить, сколько чисел, находящихся справа от каждого иа элементов последовательности рангов переменной у, имеют величину ранга, превышающую ранг рассматриваемого элемента. Так, например, первому значению в последовательности рангов переменной у, т. е. числу 3 соответствует 12 чисел (7, 6, 8, 4, 5, 13, 14, 9, 12, 11, 15, 10), которые превышают ранг 3; второму значению 2 соответствует 12 чисел (7, 6, 8, 4, 5, 13, 14, 9, 12, 11, 15, 10), превышающих 2, и т. д. Суммируя полученные таким образом числа, мы получим слагаемое Р, которое можно рассматривать как меру соответствия последовательности рангов переменной у последовательности рангов переменной х. Для нашего примера Р=81 (12+12+8+8+Ш+7+8+7+2+1 + +4+1 + 1). х т

Второе слагаемое Q характеризует степень несоответствия последовательности рангов переменной у последовательности рангов переменной х. Чтобы определить Q, подсчитываем, сколько чисел, находящихся справа от каждого из членов последовательности рангов переменной у, имеет ранг меньше, чем этот фактор. Такие величины берутся со знаком минус. В рассматриваемом примере

204

л=—24 (-2—1—4—3—0-2-0-0—4-4—0—2—1—1). Следовательно,- S = Р+ Q=81—24 = 57.

Коэффициент корреляции рангов Кендэла в нашем примере равен:

2S 2-57

т= —-— =-=0,543.

л(я-1) .15-14

Коэффициент корреляции рангов Кендэла также изменяется в пределах от —1 до +1 и равен нулю при отсутствии связи между рядами рангов. При достаточно большом числе наблюдений между коэффициентами корреляции рангов Спирмэна и коэффициентом корреляции рангов Кендэла существует следующее соотношение:

3

р^-у-т.

Существенность коэффициента корреляции рангов Кендэла проверяется при уровне значимости а по формуле

t>,a/]p!. (9.19)

' 9я(я—1)

где ta — коэффициент, определяемый по таблице нормального распределения для выбранного уровня значимости а. Могут встретиться случаи, когда невозможно установить ранговые различия нескольких единиц или объектов. В этих случаях принято вычислять средний ранг (даже если он будет дробным числом) и полученный средний ранг присваивать каждой такой единице или объекту, т. е. в таком случае переходят к матрице переформированных рангов. Например, два фактора один из экспертов ставит на третье место. Тогда каждому из факторов присваивается ранг

3,5! / 3*4 j.t так как они поделили между собой третье и четвертое места, а следующему за ними фактору присваивается ранг 5 и т. д. При наличии связанных рангов приведенные выше формулы ранговых коэффициентов корреляции Спирмэна и Кендэла необходимо скорректировать1.

Если определяется теснота связи между k-м и Z-м признаками, в рядах значений которых имеется соответственно q и g групп объединенных рангов, то формула коэффициента корреляции рангов Спирмэна примет вид:

Л3—П " 2

6_(=>_

(9.17а)

> См., например: Юл Дж. Э., Кендэл М: Дж. Теория статистики. М., Госстатиздат, 1960, с. 310—311.

205

где

„ tks~th. tf-u

Ti= 2:

где и f,. определяют количество единиц в i-й группе объединенных рангов соответствующего признака. Скорректированная формула для вычисления коэффициента корреляции рангов Кендэла будет иметь вид:

где

(9.18а)

2

Для оценки степени тесноты связи между несколькими признаками при использовании ранговой корреляции применяется коэффициент конкордации w, который вычисляется по формуле

125

Ш= тЧп*-п) ? • (92°)

где т — число факторов; п — число ранжируемых единиц; S — сумма квадратов отклонений рангов.

Если обозначить г„ ранг t'-ro фактора у Jf-fi единицы, то величина S будет равна:

n m

(2 2'и)2

s=Z(Z'-iJ)2---

Рассмотрим вычисление коэффициента конкордации на следующем примере. Восемь предприятий, выпускающих однотипную продукцию, ранжированы экспертами по уровню качества выпускаемой продукции, спросу на продукцию и уровню рентабельности.

Сумма квадратов отклонений рангов равна 330:

[ 5=1788-^=330 ].

Величина коэффициента конкордации получится равной 0,873:

12-330

w=-=0,873.

32(83 - 8)

Это свидетельствует о возможном наличии достаточно тесной зависимости между изучаемыми признаками.

Таблица 9.12 Порядковый номер предприя- Ранг по показателям (rij) 171 т

уровня уровня уровня тия рентабельности качества спроса 1 4 4 3 11 121 2 1 3 1 5 25 3 3 1 2 6 36 4 7 6 5 18 324 5 5 5 7 17 280 6 6. 8 6 20 400 7 2 2 4 8 64 8 8 7 8 23 529 Итого 108 1788

<< | >>
Источник: Т. В. Рябушкин. Общая теория статистики: Учебник/Т. В. Рябушкин, 0-28 М. Р. Ефимова, И. М. Ипатова, Н. И. Яковлева. — М.: Финансы и статистика. — 279 с, ил.. 1981 {original}

Еще по теме 9.5. КОЭФФИЦИЕНТЫ КОРРЕЛЯЦИИ РАНГОВ:

  1. 7.4.2. Коэффициенты корреляции рангов
  2. 10.7. ТЕХНИКА НА ОСНОВЕ РАНГОВЫХ КОРРЕЛЯЦИЙ
  3. 7.4.1. Линейный коэффициент корреляции
  4. Коэффициент внутригнездовой корреляции
  5. Модель ранговой динамики по Шиндлеру
  6. 7.4.3. Коэффициент конкордации
  7. 8.8. Корреляция рядов динамики
  8. 9.6. МНОЖЕСТВЕННАЯ КОРРЕЛЯЦИЯ
  9. 10.6. КОРРЕЛЯЦИЯ В РЯДАХ ДИНАМИКИ
  10. 7.8. Множественная корреляция
  11. 3.7.1. Районный коэффициент
  12. § 4. Коэффициенты преступности и ее структура
  13. 7.5.3. Гиперболическая корреляция
  14. КОЭФФИЦИЕНТЫ ДЕМОГРАФИЧЕСКИЕ
  15. График. (Поле корреляции, диаграмма рассеивания)
  16. КОЭФФИЦИЕНТ ТОБИНА
  17. 4.3.6. Повышающие и понижающие коэффициенты
  18. 7.5.2. Параболическая корреляция