<<
>>

5.7. Теоретические кривые распределения

Анализ вариационных рядов предполагает выявление закономерностей распределения, определение и построение (получение) некой теоретической (вероятностной) формы распределения. Характер распределения лучше всего проявляется при большом числе наблюдений и малых интервалах.

В этом случае графическое изображение эмпирического вариационного ряда принимает вид плавной кривой, именуемой кривой распределения. Кривая распределения может рассматриваться как некая теоретическая (вероятностная) форма распределения, свойственная определенной совокупности в конкретных условиях.

Таким образом, анализируя частоты в эмпирическом распределении, можно описать его с помощью математической модели — закона распределения, установить по исходным данным параметры теоретической кривой и проверить правильность выдвинутой гипотезы о типе распределения данного ряда.

При исследовании закономерностей распределения очень важно выдвинуть верную гипотезу о типе кривой распределения, так как, если кривая описана математически (с помощью уравнения) верно, она более точно отражает закономерности данного распределения и может быть использована в различных практических расчетах и прогнозах. Кроме того, в этом случае можно сформулировать рекомендации для принятия практических решений.

Что понимается под теоретическим распределением? Это гипотетическое распределение вероятностей, которое предполагается для наблюдаемых частот вариационного ряда.

В практике статистического исследования встречаются различные распределения: нормальное, логарифмически нормальное, биномиальное, Пуассона, Шарлье и др. Каждое распределение имеет свою специфику и область применения. Далее будут рассмотрены только нормальное распределение и распределение Пуассона. 5.7.1.

Нормальное распределение

При построении статистических моделей весьма широко применяется нормальное распределение.

В 1727 г. английский математик Абрахам де Муавр (1667—1754) открыл закон распределения вероятностей, названный законом нормального распределения. Позднее, в начале XIX в., разработкой вопросов, относящихся к данному закону, занимались Пьер Лаплас (1749—1827) и Карл Гаусс (1777—1855). Общие условия возникновения закона нормального распределения установил А.М. Ляпунов (1857-1918).

Распределение непрерывной случайной величины х называют нормальным Щх, о), если соответствующая ей плотность распределения выражается формулой

-(х - х)2

Дх) = Ф(х, х, о2) = —7=е 2°2 а^2п 1

(5.52)

ИЛИ ф(0 = у-— е 2 , л/2 п

где X -

X -

а2 - а - -

значение изучаемого признака; -

средняя арифметическая ряда; -

дисперсия значений изучаемого признака; -

среднее квадратическое отклонение изучаемого признака;

л =

3,1415 — постоянное число (отношение длины окружности к ее диаметру);

е =

2,7182 — основание натурального логарифма;

X — X

? = — нормированное отклонение.

о

При графическом изображении плотности распределения /(х) получим кривую нормального распределения, симметричную относительно вертикальной прямой х = х (рис. 5.8), поэтому величину х называют центром распределения.

Случайные величины, распределенные по нормальному закону, различаются значениями параметров х и с, поэтому очень важно выяснить, как эти параметры влияют на вид нормальной кривой.

Если х не меняется, а изменяется только а, то: 1)

чем меньше а, тем более вытянута вверх кривая (см.

рис. 5.8, а), а так как площадь, ограниченная осью х и данной кривой, равна 1, то вытягивание вверх компенсируется сжатием около центра распределения х и более быстрым приближением кривой к оси абсцисс; 2)

чем больше а, тем более плоской и растянутой вдоль оси абсцисс становится кривая.

Если о остается неизменной, а х изменяется, то кривые нормального распределения имеют одинаковую форму, но отличаются друг от друга положением максимальной ординаты (см. рис. 5.8, б).

а)

т

X = сопе! а, а, <а2< а}

б) /(*) X а = сог^ х1 < х2 < х} А / \ *2 / \ *3 У ^ /

^ "Т -ст а

Рис. 5.8. Кривые нормального распределения

Итак, выделим особенности кривой нормального распределения. 1.

Кривая симметрична и имеет максимум в точке, соответствующей значению х = Мо = Ме. 2.

Кривая асимптотически приближается к оси абсцисс, продолжаясь в обе стороны до бесконечности. Чем больше отдельные значения х отклоняются от 5с, тем реже они встречаются. 3.

Кривая имеет две точки перегиба на расстоянии ±а от х. 4.

Площадь между ординатами, проведенными на расстоянии х ± а (заштрихованная область на рис. 5.8, б), составляет 0,683. Это означает, что 68,3% всех исследуемых единиц (частот) отклоняется от средней арифметической не более чем на с, т.е. находится в пределах х ± о. В промежутке х ± 2о находится 95,4%, а в промежутке х ± Зо, соответственно, 99,7% всех единиц исследуемой совокупности. 5.

Коэффициенты асимметрии и эксцесса равны нулю.

Порядок расчета теоретических частот кривой нормального распределения таков: •

по эмпирическим данным рассчитывают среднюю арифметическую ряда х и среднее квадратическое отклонение а; •

находят нормированное отклонение каждого варианта от средней арифметической:

? ~ Х ~ * а •

по таблице распределения функции ср(/) (см. Приложение 1) определяют ее значения; •

вычисляют теоретические частоты т' по формуле

Ш.

т' = —^Ф(0, ст

где N — объем совокупности;

Ик — длина интервала.

В случае если вариационный ряд имеет равные интервалы,

а

Пример. Рассчитать теоретические частоты ряда распределения на основе данных, представленных в табл. 5.17.

Выдвинув гипотезу о нормальном распределении, определим по эмпирическим данным параметры этой кривой. Распределение призывников района по росту

(данные условные) Рост призывников, см

хк~Гхк Коли

чество

человек

т; х; х,т, (х,.-х)2т,. х, —х ф(0 т] о А 1 2 3 4 5 6 1 156-160 8 157,5 1260,0 2918,48 2,34 0,0258 5 161-165 17 162,5 2762,5 3379,77 1,73 0,0893 16 166-170 42 167,5 7035,0 3478,02 1,11 0,2155 40 171-175 54 172,5 9315,0 907,74 0,50 0,3521 65 176-180 73 177,5 12957,5 59,13 0,11 0,3965 73 181-185 57 182,5 10402,5 1984,17 0,72 0,3079 57 186-190 38 187,5 7125,0 4514,78 1,33 0,1647 30 191-195 11 192,5 2117,5 2780,91 1,95 0,0596 11 Ъ 300 52975,0 20023,00 297 Сначала рассчитаем средний уровень ряда:

52975 -

' = 176,6 см.

5>. 300

/

Затем определим еще один параметр — среднее квадратическое отклонение, для чего предварительно вычислим дисперсию (см. графу 4 табл. 5.17):

Х(*. - *)2»,

° = = 66’74’

2^т1 300

/

отсюда а = 8,17 см.

Далее определим нормированное отклонение / для каждого варианта (см. графу 5 табл. 5.17) с точностью до сотых, после чего по таблице распределения функции ф(/) (см. Приложение 1) найдем значения функции при значениях аргумента, полученных в графе 5. При этом необходимо учитывать, что функция ф(?) четная, т.е. ф(—0 = ф(/)-

Анализируемый вариационный ряд имеет равные интервалы, следовательно, можно определить

сош! = ^ = = 183,6 == 184.

о 8,17

Последовательно умножив const на величину ф(/) для каждого варианта, получим теоретические частоты т' (см. графу 7 табл. 5.17).

Иногда за счет округлений при расчетах может быть нарушено равенство сумм эмпирических и теоретических частот, что и произошло в данном случае (Х/я;. = 300, ]?/п(' = 297). i

/

Сравним на графике эмпирические т и теоретические т' частоты, полученные на основе данных табл. 5.17 (рис. 5.9). Близость этих частот очевидна, но объективная оценка их соответствия может быть получена только с помощью критериев согласия (см. параграф 5.8).

Рост, см

Рис. 5.9. Распределение призывников по росту 5.7.2.

Распределение Пуассона

К числу важнейших теоретических распределений, имеющих практическое применение, относится пуассоновское распределение, названное по фамилии французского математика Симеона Пуассона (1781—1840).

Классическую форму распределение Пуассона принимает в том случае, если значения признака носят дискретный характер х = 0, 1, 2, 3, ... и являются результатом какого-либо редко возникающего события среди наблюдаемых единиц. Причем с увеличением значений признака вероятность наступления события падает. Природа распределения Пуассона наиболее полно раскрывается в теории случайных процессов, поэтому его еще называют законом распределения редких явлений. Распределение Пуассона наблюдается в совокупностях, число единиц которых достаточно велико (^> 100), а доля единиц, обладающих болыийми значениями признака, мала.

Средняя арифметическая ряда и дисперсия, вычисленные по эмпирическим данным, как правило, совпадают или мало отличаются друг от друга.

Графически распределение Пуассона представлено на рис. 5.10.

Рис. 5.10. Кривая распределения Пуассона

Аналитически распределение Пуассона можно выразить формулой

ахе~а

Р(х) = (5.53)

х\

где Р(х) — вероятность того, что признак примет то или иное значение;

а = х — средняя арифметическая ряда.

Из формулы (5.53) видно, что единственным параметром распределения является средняя арифметическая.

Порядок расчета теоретических частот кривой распределения Пуассона таков: •

находят среднюю арифметическую ряда, т.е. х — а; •

по таблицам определяют е-0; •

для каждого значения х вычисляют теоретическую частоту по формуле

т' = = NP{x), (5.54)

х!

где N — число единиц в изучаемой совокупности.

Пример. Государственная инспекция безопасности дорожного движения (ГИБДД) провела проверку 400 автомобилей. Результаты этой проверки представлены в табл. 5.18. Выровнять полученный ряд по кривой Пуассона.

Таблица 5.18 Распределение автомобилей по числу неисправностей Число неисправностей в автомобиле х/ Количество

автомобилей

т, х,т, 0 215 0 77,40 213 1 135 135 21,60 134 2 38 76 74,48 42 3 8 24 46,08 9 4 3 12 34,68 1 5 1 5 19,36 1 2 400 252 273,60 400 Рассчитаем среднюю арифметическую ряда и дисперсию:

^х1т1 252 , !(*/ - *)Ч 273 6 *

= - V = Ш = °’63; ° = = -Щ- = °’68’ 2,

/и(. 400 Х/и. 400

-Г ' _ 2 '

Так как х = о , есть основание полагать, что данное распределение подчиняется закону Пуассона. Для определения теоретических частот выполним следующие расчеты.

Поскольку а = х = 0,63, по таблице Приложения 11 найдем значение е-°'63 = 0,5326. Затем, подставив в формулу (5.54) значения х от 0 до 5, вычислим теоретические частоты: = 213,0 (так как 0! = 1); = 134,2;

= 42,3;

1-2

= 8,9;

0,633-0,5326 1-2-3 0,634-0,5326 1-2-3-4 0,635 0,5326 1-2-3-4-5

= 1,4; = 0,2. т'о = 400 т\ = 400- т'2 = 400 т'ъ = 400 т\ = 400 т5 = 400- 0,63° 0,5326 0!

0,63' -0,5326 1

0,632 -0,5326

Полученные теоретические частоты округлим до целых чисел (см. последнюю графу табл. 5.18).

Распределение Пуассона используется в теории надежности, теории массового обслуживания для описания числа заявок, поступающих в систему массового обслуживания (например, такую, как телефонная станция, ремонтная мастерская, торговое предприятие, билетная касса) в единицу времени, а также для описания числа отказов технологического оборудования в единицу времени.

<< | >>
Источник: Г.Л. Громыко. Теория статистики: Учебник. — Т11 2-е изд., перераб. и доп. - М.: ИНФРА-М,. - 476 с. — (Классический университетский учебник)., . 2005 {original}

Еще по теме 5.7. Теоретические кривые распределения:

  1. 8.3. ПРОВЕРКА ГИПОТЕЗЫ О СООТВЕТСТВИИ ЭМПИРИЧЕСКОГО РАСПРЕДЕЛЕНИЯ ТИПУ КРИВЫХ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ
  2. 3.3. Ряды распределения Сущность и виды рядов распределения
  3. 5.6. Моменты распределения. Показатели формы распределения
  4. 4.8. Закон предложения. Кривые предложения
  5. 4.7. Закон спроса. Кривые спроса
  6. 6.7. ИЗУЧЕНИЕ ФОРМЫ РАСПРЕДЕЛЕНИЯ
  7. 17.4. Схемы распределения
  8. 1. ТЕОРЕТИЧЕСКИЕ ПРОБЛЕМЫ
  9. 7.7. УПРАВЛЕНИЕ КАНАЛАМИ РАСПРЕДЕЛЕНИЯ
  10. 7.5. ПРЯМЫЕ КАНАЛЫ РАСПРЕДЕЛЕНИЯ