<<
>>

Коэффициент внутригнездовой корреляции


Ключевым показателем в гнездовом подходе становится индикатор однородности гнезда, так называемая внутригнездовая корреляция. Этот показатель измеряет близость единиц одного и того же гнезда друг другу.
Его исчисление сводится к сравнению каждой единицы гнезда с другой единицей. В качестве непосредственного измерителя близости выступают произведения отклонений индивидуальных значений признака от гнездовой средней:
(х в - X )(х - X ).
v*~ap              a'V ay a'
Общее число пар, используемых для сравнения, составляет M(M -1)



гнездам соотносится с величиной дисперсии:
" A. Y              2
R Y M(M -1)



где r — число гнезд на данной ступени;
М — размер гнезда.
Данная формула исходит из того, что размеры гнезд одинаковы, в противном случае используется средний размер гнезда424.
Коэффициент внутригнездовой корреляции может с учетом специфики выборочных оценок исчисляться и по формуле:
1



Коэффициент внутригнездовой информации важен при рассмотрении влияния на репрезентативность не только пространственных гнезд, о которых шла речь выше (область, город, предприятие, семья, и т.д.), но и временных гнезд. Здесь, в частности, имеются в виду гнезда, возникающие во время опроса одних и тех же единиц в течение определенного периода времени, например в течение 2-3 дней. Так как деятельность людей в отдельные дни взаимозависима (если человек не приобрел, скажем, мяса в понедельник, то вероятность покупки во вторник сильно возрастает), то из-за высокой внутригнездовой корреляции полученная информация частично обесценивается. Потому предлагается в таких случаях уменьшать число дней опроса каждого респондента, но зато увеличивать объем выборки[395].
Сравнение случайной и гнездовой одноступенчатой выборок
Выше отмечалось, что увеличение неоднородности гнезда способствует приближению гнездовой средней к генеральной средней и уменьшению межгнездовой дисперсии. Это компенсирует резкое уменьшение знаменателя в формуле ошибки для случайной выборки. Однако эта компенсация не может быть полной, и случайный отбор при том же объеме конечных единиц дает часто существенно более точные результаты, чем отбор гнездовой. Поэтому использование формулы для исчисления случайной ошибки выборки к ситуациям, в которых применяется гнездо, является вещью недозволенной. К сожалению, специфика гнездовой выборки очень часто игнорируется многими иссле- дователями[396]. Можно утверждать, что проблема гнезда является наименее разработанной в советской социологии из всех вопросов выборки, и поэтому пробелы знаний социолога-практика именно здесь наиболее велики[397].

Рассмотрим теперь проблемы соотношения ошибок гнездовой и чисто случайной выборок.
Сопоставление гнездовой ошибки выборки с ошибкой при чисто случайном отборе характеризует «эффект гнезда»:
K _ CTM / r
lt;52 /П '
Рассмотрим следующий пример. Генеральная совокупность состоит из 50 тысяч семей города. Целью опроса является определение числа лиц, которые пользуются услугами прачечных. Город разделен на 1000 участков, существенно отличающихся друг от друга по многим параметрам, но не по размерам. Опрос проводился в 10 отобранных случайным образом участках, в каждом из которых обследованию подвергались все семьи. Результаты опроса оказались следующими (доля лиц, пользующихся услугами пра-
2 50
чечных): 0,2, 0,1, 0,3, 0,1, 0,4, 0,2, 0,3, 0,3, 0,5, 0,1; х _—— 0,25 ; a2M _ 0,01833;              10
_ 0,01833 .0,9 _ 0,001650 . гн 10
Предположим, что отбор носил чисто случайный характер, тогда при том же объеме выборки (500) ошибка была бы равна
ц2 _ 0,25'0,75 • 0,99_0,000371, а эффект гнезда K _ 0,001650 «4.
500              эф 0,000371
Это означает, что использование гнездового подхода потребовало бы увеличения объема выборки в 4 раза, чтобы получить такую же точность результатов, как при случайном отборе.
Выше уже подчеркивалась особая роль структуры гнезда. Поэтому при определении эффекта гнезда сравнительно с чисто случайной выборкой полезно выделить влияние на него коэффициента внутригнездовой корреляции. Использовав приведенные выше формулы, после простых преобразований получим:
Кэф = 1+p(M-1).
Из приведенного выражения видно, что чем выше коэффициент корреляции, тем сильнее эффект гнезда, тем сильнее превос-
нин Н.К. Некоторые вопросы теории выборочного метода (об общей формуле ошибки выборки. — В кн.: Сборник научных трудов. М., 1952). В этой же связи выделяется статья А.Г. Волкова: Волков А.Г. О единице отбора при выборочном изучении населения. — В кн.: Вопросы демографии. М., 1970, а также изданная небольшим тиражом книга под редакцией И.Г. Венецкого: Венецкий И.Г. Теоретические и практические основы применения выборочного метода. М., 1972.

ходит ошибка гнездовой выборки ошибку случайной выборки при том же объеме обследования конечных единиц. Если р равно «1», т.е. внутригнездовая корреляция достигла максимума; эффект гнезда равен М, т.е. величине гнезда. Это происходит от того, что увеличение гнезда в условиях полной идентичности единиц не прибавляет никакой новой информации исследователю, и, по существу, изучение всех единиц гнезда, кроме одной, является полной потерей, и произведенные затраты никак не могут сказаться на величине ошибки. Если же коэффициент внутригнездовой корреляции равен «0» и элементы гнезда не похожи друг на друга, то эффект гнезда равен «1 ». В этих условиях применение обоих типов отбора дает одинаковую ошибку.
Прикладная социология, в том числе и отечественная, накопила известный опыт по изучению структуры гнезд и определению в связи с этим эффекта гнезда. Наиболее заметным в этом отношении является исследование, осуществленное А.Г. Волковым428. При обработке материалов пробной переписи населения он изучил структуру 3 типов гнезд — семей, квартир и счетных участков переписи — по 7 признакам (Автозаводский район г. Горького, март, 1967 г.). Вот некоторые из полученных А.Г. Волковым результатов (см. табл. 3).
Приведенные данные показывают прежде всего то, что с переходом от мелких гнезд к крупным коэффициент корреляции заметно снижается. Кроме того, установлено, что с увеличением общности признака коэффициент растет. Так, коэффициент для семей по признаку «работники промышленности» довольно высокий (0,41). Он свидетельствует о достаточно большой вероятности того, что если муж работает в промышленности, то и жена трудится там же. Если же взять отдельные занятия, то коэффициент резко снизится, например, для инженера он равен всего 0,07, ста-
Таблица3
Значения коэффициента внутригнездовой корреляции

Признаки

Семья

Квартиры

Счетные




участки

Работники промышленности

0,4093

0,3083

0,0587

Работники транспорта и связи

0,4917

0,3962

0,0546

428 Волков А.Г. О единице отбора при выборочном изучении населения. — В кн.: Вопросы демографии. М., 1970, стр. 109-112.





ночника — 0,04 и т.д. На основе сведений о коэффициенте внут- ригнездовой корреляции А.Г. Волков определил степень возрастания ошибки выборки для отдельных признаков.
Аналогичные исследования на болгарских материалах провела М. Динева[398]. Данные М. Диневой вновь подтвердили отмеченное выше положение об обратной зависимости между размером гнезда и величиной внутригнездовой корреляции. М. Динева также подсчитала степень снижения точности выборки из-за применения гнезд. Так, если число лиц, отобранных в гнезде, составляет 20, то (применительно к населенному пункту) степень точности снижается в 1,5 раза[399].
<< | >>
Источник: Шляпентох В.Э.. Проблемы качества социологической информации: достоверность, репрезентативность, прогностический потенциал. — М.: ЦСП. — 664 с.. 2006

Еще по теме Коэффициент внутригнездовой корреляции:

  1. 7.4.1. Линейный коэффициент корреляции
  2. 7.4.2. Коэффициенты корреляции рангов
  3. 9.5. КОЭФФИЦИЕНТЫ КОРРЕЛЯЦИИ РАНГОВ
  4. 8.8. Корреляция рядов динамики
  5. 7.4.3. Коэффициент конкордации
  6. 9.6. МНОЖЕСТВЕННАЯ КОРРЕЛЯЦИЯ
  7. 10.6. КОРРЕЛЯЦИЯ В РЯДАХ ДИНАМИКИ
  8. 7.8. Множественная корреляция
  9. 3.7.1. Районный коэффициент
  10. § 4. Коэффициенты преступности и ее структура
  11. 7.5.3. Гиперболическая корреляция
  12. КОЭФФИЦИЕНТЫ ДЕМОГРАФИЧЕСКИЕ
  13. График. (Поле корреляции, диаграмма рассеивания)
  14. КОЭФФИЦИЕНТ ТОБИНА
  15. 4.3.6. Повышающие и понижающие коэффициенты
  16. 7.5.2. Параболическая корреляция
  17. КОЭФФИЦИЕНТ РОЖДАЕМОСТИ СУММАРНЫЙ
  18. КОЭФФИЦИЕНТ ДЕМОГРАФИЧЕСКОЙ НАГРУЗКИ
  19. 10.7. ТЕХНИКА НА ОСНОВЕ РАНГОВЫХ КОРРЕЛЯЦИЙ
  20. К ЧЕМУ ПРИВОДИТ НЕПРАВОМЕРНОЕ И ОШИБОЧНОЕ ИГНОРИРОВАНИЕ ТРЕБОВАНИЙ УЧЕТА «КОЭФФИЦИЕНТА КОНТРОЛЯ»