2.5. Контроль данных статистического наблюдения Виды ошибок
Различают преднамеренные и непреднамеренные ошибки регистрации, определяемые степенью тенденциозности подхода к установлению фактов. Преднамеренные ошибки выражаются чаще всего в виде приписок, сознательного завышения значений признаков, приукрашивающих результаты производственно-хозяйственной деятельности в целях извлечения выгоды. Приписки были нередким явлением в статистической практике в застойный период отечественной экономики. Перестройка в работе органов государственной статистики должна решительным образом искоренить еще имеющее место сознательное приукрашивание положения дел на производстве и в обществе. Источник непреднамеренных ошибок заключается в несовершенстве методологического и организационного обеспечения статистического наблюдения, недостаточной подготовленности кадров, состояния материально-технической базы, трудовой и исполнительной дисциплины субъекта наблюдения.
Ошибки регистрации подразделяются на случайные и систематические. Природа случайных ошибок определяется в основном теми же многообразными обстоятельствами, что и непреднамеренных ошибок. К ним же могут быть причислены описки, неточности и ошибки, сбои в работе вычислительной техники. Систематические ошибки имеют специфический характер, возникая в решении вполне определенного круга задач. Примером систематической ошибки служит широко известное в статистике явление возрастной аккумуляции, заключающееся в округлении возраста лицами средней и старшей возрастных групп при ответе на вопрос о возрасте.
Отдельно можно выделить счетные и методологические ошибки, связанные с применением200
Глава 2. Статистическое наблюдение
несовершенных методов учета. Такого вида ошибки могут возникать и на последующих этапах статистического исследования.
При проведении выборочных наблюдений возникают характерные для них ошибки, обусловленные различием численности единиц, входящих в выборочную и исходную совокупность, тем, что по выборочным данным с определенной вероятностью судят о всей совокупности. Эти ошибки называют ошибками репрезентативности (представительности).
В зависимости от момента обнаружения ошибки подразделяются шустранимые и неустранимые. При наличии условий для своевременного внесения корректив в первичную или отчетную документацию ошибка устраняется. Информация о выявленной ошибке может быть передана в вышестоящее звено и после передачи отчетности.
Целесообразно выделить категории действительных и мнимых ошибок. К числу мнимых, или псевдоошибок, относится кажущаяся недостоверной информация, воспринимаемая как ошибка регистрации, тогда как в действительности она выражает неординарность явлений.
Классификация ошибок наблюдения представлена на рис. 2.3.
— Низкое качество методологии
Причины возникновения
Приписки, искажения данных
Низкое качество организации наблюдения
Описки
Объем выборки
Момент обнаружения ошибки
Неординарность явлений
Виды ошибок
Преднамеренные
Непреднамеренные
Методологические
Случайные
Репрезентативности
Устранимые
Неустранимые
Мнимые
Рис. 2.3. Виды ошибок регистрации
2.5. Контроль данных статистического наблюдения
201
Рассмотрим возможные ошибки статистического наблюдения на примере следующих вопросов анкеты: Есть ли у Вас дома телевизор? Когда у Вас дома впервые появился телевизор? Считаете ли Вы, что дома следует иметь телевизор? Собираетесь ли Вы приобрести телевизор?
Сколько времени в среднем Вы смотрите телевизионные передачи?
Есть ли у Вас дома телевизор? (Да, нет).
В соответствии с планом исследования этот вопрос должен был быть обращен ко всем респондентам. Однако уже при прочтении вопроса становится очевидным наличие в его конструкции двух слов, обладающих неоднозначной трактовкой; эти слова — «есть» и «дом». Обратимся к статистике. Из 124 человек, живущих в общежитии, 68 человек (55%) отметили градацию «Да» и 56 (45%) указали «Нет». Конечно, можно допустить, что в отдельных общежитиях нет телеприемника, но при современном уровне распространенности телевидения доля таких общежитий чрезвычайно мала. Примерно равное количество ответов «Да» и «Нет» свидетельствует скорее о различном понимании названных выше слов. Одни респонденты оценивают факт наличия телевизора в их общежитии как его наличие в их доме, другие — как его отсутствие (поскольку он не принадлежит им). Формулировка вопроса привела к снижению данных о количестве телевизоров в семьях рабочих и практически не отразилось на других группах опрашиваемых. Выборочная совокупность исследования — 200 чел. —- включает в себя представителей шести групп по роду труда:1-я группа — рабочие неквалифицированного и малоквалифицированного труда;
2-я группа — рабочие квалифицированного труда;
3-я группа — служащие без специальной подготовки и образования;
4-я группа — служащие со специальным образованием;
5-я группа — служащие с высшим образованием;
6-я группа — руководители трудовых коллективов.
Среди 124 чел., проживающих в общежитии, 114 — молодые рабочие, и вес группы оказывается значительным в общей совокупности рабочих (1116 чел.). В целом по массиву рабочих доля респондентов, указавших на наличие у них телевизора, равна 91%. Если же пересчитать количество телевизоров, приходящихся на семьи рабочих, живущих не в общежитии, то получим величину, равную 96%. Неоправданное эмпирическое расширение сферы применения вопроса привело к 5%-ному смещению в определении концентрации телесредств в семьях рабочих.
202
Глава 2. Статистическое наблюдение
Когда у Вас дома впервые появился телевизор? Выше отмечалось одно обстоятельство, снижающее надежность вопроса, — неоднозначная трактовка понятий «впервые», «у Вас дома».
Вторая причина ненадежности эмпирической информации при ответе на этот вопрос заключается в том, что мы обращаемся к памяти респондента; в отдельных случаях мы вынуждаем опрашиваемого вспомнить время свершения события, достаточно удаленного от настоящего момента. Специалисты отмечают необходимость «сглаживания» подобной информации перед ее содержательной интерпретацией.Считаете ли Вы, что дома следует иметь телевизор? (Да, нет, затрудняюсь ответить). Собираетесь ли Вы (или Ваша семья) приобрести телевизор? (Да, нет, затрудняюсь ответить). Такие же вопросы задавались и в отношении радиоприемника и трехпрограммного репродуктора. Информация о намерениях вообще менее надежна, нежели данные фактологические или демографические. В методологических исследованиях отмечается, что при ответах на вопросы, изучающие ориентацию респондента, в значительной мере влияют, а значит, и смещают информацию факторы престижности обладания средствами массовой коммуникации.
Обращает на себя внимание высокая частота выбора градации «Затрудняюсь ответить». В зависимости от средства коммуникации она изменяется для первого вопроса от 8 до 20%, для второго — от 12 до 21% и в среднем равна 16%. Активный выбор одной градации ответа на вопрос указывает на наличие объективных обстоятельств, стоящих за подобным поведением респондентов. При интерпретации причин, побудивших респондентов к выбору градации «Затрудняюсь ответить», могут быть отмечены два обстоятельства, соответствующие различным способам понимания анализируемых вопросов. Первое — респондент задумывался о том, следует ли ему приобрести то или иное средство коммуникации, эта проблема обсуждалась в его семье, но не было принято определенного решения. Второе — респондент и его семья никогда не задумывались по поводу приобретения телевизора или другого отсутствующего у них средства массовой коммуникации, эта проблема не оказывалась в поле их зрения. Другими словами, в первом случае человек, семья не смогли принять определенного решения, в другом — его никто и не пытался искать.
Укажите, пожалуйста, сколько времени в среднем Вы смотрите телевизионные передачи? (вопрос задавался по отношению к будним и выходным дням).
Первое, что представляется необходимым проверить, это то, насколько реальная продолжительность просмотра телепередач укладывается в границах шкал. Рассмотрим распределение ответов на изучаемые вопросы, % к общему числу опрошенных:2.5. Контроль данных статистического наблюдения 203 Дни недели Не смотрю Не более 1 ч 1-2 ч 2-3 ч 3-4 ч 4-5 ч Свыше 5 ч Будни 1 8 45 31 11 3 1 Выходные 2 2 17 31 25 12 11 Модальными градациями при ответе на вопрос, относящийся к будням, являются «1-2 ч» и «2-3 ч». Распределение, характеризующее продолжительность просмотра телепередач в выходные дни, сдвинуто вправо. Содержательное объяснение этого факта очевидно: в выходные дни люди большее время, нежели в будни, проводят у телевизора. Шкалы обладают высокой воспроизводимостью, поскольку степень выраженности признака хорошо различима, но невысокой правильностью. Для повышения правильности следует применять различные разбиения временных шкал при изучении продолжительности просмотра телепередач в будние дни и выходные. В первом случае, несомненно, необходима более мелкая градуировка на левом конце шкалы, во втором — на правом. Размах шкалы «Будни» при изучении работающей части населения можно сократить, ограничив ее правый конец отметкой «Свыше 4 ч». Вероятно, измерение, отвечающее данному методу, приводит к завышенному значению затрат времени в будние дни и к заниженному — в выходные.
Еще одним источником появления ошибок в определении продолжительности просмотра телепередач может быть неверное взвешивание градаций вопроса числовыми баллами. Если справедливо предположение о симметричном распределении временных затрат отдельных градаций, то этот балл естественно положить равным середине интервала, в противном случае подобный алгоритм приведет к систематической погрешности. Так, количество респондентов, отметивших градацию «2-3 ч», в обоих случаях оказалось одинаковым — 31%. Однако вид распределения ответов позволяет предположить, что реальные затраты времени на просмотр телепередач в будние дни концентрируются в левой части интервала «2-3 ч», а затраты времени в выходные дни более плотно расположены в правой части этого интервала.
Следующее обстоятельство, которое необходимо иметь в виду при оценке надежности нашего инструмента, это неоднозначное понимание слов «смотреть телевизионные передачи».
В настоящее время просмотр телепередач превращается из деятельности в «содеятельность». Следовательно, часть респондентов интерпретирует для себя «смотрел» как «только смотрел», тогда как другие понимают это слово достаточно широко, учитывая, что просмотр телепередач зачастую протекает как вторичный, третичный и т.д. вид деятельности.204
Глава 2. Статистическое наблюдение
Методы контроля данных
На качество материалов статистического наблюдения влияет характер контроля формуляров и другой учетной документации, осуществляемого в процессе их приемки. Различают контроль формы и содержания.
Контроль формы включает обнаружения пропусков, отсутствие ответов. Содержательный контроль осуществляется в двух формах: счетный и логический. Счетный контроль заключается в проверке итогов подсчета данных формуляров. Там, где имеет место расчет взаимосвязанных показателей, контроль возможен в результате установления некоторой их количественной связи, а также балансовым методом.
Логический контроль осуществляют путем проверки содержательной связи между значениями признаков по каждой единице наблюдения. В тех случаях, когда нарушается логическая связь признаков, необходимо установить, содержит ли формуляр действительно допущенную ошибку регистрации либо данное сочетание признаков предопределено неординарностью ситуации. Логический контроль, в отличие от счетного, непосредственно не устанавливает ошибку наблюдения, а лишь сигнализирует о ее возможности и требует дополнительной связи с единицей наблюдения.
Госкомстат и его местные органы для повышения достоверности данных первичного учета систематически контролируют его в условиях производственных предприятий и учреждений непроизводственной сферы. Наряду с проверкой документов первичного учета статистические органы значительное внимание уделяют контролю качества статистической отчетности путем изучения ее полноты, правильности заполнения форм, документальной обоснованности данными первичного, оперативно-технического и бухгалтерского учета.
Еще по теме 2.5. Контроль данных статистического наблюдения Виды ошибок:
- Глава 2. Статистическое наблюдение
- 2.1. Формы, виды и способы статистического наблюдения Понятие статистического наблюдения
- 2.5. Контроль данных статистического наблюдения Виды ошибок
- ГЛАВА 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ
- 2.1. МАССОВОЕ СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ — ПЕРВЫЙ ЭТАП СТАТИСТИЧЕСКОГО ИССЛЕДОВАНИЯ
- 2.2. ПРОГРАММА СТАТИСТИЧЕСКОГО НАБЛЮДЕНИЯ
- 2 .3. ОРГАНИЗАЦИОННЫЙ ПЛАН СТАТИСТИЧЕСКОГО НАБЛЮДЕНИЯ
- 2.4. ВИДЫ И СПОСОБЫ СТАТИСТИЧЕСКОГО НАБЛЮДЕНИЯ
- 2.5. КОНТРОЛЬ МАТЕРИАЛОВ СТАТИСТИЧЕСКОГО НАБЛЮДЕНИЯ
- Глава 2 ОБЩИЕ СВЕДЕНИЯ О СТАТИСТИЧЕСКОМ НАБЛЮДЕНИИ
- 2.1. Статистическое наблюдение как первый этап статистического исследования. Организационные формы статистического наблюдения
- 2.2. Виды и способы статистического наблюдения
- 2.3. Программно-методологические и организационные вопросы статистического наблюдения
- 2.4. Ошибки статистического наблюдения и контроль данных наблюдения
- Гпава 4 УРОВЕНЬ ЖИЗНИ КАК ОБЪЕКТ СТАТИСТИЧЕСКОГО НАБЛЮДЕНИЯ
- Глава 3. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕВ ЮРИДИЧЕСКОЙ СТАТИСТИКЕ
- § 1. Понятие статистического наблюдения и организацияего проведения
- § 2. Организационные формы статистического наблюдения
- § 3. Виды и способы статистического наблюдения
- Статья 5. Федеральные статистические наблюдения за деятельностью субъектов малого и среднего предпринимательства