Определение связи и соответствующих процедур для обеспечения качества в интегрированном регистр-переписи Пнина ЗАДКА Центральное бюро статистики Израиль 15 נובמבר 06 Pnina ZADKA, ISRAEL.

Download Report

Transcript Определение связи и соответствующих процедур для обеспечения качества в интегрированном регистр-переписи Пнина ЗАДКА Центральное бюро статистики Израиль 15 נובמבר 06 Pnina ZADKA, ISRAEL.

Определение связи и
соответствующих процедур для
обеспечения качества в
интегрированном регистр-переписи
Пнина ЗАДКА
Центральное бюро статистики
Израиль
15 ‫ נובמבר‬06
Pnina ZADKA, ISRAEL
1
Содержание презентации
Источники данных
Проверка источников данных
Связь данных
Процедуры обеспечения качества
источников данных
29 May 2007
Pnina ZADKA, ISRAEL
2
Административные источники
данных
• Национальный регистр населения (НРН)
• Институт национального страхования
(социальное и медицинское страхование)
• Подоходный налог
• Муниципальное социальное обеспечение
• Пограничный контроль
• Телефонные номера
• Контингент учащихся
29 May 2007
Pnina ZADKA, ISRAEL
3
Проверка административных данных
• Определение потенциальных ошибок
• Достоверность
• Полнота охвата
29 May 2007
Pnina ZADKA, ISRAEL
4
Потенциальные административные
ошибки
• Административные ошибки в адресах
– Налоги (периферийные населенные пункты)
– Контингент учащихся (региональные
преференции)
– Студенты (право на получение стипендии)
– Рабочие места
– Ошибки ввода данных
Источники с известными ошибками в адресе
использовались только в случае, когда адрес
проверялся по всем членам семьи
29 May 2007
Pnina ZADKA, ISRAEL
5
Потенциальные административные
ошибки
• Административные ошибки в учете населения
– нерезиденты (студенты, рабочие, беженцы)
– избегающие контакта с официальными властями
(преступники)
– Имеющие/не имеющие права на обслуживание
Добавление лиц из дополнительных источников с двойной
проверкой путем:
включения деталей,
имени и номера документа, удостоверяющего личность при
помощи связи детерминированных/вероятностных данных
29 May 2007
Pnina ZADKA, ISRAEL
6
Проверка на достоверность
• Достоверность номера документа,
удостоверяющего личность
– Проверка законности контрольных цифр (на основе
используемой формулы)
– Наличие номера в НРН
Для обновления и добавления информации, не
включенной в НРН, рассматривались только
данные, прошедшие проверку на
достоверность
29 May 2007
Pnina ZADKA, ISRAEL
7
Соответствие данных
Обновление данных по населению
• НРН
• Пограничный контроль + рождаемость и
смертность
• Социальное обеспечение
Обновление адресов
• Счетчики электроэнергии
• Контингент учащихся
• Учет транспортных средств
29 May 2007
Pnina ZADKA, ISRAEL
8
Создание административных
семей
•
•
•
•
НРН – все семейные отношения
Проживающие по тому же адресу НРН
Добавление произвольных адресов
Согласование одиноких лиц
Воссоздание семьи – итеративный метод
(примерно 3 итерации)
29 May 2007
Pnina ZADKA, ISRAEL
9
Связь данных
Полное соответствие с НРН
(детерминированная процедура)
– номер документа, удостоверяющего личность, в
т.ч. контрольная цифра
– имя, пол, дата рождения
Данные объединялись только в случае полного
соответствия, таким образом создавалась
исчерпывающая информация, включающая
данные всех объединенных файлов.
29 May 2007
Pnina ZADKA, ISRAEL
10
Связь данных
• Вероятностная процедура
– Имя (фамилия и имя) с ошибками в написании и упущениями гласных, пол
– Год рождения
Взвешенная иерархия переменных.
Порог вероятности точности соответствия, превышающий 85%
(вероятность, подсчитанная на основе данных пилотной
переписи и предыдущей переписи населения)
Адрес для соответствия не использовался – основную переменную
необходимо изменить!
29 May 2007
Pnina ZADKA, ISRAEL
11
Выводы
• Административные источники являются важными и
доступными источниками данных
• Источники данных необходимо проверять на
присущие ошибки
• Необходимо установить иерархию точности данных
• Использование итеративных методов объединения
• Проверка процесса при помощи традиционной
переписи методом обхода населения
29 May 2007
Pnina ZADKA, ISRAEL
12