Определение связи и соответствующих процедур для обеспечения качества в интегрированном регистр-переписи Пнина ЗАДКА Центральное бюро статистики Израиль 15 נובמבר 06 Pnina ZADKA, ISRAEL.
Download ReportTranscript Определение связи и соответствующих процедур для обеспечения качества в интегрированном регистр-переписи Пнина ЗАДКА Центральное бюро статистики Израиль 15 נובמבר 06 Pnina ZADKA, ISRAEL.
Определение связи и соответствующих процедур для обеспечения качества в интегрированном регистр-переписи Пнина ЗАДКА Центральное бюро статистики Израиль 15 נובמבר06 Pnina ZADKA, ISRAEL 1 Содержание презентации Источники данных Проверка источников данных Связь данных Процедуры обеспечения качества источников данных 29 May 2007 Pnina ZADKA, ISRAEL 2 Административные источники данных • Национальный регистр населения (НРН) • Институт национального страхования (социальное и медицинское страхование) • Подоходный налог • Муниципальное социальное обеспечение • Пограничный контроль • Телефонные номера • Контингент учащихся 29 May 2007 Pnina ZADKA, ISRAEL 3 Проверка административных данных • Определение потенциальных ошибок • Достоверность • Полнота охвата 29 May 2007 Pnina ZADKA, ISRAEL 4 Потенциальные административные ошибки • Административные ошибки в адресах – Налоги (периферийные населенные пункты) – Контингент учащихся (региональные преференции) – Студенты (право на получение стипендии) – Рабочие места – Ошибки ввода данных Источники с известными ошибками в адресе использовались только в случае, когда адрес проверялся по всем членам семьи 29 May 2007 Pnina ZADKA, ISRAEL 5 Потенциальные административные ошибки • Административные ошибки в учете населения – нерезиденты (студенты, рабочие, беженцы) – избегающие контакта с официальными властями (преступники) – Имеющие/не имеющие права на обслуживание Добавление лиц из дополнительных источников с двойной проверкой путем: включения деталей, имени и номера документа, удостоверяющего личность при помощи связи детерминированных/вероятностных данных 29 May 2007 Pnina ZADKA, ISRAEL 6 Проверка на достоверность • Достоверность номера документа, удостоверяющего личность – Проверка законности контрольных цифр (на основе используемой формулы) – Наличие номера в НРН Для обновления и добавления информации, не включенной в НРН, рассматривались только данные, прошедшие проверку на достоверность 29 May 2007 Pnina ZADKA, ISRAEL 7 Соответствие данных Обновление данных по населению • НРН • Пограничный контроль + рождаемость и смертность • Социальное обеспечение Обновление адресов • Счетчики электроэнергии • Контингент учащихся • Учет транспортных средств 29 May 2007 Pnina ZADKA, ISRAEL 8 Создание административных семей • • • • НРН – все семейные отношения Проживающие по тому же адресу НРН Добавление произвольных адресов Согласование одиноких лиц Воссоздание семьи – итеративный метод (примерно 3 итерации) 29 May 2007 Pnina ZADKA, ISRAEL 9 Связь данных Полное соответствие с НРН (детерминированная процедура) – номер документа, удостоверяющего личность, в т.ч. контрольная цифра – имя, пол, дата рождения Данные объединялись только в случае полного соответствия, таким образом создавалась исчерпывающая информация, включающая данные всех объединенных файлов. 29 May 2007 Pnina ZADKA, ISRAEL 10 Связь данных • Вероятностная процедура – Имя (фамилия и имя) с ошибками в написании и упущениями гласных, пол – Год рождения Взвешенная иерархия переменных. Порог вероятности точности соответствия, превышающий 85% (вероятность, подсчитанная на основе данных пилотной переписи и предыдущей переписи населения) Адрес для соответствия не использовался – основную переменную необходимо изменить! 29 May 2007 Pnina ZADKA, ISRAEL 11 Выводы • Административные источники являются важными и доступными источниками данных • Источники данных необходимо проверять на присущие ошибки • Необходимо установить иерархию точности данных • Использование итеративных методов объединения • Проверка процесса при помощи традиционной переписи методом обхода населения 29 May 2007 Pnina ZADKA, ISRAEL 12