Документирование и распространение данных переписи населения и опроса Липо Серво, ЭСКАТО ООН, Бангкок, [email protected] для Обучающего семинара ЕЭК ОНН по технологии переписи для стран-членов СПЕКА, г.
Download ReportTranscript Документирование и распространение данных переписи населения и опроса Липо Серво, ЭСКАТО ООН, Бангкок, [email protected] для Обучающего семинара ЕЭК ОНН по технологии переписи для стран-членов СПЕКА, г.
Документирование и распространение данных переписи населения и опроса
Липо Серво, ЭСКАТО ООН, Бангкок, [email protected]
для Обучающего семинара ЕЭК ОНН по технологии переписи для стран-членов СПЕКА, г. Астана, 7-8 июня 2007г.
Содержание A. Систематическое документирование данных переписи B. Для чего нужно распространять микроданные?
C. Средства управления микроданными
A. Систематическое документирование данных переписи
Качественный набор данных переписи является..
• Четко задокументированным • Исключает возможность непредвиденных случаев • Позволяет пользователю – Быстро приступить к работе – Найти необходимые данные – Понять, что определяют данные и как они создаются – Оценить качество данных
Развитие технологии документирования
• Наличие стандартов документирования => международные стандарты по метаданным • Национальная практика =>лучшая международная практика • Специальные средства => средства структурирования, базы данных • Текстовые словари кодов => словари кодов XML
Содержание метаданных в центральной базе данных
• Управление определениями, методологическая информация, информация по переменным, информация по сбору данных одновременно • Обеспечивает согласованность хранилищ данных • Эффективный подход к планированию, сбору данных, обработке, анализу и распространению
Лучшие виды практики документирования данных • Пояснительный материал – Требуется минимум материалов для обеспечения долгосрочной устойчивости и функциональности набора данных • Контекстуальная информация – Материал о контексте, в рамках которого проводился сбор данных, и об использовании данных – Позволяет вторичному пользователю полностью понять предпосылки и процессы сбора данных • • Материалы каталогизации – Библиографический учет набора данных, для соответствующего признания и ссылки – Базовый инструмент, используемый для поиска ресурсов http://www.esds.ac.uk/news/goodPractice.pdf
B. Для чего нужно распространять микроданные?
Неиспользованный потенциал микроданных для национального развития • • Даже самым тщательным образом спланированное составление таблиц не могут извлечь всю исчерпывающую информацию из данных переписи Разнообразие, несоответствия и связанные причины наилучшим образом анализируются при помощи микроданных, н-р, – Прослеживание влияния политических вмешательств на целевые группы – Определение масштабов несоответствий внутри страны • Качество исследования способствует => увеличению результатов сбора данных => Более эффективной постановке национальной политики => Более эффективному использованию общественных ресурсов
Факторы, препятствующие распространению данных Обсуждение • Вопросы конфиденциальности данных • Неясность или отсутствие национального законодательства • Ограниченные полномочия статистического агентства • Вопросы качества данных • Низкий уровень использования данных пользователями
Международные инициативы
• Марракешский план действий в области статистики, http://www.surveynetwork.org/home/docs/Marrakech_Action_Pla n_for_Statistics.pdf
• Международная сеть по обследованию домашних хозяйств, http://www.surveynetwork.org/ • Средство управления микроданными IHSN • ЭСКАТО-Всемирный банк-PARIS21 проект по улучшению доступа к исследованию микроданных в Азии и Тихом Океане
Проект ЭСКАТО по улучшению доступа к исследованию микроданных в Азии и Тихом Океане, 2007-2008гг.
• Обследование домашних хозяйств, перепись населения и жилищного фонда, не обследование предприятий • Оценка состояния распространения микроданных • Региональный реестр и архив данных по переписи жилищного фонда • Региональная защита и обучающие семинары • Обучение на практике и техническая помощь по документации и сохранению анонимности
C. Средства управления микроданными
Средства управления микроданными – Резюме
Набор средств программного обеспечения для документирования, архивирования, распространения и хранения микроданных 1. Редактор метаданных
–
Данные документального обследования в соответствии с международными стандартами 2. CD-Rom формирователь
–
Создает информационные средства, ориентированные на пользователя, такие как CD, вебсайты для распространения и архивирования данных 3. Проводник
– –
Для просмотра метаданных Для перевода данных в разные форматы
Загрузка и использование
• Пакет средств распространения можно закачать с http://www.surveynetwork.org/home/?lvl1=tools&lvl2= documentation&lvl3=toolkit • Кроме редактора метаданных, все компоненты пакета средств бесплатны • Редактор Nesstar Editor: одна свободная лицензия для БС всемирного Банка участников МАР (н-р, Афганистан, Грузия, Республика Кыргызстан, Молдова, Таджикистан)
Редактор метаданных
• Данные документального обследования в соответствии с международными стандартами • Инициатива документирования данных (ИДД) • Дублинская инициатива по ключевым метаданным ( ДИКМ) • Данные и метаданные в одном файле • Данные могут импортироваться из разных форматов, в т.ч. пакетов статистических данных • Создает документацию обследования в формате PDF
Расширяемый язык разметки (XML)
• Язык для описания данных с использованием управляющих кодов (тэгов) • Концептуально тэги аналогичны полям базы данных • Файлы XML – это обычные текстовые файлы • Можно редактировать текстовыми редакторами • Файлы XML, как и базу данных, можно: • Искать и запрашивать • редактировать • Обучающая программа: http://w3schools.com/xml
Пример файла XML
Преимущества XML
• Создание исчерпывающего контрольного списка элементов метаданных • Возможность использования содержимого файла путем определения присутствия или отсутствия специальных тэгов в файле • Создание каталога базы данных, где можно запрашивать элементы ключевых метаданных • Возможность трансформировать файл в формат, более ориентированный на пользователя, такой как HTML, PDF • Файлами XML можно обмениваться в сети или Интернете при помощи веб-услуг или протокола SOAP
CD-ROM формирователь
• Интегрируется с редактором метаданных • Создает средства, ориентированные на пользователя (CD-Rom, вебсайт) для распространения и архивирования данных ( формат HTML) • Позволяет изготовление по заказу – Брэндинг: внешний вид и качества CD или вебсайта – Содержание: единое или многочисленные обследования
Процесс работы CD-ROM формирователя
1
Создать новый проект CD-ROM
2
Добавить обзор в проект и выбрать его тип и брэндинг
3
Нажать клавишу Save для создания интерфейса HTML • Выбор составляющего обзора путем открытия файла DDI XML или Nesstar •Брэндинг •Тип умолчанию обзора определяет внешний вид и качество CD обзора определяет содержание метаданных по
4
Через несколько минут, Ваш проект CD готов к публикации!
Пример вывода данных CD-ROM формирователем
Демонстрация редактора метаданных
Оперативный показ с набором данных Popstan, на экране на английском и русском языках