Опыт использования сканеров К.С.Абдиев Агентство Республики Казахстан по статистике Информационно-вычислительный центр Первая национальная перепись населения • Организация 5 кустовых центров обработки данных • Обработано более 3 млн бланков.

Download Report

Transcript Опыт использования сканеров К.С.Абдиев Агентство Республики Казахстан по статистике Информационно-вычислительный центр Первая национальная перепись населения • Организация 5 кустовых центров обработки данных • Обработано более 3 млн бланков.

Опыт использования
сканеров
К.С.Абдиев
Агентство Республики Казахстан по статистике
Информационно-вычислительный центр
Первая национальная перепись
населения
• Организация 5 кустовых центров
обработки данных
• Обработано более 3 млн бланков в
каждом из центров
• ИВЦ (г.Алматы) – создание центральной
БД переписи населения
Табл.1 Основные показатели по объему
обработанных данных
Центры
обработки
Кол-во
сканер
ов, шт
Кол-во переписных
бланков,
шт
Кол-во
портфелей
шт
Кол-во
бланков
обработанных одним
сканером, шт
Продолжительность
обработки,
дни
Обработано
бланков за
один день,
шт
Алматинский
3
4743300
15800
1581100
102
46503
Актюбинский
2
3402191
11420
1701096
110
30929
ВосточноКазахстанский
2
3000123
10040
1500062
90
33335
Карагандинск.
2
4590000
14027
2295000
120
38250
ЮжноКазахстанский
2
3710657
12847
1855329
90
41230
Всего
11
19446271
64134
Табл.2 Количество работников,
участвовавших в обработке данных
Центры
обработки
КоррекОператоры Специалисты
тировщики по
технического
подготовке обслуживания
бланков для
сканера
Всего,
чел
Алматинский
90
36
3
129
Актюбинский
60
21
3
84
ВосточноКазахстанский
68
12
2
82
Карагандинский
66
16
2
84
ЮжноКазахстанский
68
16
4
88
Всего
352
101
14
467
ScanStar 5045C
• Скорость сканирования –
до 50 бланков в мин.,
фактическая – 30 бланков
• Формат – А4,
разрешимость 200 точек
на дюйм
• 150 бланков на один лоток
(максимально – 300)
Программное
обеспечение
•
BUSY
• ImagePort
• JobScan
• RecoStar
Схема технологического процесса
Задачи кустовых центров
•
•
•
•
•
•
•
•
•
Сканирование переписных листов
Распознавание содержимого бланков
Корректировка в среде BUSY, в три этапа - первичная,
основная и с использованием имиджа
Контроль на целостность данных - арифметический,
логический и межбланочный
Автоматическое кодирование, преобразование данных
Загрузка преобразованных данных в СУБД Access
Корректировка в среде СУБД Access с использованием
имиджа
Контроль информации в разрезе районов по основным
показателям
Архивирование, запись на CD-ROM или дискеты и
передача в республиканский центр
Задачи центрального уровня
•
•
•
•
•
•
•
•
Прием информации с региональных центров
Контроль информации на полноту и по основным
показателям в разрезе районов (СУБД Access )
Создание базы данных по области (СУБД MS SQL
Server )
Формирование таблиц по разделам
Резервное копирование
Анализ данных и их уточнение с областными
управлениями
Загрузка базы данных в разрезе областей в
центральную базу
Формирование сводных таблиц и генерация
отчетов
Прикладные программы, разработанные
для обеспечения этапов обработки
Image Port , JobScan, Recostar, BUSY:
•
•
•
•
Создание описаний документов
Разработка системы контроля введенной информации
Разработка программ корректировки данных
Разработка программ преобразования данных и занесения
информации из системы Busy в итоговую базу данных
Visual C++ , Access , MS SQL:
• Программы контроля, корректировки данных, выгруженных из
системы Busy в Access
• Разработка вспомогательных программ обработки материалов
переписи
Прикладные программы, разработанные
для обеспечения этапов обработки
Комплекс приложений, предназначенных для общего
управления потоками информации в системе
• Программы преобразования данных
• Программы формирования и ведения нормативно-справочной
информации
• Программы организация процессов учета и передачи
информации из филиалов в центр
Комплекс программ формирования регламентных таблиц
• Разработка программ формирования технологических файлов с
агрегированной переписной информацией
• Программы генерации отчетов
Основные проблемы
• Погрешность распознавания сильно зависела
от качества переписных бланков
• Слишком сжатые сроки
• Отсутствие опыта
• В пилотной переписи была использована
другая технология
• Базовое ПО – слишком узкая специализация