电子档案长期保存基本要求与系统实现

Download Report

Transcript 电子档案长期保存基本要求与系统实现

SAAC
电子档案长期保存基本要求与系统实现
蔡学美
2013年9月10日
SAAC
内容介绍
1.
概 念 认 识
2.
技 术 措 施
3.
项 目 概 况
4.
系 统 实 现
SAAC
电子文件定义:机关、团体、企事业单位和其他
组织在处理公务过程中,通过计算机等电子设备
形成、办理、传输和存储的文字、图表、图像、
音频、视频等不同形式的信息记录(电子文件管
理暂行办法)
广义、狭义、全流程电子文件概念
电子档案定义:机关、团体、企事业单位和其他
组织在处理公务过程中形成的对国家和社会具有
保存价值并归档保存的电子文件(电子档案移交
与接收办法)
广义、狭义电子档案概念
SAAC
参考定义和项目
ICA
ERA
DA/T47
电子档案
长期保存
InterPARES
国电联办
SAAC
概念认识(1)
 ICA《电子档案:档案工作者实用手册》中对电子档案长
期保存进行了定义:电子档案保存时间长于产生这些档
案的源系统(软件和硬件环境)的生命周期,还要长于
我们有把握能够预期的技术变化的周期,从而确保电子
档案的真实性、完整性和可用性。
 档案部门要实现对电子档案的长期保存,需要建立一个
新的存储和保管系统(档案室电子档案系统/档案馆长期
保存系统)。
SAAC
概念认识(2)
 DA/T47-2009《版式电子文件长期保存格式需求》中对
长期和长期保存进行了如下定义:
 长期是虑及技术变化(包括支持新载体、新数据格
式)和用户群体变化对典藏信息影响的足够长的时
间段,这个时间段延伸到无限未来。
 长期保存是用一种可靠的、科学合理的方式长期维
护电子文件真实、完整、有效的行为。
SAAC
 国家电子文件部际联席会议办公室最新发布的《电子
文件管理标准体系框架》
 指出电子文件长期保存是电子文件采取更新、迁移、
仿真、封装等方面的活动(技术手段)。
SAAC
相关项目(1)
 InterPARES项目将文件和文件在数字环境中的演变放在
一起研究,目的是为永久保护电子生成的文件及其真实
性建立一套基本的理论知识和方法。该项目设计了“电
子档案长期保存模型”,将保存的流程划分为四个子流
程:管理流程以及其他三个行使保存功能的流程(载入
电子档案流程,维护电子档案流程,输出电子档案流程
,最终形成一份相互关联的、综合的长期保存要求。
SAAC
相关项目(2)
ERA是美国国家档案与文件署专门针对联邦政府电
子文件的持续采集和长久保存而开发的项目。
先期研究(7年)
建立机制(遵从法规、确定范围、管理与技术结合、
移交指南)
系统架构(3个区:接收、存储、查询)
长期保存措施(保存“原件”、格式选择、保存转
换过程记录、备份存储、载体选择)
SAAC
相关项目(3)
 Planets(通过网络服务进行长期数据保存和获取)是欧
盟重点支持的项目,旨在“面对数字保存的挑战,提供
具有实用价值的服务和工具,确保人类的数字化文化和
科学宝藏可被长期访问”;
 Planets提供一种可扩展的集成框架来满足从保存计划到
行为实施再到评估验证的一系列服务,朝着先进、集成
和自动化的关键数字保存过程的目标迈进。
SAAC
概念认识结论
电子档案长期保存是指一个机构(档案室、档案
馆)建立一种机制,采取一定的技术手段和管理
措施,使电子档案资源在软硬件环境不断变化的
情况下,能够真实、完整地保存(至少5年以上
时间),并能够得到有效利用。
SAAC
介绍进程
1.
概 念 认 识
2.
技 术 措 施
3.
项 目 概 况
4.
技 术 实 践
SAAC
长期保存技术措施
封装技术
迁移技术
格式技术
电子档案
长期保存
再生技术
仿真技术
SAAC
技术措施——封装
 封装是将电子文件及其元数据按指定结构打包的过程,
被国内外档案界普遍认为是保持电子文件内容数据和元
数据可靠联系的最有效方法。封装技术可以做到封装格
式和计算机的软硬件无关,利于电子档案长期保存、交
换和利用,实现电子文件的自包含、自描述和自证明;
 封装方式并没有解决电子档案本身的长期可用问题,当
外部环境发生变化,封装包中的电子档案数据依然存在
不可用的风险,需要和其他技术结合使用。
SAAC
技术措施——格式
 格式需求:DA/T47给出了版式电子文件长期保存格式11
项需求,可以作为电子文件长期保存格式选择的依据:
格式开放、不绑定软硬件、文件自包含、格式自描述、
显示一致性、持续可解释、稳健、利于存储、支持技术
认证机制、易于利用。
 格式转换:关键是确定目标格式,比如文本类:PDF/A
、OFD;图像类:JPG、TIFF;图形类:DXF、SVG;音频
类:WAV,MP3;视频类:AVI、MP4。
SAAC
技术措施——仿真
 仿真是用一个计算机系统模拟另一个计算机系统,使前
者的功能完全与后者相同,即前者接收与后者相同的数
据,执行与后者相同的程序。它可以使一个计算机系统
执行为另一个计算机系统编写的程序,而不必重新编写
程序。仿真技术方法主要包括:模仿应用软件;模仿操
作系统;模仿硬件平台。
 随着虚拟化技术的逐步成熟,通过制作虚拟化管理软件
环境中的运行软件包可以较为方便的建立仿真系统,但
是虚拟化软件本身对软硬件环境也有一定的依赖性。
SAAC
技术措施——再生
 再生性保护技术是将过时的某些电子信息适时地转换到
缩微品或纸介质上的一种保护措施。一般认为,转移到
缩微品上会更可靠一些,因为缩微胶片的理论寿命达五
百年之久,而国内外用缩微胶片保存信息也已经有了数
十年的丰富经验。
 再生性保护技术存在的问题是:部分有声信息、多媒体
信息无法转移到胶片或纸张上去;信息如果转移到胶片
或纸张上之后,由于这两种载体表现形式的局限性,会
使电子信息失去原有的风格和魅力。
SAAC
技术措施——迁移
 迁移是持续地将电子信息从一种技术环境转换到另一种
技术环境,同时也意味着基于字符的信息可以从一个存
储介质转移到另一个存储介质上,以进行电子信息的长
久保存。主要包括存储介质的迁移和运行环境的迁移,
迁移的同时根据需要完成格式转换。
 迁移被普遍认为是当前保持电子文件长期有效真正切实
可行的技术措施。但电子文件在新旧系统中不断重复迁
移的过程中可能会有部分丢失,应该建立迁移规定和质
量控制过程来尽量减少这种迁移过程中的丢失。
SAAC
技术措施应用讨论
格式统一(标准问题、技术问题、市场问
题)
元数据留存(必要性、可行性)
封装(技术依赖性、可操作性、局限性)
仿真(可行性)
迁移(前瞻性)
数模转换(缩微、纸张)
SAAC
介绍进程
1.
概 念 认 识
2.
技 术 措 施
3.
项 目 概 况
4.
系 统 实 现
SAAC
项目简介——建设背景
自两办厅字[2009]39号《电子文件管理暂行办法》
发布以来,国电联办在全国范围内开展了一系列电子文
件管理试点工作,国家档案局作为国电联的成员单位之
一,承担了电子文件和电子档案管理领域的一系列重要
任务。“国家电子档案接收和长期保存管理系统建设试
点工程项目”是国电联办、国家发改委下达给国家档案
局的试点工作任务。
SAAC
项目简介——建设内容
1、建设一个示范系统
即电子档案接收和长期保存系统,研究提出系统的功能需求、技术方案、软
硬件配备要求等,并定制研发。
2、试点试用一批规章和标准
重点验证《电子文件管理暂行办法》、《电子档案移交与接收办法》、《电
子文件元数据基本集》、《数字档案馆建设指南》等规章和标准的合理性、
可行性,并提出合理化建议。
3、研究制订一批规章和标准
主要包括电子档案长期保存办法、重大建设项目电子文件管理办法、电子档
案分类方案、电子档案四性检测方案、电子文件长期保存需求规范等。
4、推广应用
系统研制完成后在上海、福建、重庆、青岛、杭州、广州等6个省市档案馆及
其对应的电子档案移交单位部署实施,并推广运行。
SAAC
项目简介——建设目标
按照推进国家电子文件管理规范化的总体要求,通过
电子档案接收和长期保存系统的建设和运行,试点试用一
批规章和标准,规范电子档案移交接收及其长期保存的工
作流程、功能需求、系统接口以及电子档案的接收范围、
数据格式及其技术构成等,保障电子档案在移交接收阶段
的可靠性,初步解决电子文件、档案的长期保存问题,实
现立档单位同国家档案馆业务系统间的无缝衔接,从而保
证电子档案来源可靠、管理可信、长期可用。
SAAC
制定六个规范/方案/管理办法
 《电子档案长期保存办法》
 《电子档案分类与数据组织方案》
 《电子文件长期保存需求规范》
 《电子档案元数据方案》
 《电子档案四性检测方案》
SAAC
《电子档案长期保存办法》
 共计六章三十条规定。
电子档案长期保存办法
(1)总则(4条)
(2)电子档案保存机构及职责(5条)
(3)电子档案长期保存管理要求(5条)
(4)电子档案长期保存系统建设(6条)
(5)电子档案长期保数据管理(7条)
(6)附则(3条)
SAAC
《电子文件长期保存需求规范》
 从技术措施、文件格式、存储载体、元数据管理和软件
功能等五个方面对电子文件长期保存提出了需求。
电子文件长期保存需求规范
(1)概述
(2)电子文件长期保存技术需求(5点)
(3)电子文件长期保存格式需求(11点)
(4)电子文件长期保存存储载体需求(7点)
(5)电子文件长期保存元数据需求(3点)
(6)电子文件长期保存软件功能需求(9点)
SAAC
介绍进程
1.
概 念 认 识
2.
技 术 措 施
3.
项 目 概 况
4.
系 统 实 现
SAAC
系统架构
接
入
层
……
机关
立档单位
档案局馆
查档利用
人员
企事业
立档单位
各接入单位/用户
实
施
保
障
体
系
应
用
层
电子档案
移交
电子档案
接收
电子档案
保存
电子档案
管理
电子档案
利用
电子档案
安全
系统配置
与管理
电子档案移交接收和长期保存系统
平
台
层
统一全文检索
平台
统一工作流
平台
统一权限管理平台
统一报表平台
统一组件平台
EEP
封装
工具
应用基础平台
数
据
层
目录
数据库
全文
数据库
通用
数据
采集
工具
电子
文件
检测
工具
光盘
脱机
浏览
工具
文件
格式
转换
工具
工具软件
多媒体
数据库
管理
过程库
规范
标准库
系统
维护库
电子档案信息资源库
系
统
层
网络平台
硬件平台
基础支撑平台
标准规范体系
系统软件
安
全
保
障
体
系
SAAC
系统实现——长期保存技术
保存策
略
数据组
存储备
份
织
物理组
长期保
格式转
盘
存技术
换
文件迁
移
数据封
装
文件检
测
SAAC
保存策略
 设置各类电子档案的长期保存格式;
 设置电子档案的封装格式以及电子档案内容数据和
元数据的关联方式;
 设置电子档案的存储路径、存储方式、备份策略;
 依据《检测方案》设置电子档案各项检测指标;
 设置各类电子档案的检测周期;
 设置电子档案的访问授权策略和操作流程。
 留存电子档案管理过程信息
SAAC
数据组织
 设计了四个库(接收库、管理库、保存库、利用库)、三个包(提
交包、保存包、利用包)的数据组织方式,并可以根据单位实际情
况进行灵活设置。
保存载体(保存数据包)
存储设备(保存库结构)
说明文件.TXT
全宗1文件夹
目录文件.XML
类别1文件夹
其他文件夹
年度1文件夹
全宗文件夹
保管期限1文件夹
年度1文件夹
文件1.EEP
类别1文件夹
文件2.EEP
文件1.EEP
文件N.EEP
文件2.EEP
保管期限N文件夹
文件N.EEP
年度N文件夹
类别N文件夹
年度N文件夹
全宗N文件夹
类别N文件夹
全宗N文件夹
SAAC
小
结
 电子档案长期保存(真实性、完整性、可用性)实现路径
电子文件形成系统(归档、脱离源系统)电子档案管
理系统(移交、脱离各单位系统)电子档案长期保存系
统(档案馆)
 法规遵从、制度保障、机构可信(赋予相关机构、人员从
事电子档案管理的权利、职责,规范工作流程,留存管理
过程信息,从而保证电子档案来源可靠、管理可信。关键
环节是电子文件归档和电子档案移交)保证电子档案的真
实、完整,减少技术依赖性
 系统实现和技术应用(系统管理、维护、发挥电子档案的
作用,格式要求、迁移技术等使电子档案适应不断变化的
计算机软硬件环境)保证长期可用
SAAC