Transcript 档案数字化工作流程
档案数字化
技术规范与工作流程
档案数字化加工依据
中华人民共和国行业标准DA/T31—2005
《纸质档案数字化技术规范》
省、市档案政策
《浙江省省直单位纸质档案数字化实施细则》
《台州市市直单位纸质档案数字化实施细则》
档案数字化工作流程
共12个工作环节,每个
环节都有相应的技术规
范与标准。
1、案卷出库交接
2、拆卷
3、电脑扫描
4、图像处理
5、文件合成
6、OCR处理
7、质量检查
8、系统条目校验
9、数据刻录(图像存储)
10、数据验收、挂接
11、重新立卷
12、案卷入库交接
第一步 扫描
一、技术要求:
扫描色彩模式 :彩色模式
扫描分辨率 :300dpi
第一步 扫描
二、扫描前处理
1、拆除装订物
务必在扫描前仔细检查装订物,把钉书针拆除,否则会损坏扫描仪。拆
除装订物时应注意保护档案不受损害。
2、编印页码
有文字的页面均需编上页码,这样才能准确知道每件文件的页数。
3、不要装订
扫描以后再装订,这样可以免除拆卷、重新组卷的麻烦。
4、区分扫描件和非扫描件
保管期限为永久与长期(30年)的档案需扫描,短期档案不用扫描;重
份的文件要剔除;有正式件的文件可以不扫描原稿。
第一步 扫描
三、仪器设备:
扫描仪:“档案数字查阅处理中心”
清华紫光高速仪—幅面小于等于A4;
爱普生平板扫描仪—幅面小于等于A4;
清华紫光平板扫描仪—幅面A3;
第一步 扫描
四、具体操作
以高速扫描仪为例:启动扫描仪 →设置
参数→ 放入纸质文档 →扫描→完成。
第二步 图像处理
一、图像数据处理原则
1、对图像偏斜度、清晰度、失真度等进行检
查。发现不符合图像质量要求时,应重新进行
图像的处理。
2、由于操作不当,造成扫描的图像文件不完
整或无法清晰识别时,应重新扫描。
3、发现文件漏扫时,应及时补扫并正确插入
图像。
4、发现扫描图像的排列顺序与档案原件不一
致时,应及时进行调整。
第二步 图像处理
二、图像处理技术要求
1、纠偏
对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜
为准。对方向不正确的图像应进行旋转还原,以符合阅读习惯。
2、去污
对图像页面中出现的影响图像质量的杂质,如黑点、黑线、黑框、
黑边等应进行去污处理。处理过程中应遵循在不影响可懂度的前提下展
现档案原貌的原则。
3、图像拼接
对大幅面档案进行分区扫描形成的多幅图像,应进行拼接处理,合
并为一个完整的图像,以保证档案数字化图像的整体性。
4、裁边处理
采用彩色模式扫描的图像应进行裁边处理,去除多余的白边,以有
效缩小图像文件的容量,节省存储空间。
第二步 图像处理
三、采用软件
Photoshop7.0
第二步 图像处理
四、具体操作
纠偏:导入文件→矩形选择工具→自由变换→旋转合
适角度→确定(Enter)
旋转:导入文件→图像→旋转→选取角度
去污:导入文件→矩形选择工具→框选出污点→按删
除键
图像拼接:新建图层→拖入需要拼接图层→调整到合适
大小
裁边:导入文件→裁切工具→框出内容→确定(Enter)
补扫图像插入:重命名补扫图像。重命名时,先把补
扫图像按前一顺序图像的文件名命名,再在文件名后
面按顺序加a、b、c……
调整图像顺序:按名称排序
第三步 文件合成
一、技术要求
将几个JPEG图像文件合并成1个PDF多页
文件
二、采用软件
Adobe Acrobat 9 Pro
第三步 文件合成
三、具体操作
启动Adobe Acrobat 9 Pro →选中一个文
件包含的所有图像文件→点右键,选择
“在Acrobat中合并支持的文件”→合并
文件→命名保存到相应文件夹。
第四步 双层PDF(OCR识别)
一、技术要求
将合并得到的PDF文件进行文字层与图像
层剥离处理。
二、采用软件
Adobe Acrobat 9 Pro
第四步 双层PDF
三、具体操作
启动Adobe Acrobat 9 Pro →导入PDF文
件→点击菜单栏“文档”→点击“OCR
识别”→完成
第五步 图像存储
1、存储格式
采用PDF格式存储。
2、图像文件的命名
以案卷为单位,建立相应的电脑文件夹,文件夹以
案卷标题命名。该案卷下的每份文件以所在案卷的
卷内目录顺序号命名,比如1、2、3。。。
Word文档转化成PDF文档
已经有Word格式的电子文件,就不需要
重新扫描,可以直接转化成PDF的电子文
档。
具体操作:打开Word文档→在菜单栏里
点击“ Adobe PDF ”→选择“转换为
Adobe PDF ”→点击保存到目标文件夹→
完成。
EXCEL文档转化成PDF文档
已经有EXCEL格式的电子文件,也不需要重新扫描,
可以直接转化成PDF的电子文档。
具体操作:
打开EXCEL文档→在菜单栏里点击“ Adobe PDF ”→选
择“转换为Adobe PDF ”→转换范围选择“工作表”
→点击“转换为PDF ”→点击保存到目标文件夹→完成。
备注:在选择工作表时,如果EXCEL文档有若干张工
作表,且同为一个文件,那么全部选取,再点击“转
换为PDF ”;如果EXCEL文档有若干张工作表,分属不
同的文件,那么逐一选取单张表格,再点击“转换为
PDF ”。