档案数字化工作流程

Download Report

Transcript 档案数字化工作流程

档案数字化
技术规范与工作流程
档案数字化加工依据
中华人民共和国行业标准DA/T31—2005
《纸质档案数字化技术规范》
省、市档案政策
《浙江省省直单位纸质档案数字化实施细则》
《台州市市直单位纸质档案数字化实施细则》
档案数字化工作流程













共12个工作环节,每个
环节都有相应的技术规
范与标准。
1、案卷出库交接
2、拆卷
3、电脑扫描
4、图像处理
5、文件合成
6、OCR处理
7、质量检查
8、系统条目校验
9、数据刻录(图像存储)
10、数据验收、挂接
11、重新立卷
12、案卷入库交接
第一步 扫描
一、技术要求:
扫描色彩模式 :彩色模式
扫描分辨率 :300dpi

第一步 扫描



二、扫描前处理
1、拆除装订物
务必在扫描前仔细检查装订物,把钉书针拆除,否则会损坏扫描仪。拆
除装订物时应注意保护档案不受损害。
2、编印页码
有文字的页面均需编上页码,这样才能准确知道每件文件的页数。

3、不要装订
扫描以后再装订,这样可以免除拆卷、重新组卷的麻烦。

4、区分扫描件和非扫描件
保管期限为永久与长期(30年)的档案需扫描,短期档案不用扫描;重
份的文件要剔除;有正式件的文件可以不扫描原稿。
第一步 扫描
三、仪器设备:
扫描仪:“档案数字查阅处理中心”
清华紫光高速仪—幅面小于等于A4;
爱普生平板扫描仪—幅面小于等于A4;
清华紫光平板扫描仪—幅面A3;
第一步 扫描


四、具体操作
以高速扫描仪为例:启动扫描仪 →设置
参数→ 放入纸质文档 →扫描→完成。
第二步 图像处理

一、图像数据处理原则
1、对图像偏斜度、清晰度、失真度等进行检
查。发现不符合图像质量要求时,应重新进行
图像的处理。
2、由于操作不当,造成扫描的图像文件不完
整或无法清晰识别时,应重新扫描。
3、发现文件漏扫时,应及时补扫并正确插入
图像。
4、发现扫描图像的排列顺序与档案原件不一
致时,应及时进行调整。
第二步 图像处理

二、图像处理技术要求

1、纠偏
对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜
为准。对方向不正确的图像应进行旋转还原,以符合阅读习惯。

2、去污
对图像页面中出现的影响图像质量的杂质,如黑点、黑线、黑框、
黑边等应进行去污处理。处理过程中应遵循在不影响可懂度的前提下展
现档案原貌的原则。

3、图像拼接
对大幅面档案进行分区扫描形成的多幅图像,应进行拼接处理,合
并为一个完整的图像,以保证档案数字化图像的整体性。

4、裁边处理
采用彩色模式扫描的图像应进行裁边处理,去除多余的白边,以有
效缩小图像文件的容量,节省存储空间。
第二步 图像处理


三、采用软件
Photoshop7.0
第二步 图像处理








四、具体操作
纠偏:导入文件→矩形选择工具→自由变换→旋转合
适角度→确定(Enter)
旋转:导入文件→图像→旋转→选取角度
去污:导入文件→矩形选择工具→框选出污点→按删
除键
图像拼接:新建图层→拖入需要拼接图层→调整到合适
大小
裁边:导入文件→裁切工具→框出内容→确定(Enter)
补扫图像插入:重命名补扫图像。重命名时,先把补
扫图像按前一顺序图像的文件名命名,再在文件名后
面按顺序加a、b、c……
调整图像顺序:按名称排序
第三步 文件合成



一、技术要求
将几个JPEG图像文件合并成1个PDF多页
文件
二、采用软件
Adobe Acrobat 9 Pro
第三步 文件合成


三、具体操作
启动Adobe Acrobat 9 Pro →选中一个文
件包含的所有图像文件→点右键,选择
“在Acrobat中合并支持的文件”→合并
文件→命名保存到相应文件夹。
第四步 双层PDF(OCR识别)




一、技术要求
将合并得到的PDF文件进行文字层与图像
层剥离处理。
二、采用软件
Adobe Acrobat 9 Pro
第四步 双层PDF


三、具体操作
启动Adobe Acrobat 9 Pro →导入PDF文
件→点击菜单栏“文档”→点击“OCR
识别”→完成
第五步 图像存储
1、存储格式

采用PDF格式存储。
2、图像文件的命名
以案卷为单位,建立相应的电脑文件夹,文件夹以
案卷标题命名。该案卷下的每份文件以所在案卷的
卷内目录顺序号命名,比如1、2、3。。。
Word文档转化成PDF文档


已经有Word格式的电子文件,就不需要
重新扫描,可以直接转化成PDF的电子文
档。
具体操作:打开Word文档→在菜单栏里
点击“ Adobe PDF ”→选择“转换为
Adobe PDF ”→点击保存到目标文件夹→
完成。
EXCEL文档转化成PDF文档




已经有EXCEL格式的电子文件,也不需要重新扫描,
可以直接转化成PDF的电子文档。
具体操作:
打开EXCEL文档→在菜单栏里点击“ Adobe PDF ”→选
择“转换为Adobe PDF ”→转换范围选择“工作表”
→点击“转换为PDF ”→点击保存到目标文件夹→完成。
备注:在选择工作表时,如果EXCEL文档有若干张工
作表,且同为一个文件,那么全部选取,再点击“转
换为PDF ”;如果EXCEL文档有若干张工作表,分属不
同的文件,那么逐一选取单张表格,再点击“转换为
PDF ”。