档案数字化建设方案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
档案数字化建设方案
档案工作的数字化建设是顺应潮流,适应时代发展的新举措、新要求,档案做为原生的信息资源,其重要性正日益凸显出来,逐步掌握信息技术为档案工作服务,为社会主义经济建设服务,为社会主义精神建设服务。
档案数字化是数字档案建设最基础的工作,传统载体的档案经高科技技术加工成数字档案形式,通过局域网、政务网、互联网进行计算检索、阅读电子档案,为迎接档案信息服务新环境的挑战、提高管理水平、提高效率、增强档案部门的服务水平、为档案内部管理及面向客户服务提供高效率的全面服务。
完整的档案数字化建设流程包括案卷交接、档案整理、目录著录、档案扫描、图像处理、OCR文字识别、数字校对、数字质检、数据挂接、整理还原、案卷入库等环节。
业务流程
纸质档案数字化标准:DA/T31-2005《纸质档案数字化技术规范》
DA/T18-1999《档案著录规则》
1.制订批次计划
为在数字化处理过程中对纸质档案进行有效管理以及对数字化处理进行有效控制,需对馆藏档案的数字化处理分批次进行。
2.档案出库交接
根据档案数字化加工批次计划进行出库,对出库的档案进行完整
性检查。
对通过完整性检查的档案,进行数量确认,并详细登记《资料出库单》。
确保资料的交接过程中的数量正确性,完整性;
3.目录著作
按照文件数据库目录结构与目录著录要求以及《档案著录规则》(DA/T18)等标准,规范需要目录补录的档案目录内容,包括确定档案目录的著录项、字段长度和内容要求等,规范案卷题名、文件名、责任者、起止页号和页数等。
4.档案整理
对出库待加工的档案进行扫描前处理,使之成为能够进行扫描的形态。
拆除装订
影响扫描工作进行的档案,应拆除装订物。
资料及档案内的成册资料严禁拆除。
区分扫描件和非扫描件
区分同一案卷(卷、件)中的扫描件和非扫描件。
页面修整
对破损严重、无法直接进行扫描的档案,先期进行技术修复,折皱不平影响扫描质量的原件进行相应技术处理(压平和烫平等)后再进行扫描。确保较薄纸张(如信纸、便笺纸)、破损纸张、底灰较深(如草浆纸、油印纸)、字迹较浅(如铅笔字迹)等纸
张的状况较较差的档案扫描图像清晰。
档案整理登记
详细记录档案整理后每份文件的起止页号和页数等情况。
装订
扫描完成后,档案按原档案保管单位要求进行重新装订,保持每页档案原有的排列顺序不变、案卷不掉页、右边和底边整齐。5.档案扫描
黑白扫描采用(300dpi)TIFF格式,彩色扫描采用(300dpi)JPG 格式。
照片以原色彩为准(600dpi)TIFF格式扫描。
保证扫描图像效果原原件吻合。
大幅面档案采用大幅面工程扫描仪或小幅面扫描后进行图像拼接处理。
需要进行OCR文字识别的档案,扫描分辨率≥300dpi。
对资料等成册材料不宜拆卷的,采用不拆卷扫描仪扫描。
核对每件文件的扫描页码、页数与实际的文件页码、页数是否一致。
图片命名时一定要正确,不能出现图片颠倒、错乱等现象。
扫描时保证档案原件不被损坏。
6.图像处理
纠偏
偏斜的图像进行纠偏处理,倾斜不超过3度,方向不正确的图像
进行旋转还原,以符合阅读习惯。
去污
图像页面中影响图像质量的杂质如黑点、黑线、黑框、黑边等进行去污处理。
图像拼接
大幅面档案进行分区扫描形成的多幅图像进行拼接处理,合并为一个完整图像,以保证档案数字化图像的完整性。
栽边处理
去除多余的白边,缩小图像文件的容量,节省存储空间。
深浅度调整
图像深浅度不一致时进行修复,保证图像的深浅度一致。
7.OCR识别
运用先进的OCR识别软件,对扫描的图像进行文字识别
8.图像存储
采用TIFF、JPG格式存储,存储时选择的压缩率在保证扫描的图像清晰可读的确前提下,尽量减小存储容易为准则。
供网络查询的扫描图像,存储为PDF文件格式,进行过文字识别的,形成文件文字层。
纸质档案目录数字库中的每一份文件,都有一个与之相应的唯一档号,以该档号为这份文件扫描后的图像文件名。
多页文件可采用该档号建立相应文件夹,按页码顺序对图像文件命名。
9.数据质检
关键项检验和整理数据质量抽检。
抽检工作由专为进行操作,操作结果进行记录。
数据采用全检方式,合格率要求达到95%以后确保质量。
10.数据挂接
运用批量挂接与单张挂接的方式,将目录库与图像库一一对应起来,并生成索引文件。
汇总挂接
档案数字化转换过程中形成的目录数据库与图像数据库,通过质检环节确认“合格”后,通过网络加载到数据服务器终端汇总,实现批量、快速挂接。
数据关联
以纸质档案目录数据库为依据,将每一份纸质档案文件扫描所得的一个或多个图像存储为一份图像文件,通过每一份图像文件的文件名与档案目录数据库中该份文件的档号的一致性和唯一性,建立起一一对应的关联关系,实现档案目录数据库和图像文件的批量挂接。
11.数据自检
建立严格的质量检测体系,对加工的数据进行自检,自检必须达到《档案馆纸质档案数字化验收标准》的,才能递交进行验收。12.数据验收
目录数据库、图像文件及数据挂接的总体质量。
数据校对员进校对过程不接触任务纸质档案,根据扫描的图像结果来进行校对。
首批数据采用全检方式
以后批次采用抽检的方式检查已完成数字化转换的所有数据,包括目录数据库、图像文件、数据挂接的总体质量。
根据《纸质档案数字化加工验收标准》进行检查。
档案实体验收必须逐卷清点,按档案数量、文件状况、卷内文件页数与顺序、装订要求等进行检查。
13.数据备份
经验收合格的完整数据及时进行备份。
同一份文件,不跨二片DVD片号
光盘表面标示光盘片编号并注明光盘目录索引信息
光盘片刻录完成后,与影像系统档案进行比对一次,确保档案资料无遗漏及正确性。
14.成果管理
加强对纸质档案数字化的成果管理,确保安全、完整和长期可用。
15.档案入库
重新整理后的档案按照顺序返还,对档案的完整性进行检查。拆除过装订物的档案按原档案保管单位重新装订,保持每页档案原有的排列顺序不变。