纸质档案数字化技术规范 pdf_档案数字化标准

合集下载

《纸质档案数字化技术规范》(DAT 31-2005)

《纸质档案数字化技术规范》(DAT 31-2005)

《纸质档案数字化技术规范》(DAT 31-2005)《纸质档案数字化技术规范》(DA/T 31-2005)(2008-05-07 12:48:46)(中华人民共和国档案行业标准 DA/T 31-2005,中华人民共和国国家档案局2005年4月30日发布,2005年9月1日起实施)1 范围本标准规定了纸质档案数字化的主要技术要求。

本标准适用于用扫描仪对各种纸质档案的数字化加工处理。

2 规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。

凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。

凡是不注日期的引用文件,其最新版本适用于本标准。

GB,T 17235.1 连续色调静态图像的数字压缩编码T 17235.2 连续色调静态图像的数字压缩编码 GB,GB,T 18894—2002 电子文件归档与管理规范ITU(CCITT)G3 二值图像压缩算法ITU(CCITT)G4 二值图像压缩算法DA,T18—1999 档案著录规则档案管理软件功能要求暂行规定国家档案局档发[2001]6号3 术语和定义下列术语和定义适用于本标准。

3.1数字化 Digitization用计算机技术将模拟图像转换为数字图像的处理过程。

3.2纸质档案数字化Digitization of Paper—Based Records 对普通(黑色字迹清晰)的油印、铅印、胶印等印刷件或复印件纸质档案进行数字化及应用的过程。

3(3数字图像 Digital Image表示景物图像的整数阵列。

一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。

在矩阵(或其他)网络上采样一连续函数,并在采样点上将值最小化后的阵列。

3(4黑白二值图像 Binary Image只有黑白两级灰度的数字图像。

它对应于黑和白的两种状态文字稿、线条图、指纹图等。

纸质档案数字化规范

纸质档案数字化规范

纸质档案数字化规范D A T31—2017(总12页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--纸质档案数字化规范DA/T31—2017前言本标准按照GB/T 给出的规则起草。

本标准替代DA/T 31-2005《纸质档案数字化技术规范》。

本标准与DA/T 31-2005相比,主要技术变化如下:——标题进行了修改;——增强组织与管理部分的内容,完善数字化工作中管理相关要求;——增强数字化前处理部分的内容,包括对实体档案保护和档案规范化管理方面的要求;——增加数字化过程中元数据采集的要求;——修改了档案扫描部分参数要求;——修改了图像处理部分内容,更加强调保持档案原貌的要求;——细化了数字化成果验收的内容;——删除原标准数据备份和数字化成果管理相关内容。

本标准由国家档案局提出并归口。

本标准起草单位:国家档案局档案科学技术研究所、国家档案局信息管理中心、国家档案局技术部。

本标准主要起草人:王良城、马淑桂、郝晨辉、程春雨、杜琳琳、蔡伟、宋涌、王大众、田军、曹燕、李华峰。

本标准所代替标准的历次版本发布情况为:——DA/T 31—2005。

引言DA/T 31-2005的发布实施,从技术标准方面对纸质档案数字化工作提出了要求,很好的促进了纸质档案数字化工作向科学化、规范化的方向发展,在档案信息化工作中发挥了重要作用。

由于纸质档案数字化工作所依赖的信息技术发展迅速,经过10年的时间,数字化设备、存储、网络等技术条件都发生了较大变化,同时,纸质档案数字化工作管理方法和管理理念等都在不断更新、发展。

因此,及时对本标准进行修订,适时调整相关要求,从档案行业层面科学规范纸质档案数字化工作,具有重要的现实意义。

标准本次修订更加注重我国纸质档案数字化工作自身的特点,结合目前信息技术发展的水平,提出适用于档案行业的纸质档案数字化工作的规范性要求。

纸质档案数字化规范1 范围本标准规定了纸质档案数字化技术和管理要求。

中华人民共和国档案行业标准 纸质档案数字化技术规范

中华人民共和国档案行业标准 纸质档案数字化技术规范

2 规 范性 引用文 件
下 列 文 件 中 的条 款 通 过 本 标 准 的 引 用 而 成 为 本 标 准 的条 款 。 凡 是 注 日期 的 引用 文 件 , 随后 所 有 的修 改 其 单 ( 包括 勘 误 的 内容 ) 修 订 版均 不适 用 于 本标 准 , 不 或 然
对 档 案 进 行 数 字 化 转 换 后 ,数 字 罔 像 与 案 原 件 在色彩 、 何等方面的偏离程度。 儿
清 除 图像 冗 余 或 对 图 像 近 似 的 仟 一 种 过 程 ,其 目
的是对 图像 以更 紧凑的形式表示。 纸质档案数字化过程
中 , 常 见的 有 TF ( 4 、 E 等压 缩 格 式 。 较 IF G )J G P
4纸质档 案数 字化 基本 要 求
4 1 本 原 则 .基
纸 质档案数 字化 的基本 原则是使 档案信息 资源准 确、 方便 、 快捷地提供利用 , 使可以公开的档案信息 资源

采用扫描 仪或数码相 机等数码设 备对纸质档 案进 行数字化加工 , 将其转化 为存储 在磁带 、 磁盘 、 光盘等载
体 上并 能被 计 算 机 识 别 的 数 字 图 像 或 数 字 文 本 的处 理
过程 。 33 数 字 图 像 d i lm g . i t ae ga i
纸 质 档 案 的数 字 化 ,必 须 符 合 国 家 档 案 开 放 规 定 以
及有关规定 。
3 术语 和定 义
下 列 术 语 和 定 义适 用 于 本 标 准 。
31 数 字 化 d izt n , i tai gi o
用计算 机技 术将模拟 信号转换 为数字信 号的处理 +
过程。
3 纸 质档 案数字化 dg i t n f ae b s crs . 2 it ao pp r ae r od iz i o - de

DAT 31-2005 纸质档案数字化技术规范

DAT 31-2005 纸质档案数字化技术规范

纸质档案数字化技术规范DA/T 32-2005(2005年4月30日发布2005年9月1日实施)一、概述国家标准《纸质档案数字化技术规范》DA/T 31—2005是由中国国家档案局颁布的,其批准时间为2005年4月30日,实施时间为2005年9月1日。

该标准共分为十三章。

其中包括范围,规范性引用文件,术语和定义,纸质档案数字化基本要求,档案整理,档案扫描,图像处理,图像存储,目录建库,数据挂接,数据验收,数据备份,数字化成果管理等。

该技术规范的出台结束了我国纸质档案数字化的初探阶段,标志着我国各级档案馆馆藏数字化技术的成熟。

二、主要条款简介第一章范围本标准规定了纸质档案数字化的主要技术要求。

本标准适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。

第二章规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。

凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。

凡是不注日期的引用文件其最新版本适用于本标准。

GB/T 17235.1-1998 信息技术连续色调静态图像的数字压缩及编码第一部分:要求和指南。

GB/T 17235.2-1998 信息技术连续色调静态图像的数字压缩及编码第二部分:一致性测试GB/T 18894-2002 电子文件归档与管理规范。

第三章术语和定义下列术语和定义适用于该标准。

(1)数字化digitization用计算机技术将模拟信号转换为数字信号的处理过程。

(2)纸质档案数字化digitization of paper-based records采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。

(3)数字图像digital image表示实物图像的整数阵列。

一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。

纸质档案数字化技术规范

纸质档案数字化技术规范

纸质档案数字化技术规范根据国家档案局2005年4月30日发布的《纸质档案数字化技术规范》,制定本局纸质档案数字化技术规范。

特对图像扫描、图像处理、图像存储作如下说明。

一、图像扫描1、扫描方式a、根据档案幅面的大小选择相应规格的扫描仪或专业扫描仪进行扫描。

大幅面档案可采用专用数码平台进行扫描或者采用图像拼接方式处理。

同一页面有两个以上文件,需分别扫描。

b、纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式以提高工作效率。

2、扫描色彩模式、分辨率及扫描格式扫描色彩模式、分辨率及扫描格式的选择见下表:彩色档案举例:带红头的文书档案。

对清晰度有较高要求的图纸可适当提高分辨率。

二、图像处理图像处理以无限还原档案原貌为标准,注意图像偏斜度、清晰度、失真度、排列顺序等等。

三、图像存储1、图像存储格式黑白原稿:*.tiff;彩色档案、图纸:*.pdf, jpg文件需通过pdf转换器来转换成pdf文件。

转换器可以网上下载。

2、图像文件的命名命名原则:以纸质档案目录数据库为依据,将每一份图像文件命名为档案目录数据库中该份文件的档号。

通过档号的一致性和唯一性,建立起一一对应的关联关系,为实现档案目录数据库与图像文件的批量挂接提供条件。

a、命名格式(一)对立卷改革之前的纸质文书档案进行扫描,其图像文件命名格式由全宗号、目录号、案卷号、顺序号所组成,各字段间用“-”连接,即以xxx-xxx-xxxx-xxxx.tiff(或pdf)表示,数据结构见下表:b、命名格式(二)立卷改革后形成的纸质文书档案的扫描,其图像文件命名由全宗号、年度、保管期限、档案室编件号等四部分组成,各字段间用“-”连接,即以xxx-xxxx-xxxx-xxxx.tiff (或pdf)表示,数据结构见下表:全宗号用三位代码标识,用阿拉伯数字标识某一属类全宗的顺序号。

如“002”表示2号全宗。

年度以四位阿拉伯数字标注公元纪年,如“2002”表示2002年。

纸质档案数字化规范

纸质档案数字化规范

纸质档案数字化规范纸质档案数字化规范是指将纸质档案通过扫描、录入等技术手段转换成电子形式的一种操作规范。

纸质档案数字化的目的是提高档案管理的效率和便捷性,降低档案的保存成本,并便于档案的检索和共享。

下面是纸质档案数字化的规范要点:1. 核查和整理在数字化过程之前,必须对纸质档案进行核查和整理。

首先,核查档案是否完整,并将缺失或损坏的档案进行补充或修复。

其次,将档案按照分类、时序等原则进行整理,确保顺序和清晰度。

2. 扫描和录入将整理好的纸质档案通过扫描仪或其他相关设备转换为电子文件。

扫描时应保证文件清晰度和色彩准确性。

对于文字类档案,可以通过OCR技术进行文字的自动识别;对于图像、图片类档案,可以进行编辑和修复,以便更好地保留档案的内容和质量。

3. 统一命名和分类对于数字化后的档案文件,应进行统一的命名和分类。

文件名可以采用有意义的命名方式,如档案编号、日期等,以方便检索。

同时,将档案按照不同的类别、主题、格式等进行分类标注,并建立相应的文件夹或目录结构。

4. 元数据录入和索引建立对于数字化后的档案文件,应进行元数据的录入和索引的建立。

元数据包括档案的基本信息,如档案名称、创建日期、创建者、所属机构等;索引是对档案的内容和属性进行关键词标注,以便更方便地进行检索和查找。

5. 存储和备份数字化后的档案文件应按照一定的存储结构进行保存和备份。

可以采用硬盘、服务器、云存储等方式进行存储,并设定访问权限和安全措施,以保护档案的完整性和安全性。

同时,定期进行档案的备份和恢复,以防止文件丢失或损坏。

6. 数据质量和准确性的验证在数字化过程之后,需要对档案的数据质量和准确性进行验证。

首先,对数字化后的档案进行比对和校验,确保数字化结果与原始档案的一致性。

其次,进行数据质量的检测和修复,如修正错别字、调整图像亮度等,以提高档案的可读性和准确性。

7. 档案的检索和共享数字化后的档案应具备便捷的检索和共享功能。

可以通过建立档案管理系统或数据库,进行关键词检索、全文检索等操作,以方便用户查找所需档案。

最新档案数字化规范标准

最新档案数字化规范标准

最新档案数字化规范标准档案数字化是将传统的纸质档案转换为电子形式,以便于存储、检索和利用。

随着信息化时代的到来,档案数字化已成为档案管理工作的重要组成部分。

以下是最新档案数字化规范标准的具体内容:一、档案数字化的目的与意义档案数字化旨在提高档案的保存质量,延长档案的使用寿命,同时提高档案的利用效率和安全性。

通过数字化,档案可以更易于检索、复制和传播,满足现代社会对信息资源的需求。

二、档案数字化的基本原则1. 完整性:确保数字化过程中档案内容的完整性,不得遗漏任何部分。

2. 准确性:数字化后的档案应与原始档案保持一致,无误读或错误。

3. 可读性:数字化后的档案应清晰易读,便于电子设备上的查看和打印。

4. 安全性:在数字化过程中要确保档案信息的安全,防止数据泄露或损坏。

三、档案数字化的流程1. 档案预处理:包括档案的清洁、修复、分类和排序。

2. 扫描:使用高分辨率扫描仪对档案进行扫描,确保图像质量。

3. 图像处理:对扫描后的图像进行去污、去噪、矫正等处理,提高图像质量。

4. 格式转换:将图像转换为通用的电子格式,如PDF或JPEG。

5. 数据录入:将档案的元数据录入数字化管理系统。

6. 质量检查:对数字化后的档案进行质量检查,确保符合标准。

7. 存储与备份:将数字化档案存储在安全的服务器上,并进行定期备份。

四、档案数字化的技术要求1. 扫描分辨率:彩色档案推荐使用300dpi,黑白档案推荐使用600dpi。

2. 色彩管理:确保扫描过程中色彩的准确性和一致性。

3. 文件格式:推荐使用无损压缩的PDF/A格式,以保证档案的长期保存和兼容性。

4. 元数据标准:遵循国际标准,如Dublin Core或EAD,以便于档案的检索和管理。

五、档案数字化的安全管理1. 访问控制:设置用户权限,确保只有授权人员才能访问数字化档案。

2. 数据加密:对存储的档案数据进行加密处理,防止未授权访问。

3. 备份策略:制定定期备份计划,确保档案数据的安全和可恢复性。

DA/T纸质档案数字化技术规范

DA/T纸质档案数字化技术规范

纸质档案数字化技术规范DA/T31-20051 范围本标准规定了纸质档案数字化的主要技术要求;本标准适用于用扫描仪对各种纸质档案的数字化加工处理;2 规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款;凡是注日期的引用文件,其随后所有的修改单不包括勘误的内容或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本;凡是不注日期的引用文件,其最新版本适用于本标准;GB/T 连续色调静态图像的数字压缩编码GB/T 连续色调静态图像的数字压缩编码GB/T 18894 2002 电子文件归档与管理规范ITUCCITTG3 二值图像压缩算法ITUCCITTG4 二值图像压缩算法DA/T18 1999 档案著录规则档案管理软件功能要求暂行规定国家档案局档发20016号3 术语和定义下列术语和定义适用于本标准;数字化 Digitization用计算机技术将模拟图像转换为数字图像的处理过程;纸质档案数字化Digitization of Paper Based Records对普通黑色字迹清晰的油印、铅印、胶印等印刷件或复印件纸质档案进行数字化及应用的过程;3.3数字图像 Digital Image表示景物图像的整数阵列;一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生;在矩阵或其他网络上采样一连续函数,并在采样点上将值最小化后的阵列;3.4黑白二值图像 Binary Image只有黑白两级灰度的数字图像;它对应于黑和白的两种状态文字稿、线条图、指纹图等;3.5连续色调静态图像 Continuous tone Still Image以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像;3.6失真度 Distortion Measure对档案原件进行数字化转换后,在同等测试环境下,数字图像与档案原件色彩、几何、压缩算法等差值;3.7可懂度 intelligibility表示数字图像向人或机器提供信息的能力;3.8清除图像冗余或对图像近似的任一种过程,其目的是对图像以更紧凑的形式表现;3. 9分辨率Resolution指单位长度内图像包含的点数或像素数;TIFF Tagged Tmage File Format标记图像文件格式;一种基于标记的无损不丢失信息压缩格式,用于在应用程序之间和计算机平台之间交换文件;因为它存储图像细微层次的信息非常多,图像的质量也得以提高,故而非常有利于原件为黑白档案的复制储存;JPEG Joint photographic Experts Group联合照片专家组;一种丢失少量信息的压缩格式,尤其适用于屏幕和打印显示,支持所有主要计算机平台和Web浏览器;JPEG格式文件小,影像质量多数情况下均可接受;考虑储存空间及传输效率,原件为彩色的档案可迁此格式复制储存;4 数字化基本流程纸质档案数字化的基本流程主要包括案卷整理、目录建库、批量扫描、数据处理、信息存储、检索利用等工序;4.1 案卷整理对需要扫描的案卷进行适当整理,做出标识;4.2 目录建库为数字化的档案检索而建立必要的目录数据库;4.3 批量扫描按照档案数字化具体任务的整体安排按计划分批次进行扫描;4.4 数据处理4.4.1 对扫描图像进行校对,确保图像完整无误,并视需要对有问题的扫描图像进行纠偏、去污、拼接等技术处理;4.4.2 对裸数据进行验收前的相应处理,包括文件的格式转换、逻辑分盘处理、添加说明性文件,以及数据的挂接、检验、上载、质量检查和备份;4.5 信息存储根据不同的扫描图像选择适当数据格式、编码方式和存储介质对信息进行保存;4.6 检索利用按用户需求提供检索利用;5 案卷整理在批量扫描之前,按下述步骤对案卷进行整理,确保档案数字化质量;5.1 分件5.1.1 把同一案卷中的扫描件和非扫描件分开;5.1.2 在扫描件中将大图、照片插入指示页,便于扫描工序批量扫描,实际图像放在图像处理时进行重扫,替换指示页;5.1.3 填写数据加工过程处理单见附录A,对需要特殊处理的页,标识清楚;5.2 分页对批量扫描前的档案进行页号、件号的标注;如在标注中与原档案中的件数、页号不一致,应以此为准;5.3 拆卷去除档案中原来的装订物,以便后续扫描工作的进行;5.4 装卷按档案保管要求恢复原装订;6 建目录库6.1 目录著录根据DA/T18确定档案著录项,并进行著录;6.2 数据格式选择所选定的数据格式通用,应能直接或间接与DBF文件格式或通过XML文档进行数据交换;6.3 目录输入将著录好的目录输入计算机内,建立机读目录数据库;7 批量扫描7.1 扫描方式纸质档案扫描可采用黑白二值图像和连续色调图像两种方式;7.1.1 页面为单色文字的纸质档案,宜采用黑白二值图像扫描;页面为多色文字图像的档案文件,可采用连续色调图像扫描;7.1.2 字迹清晰、不带图片的档案材料,采用黑白二值图像扫描;清晰度较差或带有图片的档案材料,可采用连续色调图像扫描;7.2 分辨率选择7.2.1 单色页面档案文件,扫描分辨率一般建议选择100~200dpi;7.2.2 彩色页面档案文件,扫描分辨率可选择100dpi以上参数值进行;7.2.3 大幅面档案文件,如工程图纸、报纸等尺寸超过A3的,可选用大幅面图像扫描仪如A0、大幅面数码平台、缩微照像后胶片数字转换,也可以采用小幅面扫描后的图像拼接;扫描分辨率应选择1OOdpi以上;7.2.4 需要时可根据原件的清晰度适当调整扫描分辨率;如原件质量较差且尺寸较小,可适当提高分辨率;反之也可相应减少分辨率,增减的多少以扫描后图像按原尺寸显示后是否清晰为准;7.3 特殊页面的扫描7.3.1 粘贴页与表格对于粘贴折页,可用大幅面扫描仪扫描,或先分部扫描后拼接;对部分字体很小、字迹密集的情况,可适当提高扫描分辨率,选择灰度扫描或彩色扫描,采用局部深化技术解决;对字迹与表格颜色深度不同的,采用局部淡化技术解决7.3.2 一般文本流程图采用适当的分辨率扫描及局部深化技术,确保文本流程图清晰;同时采用不同设备满足文本流程图的扫描工作;7.3.3 插图采用高分辨率灰度或彩色扫描技术将插图与文字一起扫描,保证原来的页面布局和插图清晰;7.3. 4照片对于页面中有黑白或彩色照片的文件,采用JPEG格式扫描,确保照片清晰度,同时可避免图像存储空间过大;7.4 文件命名方式7.4.1 建立文件夹扫描时文件夹的建立应按档案实体分级建立,其中的每一份文件也需要单独建立文件夹;7.4.2 文件夹命名方法,以档案实体中的档号命名,一般为3位数,不足3位数的左边补“0”;8 数据处理8.1 图像处理8.1.1 纠偏对扫描过程中出现的偏斜图像进行整体纠正,保证数字图像的偏斜角度小于1度;图像偏斜不超过页面内半个文字;8.1.2 去污去除数字图像中影响可懂度的杂质;档案数字化图像的去污,应遵循在不影响可懂度的前提下展现原貌的原则;8.1.2.1 局部去污,如去除黑边、污点;8.1.2.2 整体去污,可一次性去除页面上的污渍;8.1.3 拼接为保证档案数字化图像的整体性,对幅面分离的数字图像进行拼接;8.1.4 校对8.1.4.1 一次校对,检查扫描完的图像质量情况,对不合格的图像进行标记退回重新扫描;8.1.4.2 纠错处理,根据一次校对中提出的诸如污渍、黑边、偏斜、图像质量等问题,结合数据加工过程处理单见附录A情况,对每份图像进行相应的处理;8.1.4.3 二次校对,对一次校对及数据处理后的数字图像再次进行检查,并标记图像处理过程中不清晰的页面;不合格的退回重新处理;8.2 数据质量检查8.2.1 文字录入质量对录入域清单上所标明的各著录项的文字录入进行正确率控制,保证错误率低于3‰;8.2.2 图像质量对纸质文件扫描后形成的图像文件进行清晰度、污渍、黑边、偏斜等问题的控制,以达到要求的图像质量;保证扫描后的数字图像清晰,便于清楚阅读,适应各种纸张和手写、印刷字的情况;8.3 数据挂接档案条目数据与图像文件的对应准确程度的控制;在生成裸数据光盘之前,根据资料整理信息、扫描前的标引信息及卷内文件页号信息核查图像文件总数是否与实际文件数相等,如不相等则不能生成裸数据光盘,可打印出清单,回退给图像处理人员补扫;8.4 数据检验8.4.1 将裸数据进行验收前的相应处理,包括文件的格式转换、逻辑分盘处理、添加说明性文件;8.4.2 对数据进行检验,给出合格或不合格结论;8.4.3 将数字加工后的数据转换为裸数据光盘格式,拷贝到活动硬盘上;8.4.4 系统应自动记录检验进度;8.5 数据上载档案数字化各工序的数据通过网络及时上载到数据服务器端汇总,其中数字图像自动搜索对应的目录数据,加入对应的电子地址数字图像文件名,建立起一一对应的关系;8.6 数据备份定期对服务器的各类数据进行备份,防止数据丢失;9 信息存储以JPEG数字压缩编码或TIFF国际通用标准格式;采用国际标准的传真文档压缩格式压缩后,分别按页编号后分页存储;数字图像的存储管理应保持原纸质档案的保管模式对应存储;9.1 压缩存储格式档案数字图像格式采用TIFF和JPEG数字压缩编码;9.1.1 黑白二值图像黑白二值扫描图像文件采用TIFFCCITT G3格式二值图像压缩算法,压缩率就绪Cr为15:1;也可采用TIFFCCIFF G4格式二值图像压缩算法,压缩率Cr为3 O:1;9.1.2 连续色调静态图像连续色调静态图像采用JPEG数字压缩编码,平均压缩率cr为15:1;9.2 编码方式应尽是采用实时操作性强的编码方式;失真度编码,用较少的比特率获得较好的图像质量;无失真编码,以低压缩保持信息的不失真;一般情况下宜采用国际通用编解码算法;9.3 存储方式与载体可选用在线和离线、不同载体进行存储;10 检索利用10.1 检索利用方式档案数字图像检索利用可采用单机、局域网和互联网三种方式;局域网中传输利用,应保证数据在内部局域网10Base T带宽下,平均1秒内显示响应完成;互联网中传输利用,互联网56Kbit/s带宽下,平均5秒内显示响应完成;为此要求一般每页档案数字图像的存储容量为50K以内;10.2 检索软件配置检索软件应符合国家档案局制定的档案管理软件功能要求暂行规定的各项要求;检索软件应具备目录检索与档案数字图像方便调阅的基本功能;。

纸质档案数字化规范

纸质档案数字化规范

纸质档案数字化规范
一、总体要求
1、纸质档案数字化必须贯彻落实“以人为本”的方针,尊重用户权益
实现信息共享。

2、纸质档案数字化的内容应充分反映历史价值、文化传承,合理应用
信息技术,实现信息资源的统一集成,确保信息安全与完整性。

二、技术标准
1、采用图像处理技术,对纸质档案进行拍摄和扫描,根据记录需求,
把纸质档案图像、音频、视频数据处理成图像格式、文本格式、文档
格式进行存储。

2、要求文件格式和质量达到标准,采用TIFF带压缩格式保存,便于
存储、检索和调阅,合理利用格式的优势,强化档案的管理、查阅等。

3、利用数据库技术、信息检索技术、图像检索技术等技术,帮助档案
馆实现档案资源的有效管理和识别与应用,优化档案管理能力。

三、管理规范
1、纸质档案数字化时必须完成鉴定,确定档案类别和合法性,保证清晰、完整的档案信息。

2、将原有的档案索引体系迁移至电子文档管理系统,以实现档案的集中、统一、有序管理,保证信息的安全。

3、对档案数字化过程,应记录处理环节,对每一步处理做出核实,并
记录正确性和完整性。

4、定期进行档案数字化管理培训和质量测试,保证档案数字化工作质量。

档案数字化技术要求

档案数字化技术要求
序号
工作内容
技术要求
1
档案扫描
扫描分辨率:300DPIo
扫描色彩:真彩色24位。
扫描内容:确保档案内容扫描完整齐全,不得出现漏页、漏字、折字。
2
图像处理
图像剪切:去黑边、白边处理,但不得影响档案内容。
图像倾斜度纠正:对扫描倾斜和原文倾斜的档案进行倾斜度纠正,倾斜度不得大于1度。
去污处理:对扫描产生的变色、污线、ቤተ መጻሕፍቲ ባይዱ点等情况进行处理,保留档案原貌。
3
格式保存
TIF格式一套,双层PDF格式一套。
PDF格式对规范印刷体文字的档案要求文字识别率不低于95%。
4
图像挂接
三对应原则:条目、纸质档案、电子档案必须做到三对应。
5
档案装订
不得装倒、装漏、装错、装掉页,采用原孔装订模式。
6
档案合格率要求
数据库条目与数字图像内容一一对应抽检合格率100%,其它内容能够达到98%以上抽检合格率。

档案数字化技术标准

档案数字化技术标准

档案数字化技术标准对于纸质档案利用扫描仪或数码相机转换成可储存在电脑上或刻成光盘,便于保存及查阅的,称之为档案数字化。

进行档案数字化加工步骤有:整理(弱化)、一次校对、扫描、扫描件校对、装订、目录数据录入及修改、挂接。

一、整理(弱化)。

在扫描之前,对需扫描的档案进行整理,整理时有以下环节应注意:1、拆卷。

将装订成本的档案逐一拆开,为了更好的延长扫描仪的寿命,防止高速扫描时会卡纸的情况,拆卷时应注意:如发现有金属物(钉书针、大头针等)应剃除。

2、顺序号。

根据文件的相关内容进行编码和排序,按照文件的合理排列,要求一份文件对应一条目录,一条目录对应一个顺序号,一条目录中如有几个文件,其中有重要的不属于该目录文件附件的文件,需在目录页的最后加写目录,顺序号应附属在该卷档案的最后一条,页码按文件实际所在页次编写。

凡目录有增减,顺序号必须依次进行调整。

3、页号。

档案常常会有漏编、跳号的情况。

对于漏编如:P7与P8之间有四页未编码,则应依次编为“7-1”、“7-2”、“7-3”、“7-4”,若空号为一份文件的首页,则将该页编为正码,其它依次编为副码,如:P7与P8之间有一页未编码,而该页正好是P8所在文件的首页,则将该页码编为“8”,而原P8编为“8-1”。

出现跳号,若前后两张文件内容完整且连贯,而第一页和第二页分别编码为“1”和“4”,则需在错误登记表和目录备注处注明“P2、P3为跳号”的字样。

若有内容的文件反面漏打页码,需加编副码;若反面是文件首页,则需编正码,原来的正码改为副码,依次类推。

如果空白纸上有编码,需在目录备注中注明“第X页为空白页,无内容”。

文件的最后一页必须是正码,不能编副码。

如两张文件粘贴重叠而只编了一个页码的,应在被覆盖的上面编副码。

正、反面均有内容的文件,若其中一面需扫描的内容被折叠装订,该面应增加一个副码。

凡页码写在折叠后文件反面的,应展开文件写上相同的页码,必须保证文件页码在扫描的图片上。

国家档案行业标准:纸质档案数字化技术规范

国家档案行业标准:纸质档案数字化技术规范
式扫描 。
的登记 , 及时整理 、 总 , 订成册 , 数字 化工作 完 图 的档 案 , 并 汇 装 在 以及页 面为多色 文字 的档案 , 可采 用灰度 模
6 2 4页面中有红头 、 ・・ 印章或插有黑白照片 、 彩色照
6 3扫描分 辨率 ・ 6 3 1扫描 分辨率参 数大小的选择 。 ・・ 原则上 以扫描 6 3 2采用黑 白二值 、 ・- 灰度 、 彩色几种模式 对档 案进
3・ 连 续 色 调 静 态 图 像 c niu u -o e si 5 o t o s tn t n l l
i g ma e
4・ ・ 应加 强 纸质档 案数字 化各 环节 的安全 保密 41 管 理机制 , 确保 档案原件和数字化 档案信息 的安全 。
赫赫丛一
维普资讯
3・ 1数 字 化 dgt ain iiz t i o
纸质档 案数字化 的基本原则是 使档案信 息资源 准
确方便快捷 地提供利 用 ,使可 以公 开 的档 案信息资 源
4 2数 字 化 对 象 的确 定 原 则 ・
用计 算机技术 将模拟信 号转换 为数字信号 的处理 得到共享 , 以满足社会对档案利用 的需求 。
单 位长度 内图像 包含 的点 数或像 素数 ,一般用 每
3 7失真度 dsot n me s r ・ i ro a u e t i
下列文件 中的条款 通过本标准 的引用而 成为本标 英寸点数( i d) 。 p 表示
单( 不包 括勘误 的内容) 或修 订版均不适 用于本标 准 , 然
采用扫描仪 或数码相 机等数码 设备对纸 质档案进 献才 能进行数字化 。 行 数字化 加工 , 将其转 化为 存储 在磁带 、 磁盘 、 光盘 等 载体上并能被 计算机识别 的数 字图像或数 字文本 的处

国家档案局关于发布《纸质档案数字化规范》等12项档案行业标准的通知

国家档案局关于发布《纸质档案数字化规范》等12项档案行业标准的通知

国家档案局关于发布《纸质档案数字化规范》等12项档案行业标准的通知文章属性•【制定机关】国家档案局•【公布日期】2017.08.02•【文号】•【施行日期】2018.01.01•【效力等级】部门规范性文件•【时效性】现行有效•【主题分类】标准化正文国家档案局关于发布《纸质档案数字化规范》等12项档案行业标准的通知各省、自治区、直辖市档案局,各计划单列市档案局,新疆生产建设兵团档案局,中央和国家机关各部委档案部门,中央军委办公厅保密和档案局,各中央企业档案部门,中国人民大学档案学院:经全国档案工作标准化技术委员会审查通过,并经国家档案局批准,以下12项标准为推荐性行业标准,现予以发布,自2018年1月1日起实施。

1.DA/T 31—2017《纸质档案数字化规范》(代替DA/T 31—2005)2.DA/T 35—2017《档案虫霉防治一般规则》(代替DA/T 35—2007)3.DA/T 59—2017《口述史料采集与管理规范》4.DA/T 60—2017《纸质档案真空充氮密封包装技术要求》5.DA/T 61—2017《明清纸质档案病害分类与图示》6.DA/T 62—2017《录音录像档案数字化规范》7.DA/T 63—2017《录音录像类电子档案元数据方案》8.DA/T 64.1—2017《纸质档案抢救与修复规范第1部分:破损等级的划分》DA/T 64.2—2017《纸质档案抢救与修复规范第2部分:档案保存状况的调查方法》DA/T 64.3—2017《纸质档案抢救与修复规范第3部分:修复质量要求》9.DA/T 65—2017《档案密集架智能管理系统技术要求》10.DA/T 66—2017《城市轨道交通工程文件归档要求与档案分类规范》11.DA/T 67—2017《档案保管外包服务管理规范》12.DA/T 68—2017《档案服务外包工作规范》国家档案局2017年8月2日。

纸质档案数字化验收标准

纸质档案数字化验收标准

纸质档案数字化验收标准一、扫描质量1.1分辨率:确保扫描的分辨率满足档案数字化的需求,一般应达到200dpi或以上。

1.2色彩:确保扫描的档案色彩准确,无明显色差。

1.3清晰度:扫描后的图像应清晰,无模糊、失真现象。

1.4倾斜与抖动:扫描过程中应保持档案平放,无明显倾斜与抖动。

二、数字处理2.1色彩调整:对扫描后的图像进行色彩调整,以使其更接近原档案的色彩。

2.2去噪与拼接:去除扫描过程中产生的噪点,对于大型文档应进行拼接处理。

2.3裁剪与旋转:对扫描后的图像进行裁剪和旋转,以纠正方向和位置。

三、数据存储3.1格式:数字化后的数据应采用通用的、非专有的文件格式进行存储,如TIFF或PDF。

3.2压缩:对于大型文件,应采用适当的压缩技术以减小存储空间占用。

3.3备份:数字化数据应定期备份,以防数据丢失。

四、安全性4.1访问控制:确保数字化数据只能由授权人员访问。

4.2加密:对数字化数据进行加密处理,以防数据泄露。

4.3防篡改:采取措施防止数字化数据被篡改。

五、完整性5.1校验:对数字化数据进行校验,以确保数据的完整性。

5.2元数据:确保数字化数据相关的元数据完整、准确。

5.3索引:建立数字化数据的索引,以便快速查找和检索。

六、元数据6.1内容描述:对数字化档案的内容进行详细描述。

6.2来源与创建日期:记录数字化档案的来源和创建日期。

6.3使用权限与限制:对数字化档案的使用权限进行定义和限制。

6.4关联信息:记录与数字化档案相关的其他信息,如相关文档、项目等。

七、验收测试7.1功能测试:测试数字化档案的基本功能,如打开、浏览、搜索等。

7.2兼容性测试:测试数字化档案在不同操作系统、浏览器和软件中的兼容性。

7.3数据完整性测试:测试数字化档案的数据是否完整、准确。

7.4安全性能测试:测试数字化档案的安全性能,如防篡改、防病毒等。

八、文档管理8.1文档分类:对数字化档案进行分类管理,以便于查找和使用。

8.2文档编号:为每个数字化档案分配唯一的编号,以便识别和管理。

中华人民共和国档案行业标准 DA/T 31—2005 纸质档案数字化技术规范

中华人民共和国档案行业标准 DA/T 31—2005 纸质档案数字化技术规范

dg i t n itai iz o
用 计 算 机 技 术 将 模 拟 信 号 转 换 为 数 字 信 号 的处 理 方 法 进 行 确认 , 有 符合 一定 要 求 的纸 质 档 案 文 献 才 能 只
3 2 纸 质 档 案 数 字化 .
crs od
dgtai f ae —bsdr- i i tn0 pr ae e iz o D
纸 质 档 案 数 字 化 的 基 本 环 节 主要 包 括 :档 案 整 理 、
样 并 最 化 的 函数 ,由相 同维 数 的 连 续 图 像 产 生 。 在矩 阵 档案 扫描 、 图像 处 理 、 图像 存 储 、 目录 建 库 、 据 挂 接 、 数 数 ( 其他 ) 或 网络 上 采 样 —— 连 续 函数 , 在 采 样 点 上将 值 据验 收 、 据 备 份 、 果 管 理 等 。 并 数 成
图像 的数字压缩及编码 第 1 部分 : 要求和指南 图像 的数 字压缩及编码
3 术语 和 定 义
连 续 色 调 静 态 4 1 基 本 原 则 . 纸 质 档 案 数 字 化 的 基 本 原 则 是 使 档 案 信 息 资 源 准 确 、 便 、 捷 地 提 供 利 用 , 可 以公 开 的 档 案 信 息 资 源 方 快 使
4 2 1 符 合 国家 法 律 法 规 的 原 则 .. 纸 质 档案 的数 字化 ,必 须 符合 国家 档案 开 放 规 定 以
采 用 扫 描 仪 或 数 码 相 机 等 数 码 设 备 对 纸 质 档 案 进 及 有 关 规 定 。
行数 字化加工 , 将其转化为存储在磁带 、 磁盘 、 光盘等载 4 2 2 价 值性 原则 .. 体上并 能被计算机识 别 的数 字图像或 数字文本 的处理

纸质档案数字化技术规范 pdf

纸质档案数字化技术规范 pdf

纸质档案数字化技术规范 pdf1、档案数字化标准本规范依据以纸质档案[按文书、科技工程图纸]、专门档案[照片、声音、影像、实物等分类] 为主的档案载体分类的行业标准;其中纸制档案数字化标准中详细约定了档案数字化规范标准过程,专门档案的数字化标准过程类同,但是在格式标准上有专门的要求,整个规约参照国标[DA/T313寸的黑白照片,必须选用300dpi 或350dpi 。

文件存储类型:扫描后的照片以TIF 格式存储,保存时必须选用图像选项中的品质为最佳值的大文件,存入到统一的照片数据库。

文件存储方式:档案照片存储时按全宗、目录、相册分级建立文件夹保存,照片名字以照片的档案号命名。

照片命名方法:每一张照片必须定义完全。

包括此张照片的档案号、拍摄时间、组说明或照片的定义内容。

以上注明需在文件名中全部打出。

补充说明无论彩色照片还是黑白照片都采用全彩格式扫描。

扫描仪有光学分辨率和差值分辨率两个常用技术参数,其中光学分辨率反映的是硬件系统确实可以达到的清晰程度,是扫描仪自身性能的反映。

所扫描的照片必须经过图像处理软件进行图片的亮度、色度调整,对扫描的边框进行裁切。

声音档案数字化标准声音档案数字化是指通过硬件设备将声音档案转为数字化数据并加以存储的过程。

声音档案数字化必须保证其真实性、有效性、完整性。

在使用时必须保证数字化数据能从存储介质中正确读取, 并还原成声音信号输出。

同时作为输出的流媒体信号能正常在网络中播放查阅。

基本概念采样频率和样本大小采样频率和样本大小是反映数字化声音档案的精确度高低的两个最基本的参数。

采样频率即每秒钟采集多少个声音样本, 用Hz 或kHz 来表示。

样本大小一般指声音卡的二进制位数,有8位、12位、16位等。

采样频率越高, 声音波形就表达得越精确, 而需要的存储空间就越大。

奈奎斯特理论奈奎斯特理论指出, 采样频率不应低于声音信号最高频率的两倍, 这样就能把数字表达的声音还原成原来的声音。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

档案数字化标准
本规范依据以纸质档案[按文书、科技工程图纸]、专门档案[照片、声音、影像、实物等分类] 为主的档案载体分类的行业标准;其中纸制档案数字化标准中详细约定了档案数字化规范标准过程,专门档案的数字化标准过程类同,但是在格式标准上有专门的要求,整个规约参照国标[DA/T31—2005]等有关档案数字化的标准规范以下内容
1纸质档案档案数字化标准
1文书、科技档案数字化标准
文书档案和科技档案的数字化通常是以纸介质作为专门的档案载体,其数字化的过程是指通过扫描仪将纸制档案采集为数字化数据并加以处理和存储的过程。

其档案数字化必须保证其真实性、有效性、完整性。

在使用时必须保证数字化数据能从存储介质中正确读取, 并还原成电子文件以备查询利用。

纸质档案数字化的基本环节主要包括档案整理、目录建库、档案扫描、图像处理、图像存储、数据质检、数据挂接、数据验收、数据备份、成果管理等。

应加强纸质档案数字化各环节的安全保密管理机制,确保档案原件和数字化档案信息的安全。

纸质档案数字化的各个环节均应进行详细的登记,并及时整理、汇总,装订成册,在数字化工作完成的同时建立起完整、规范的记录。

1档案整理
在扫描之前,根据档案管理情况,按下述步骤对档案进行适当整理,并视需要做出标识,确保档案数字化质量。

目录数据准备
按照《档案著录规则》(DA/T18)等的要求,规范档案中的目录内容。

包括确定档案目录的著录项、字段长度和内容要求。

如有错误或不规范的案卷题名、文件名、贾任者、起止页号和页数等,应进行修改。

拆除装订
在不去除装订物情况下,影响扫描工作进行的档案,应拆除装订物。

拆除装订物时应注意保护档案不受损害。

页面修整
破损严重、无法直接进行扫描的档案,应先进行技术修复,折皱不平影响扫描质量的原件应先进行相应处理(压平或烫平等) 后再进行扫描。

档案整理登记
制作并填写纸质档案数字化加工过程交接登记表单,详细记录档案整理后每份文件的起始页号和页数。

装订
扫描工作完成后,拆除过装订物的档案应按档案保管的要求重新装订。

恢复装订时,应注意保持档案的排列顺序不变,做到安全、准确、无遗漏。

2档案扫描
扫描方式
根据档案幅面的大小(A4、A3、A0等) 选择相应规格的扫描仪或专业担描仪(如工程图纸可采用0号图纸扫描仪) 进行扫描。

大幅面档案可采用大幅面数码平台,或者缩微拍摄后的胶片数字化转换设备等进行扫描,也可以采用小幅面扫描后的图像拼接方式处理。

纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式以提高工作效率。

扫描色彩模式
扫描色彩模式一般有黑白二值、灰度、彩色等。

通常采用黑白二值。

页面为黑白两色,并且字迹清晰、不带插图的档案,可采用黑白二值模式进行扫描。

页面为黑白两色,但字迹清晰度差或带有插图的档案,以及页面为多色文字的档案,或插有黑白照片、彩色照片、彩色插图的档案(页面中有红头、印章的因安全原因应扫描成黑白二值),可视需要采用彩色模式进行扫描。

原档案为影印件或非常不清晰的可视需要采用彩色模式进行扫描。

扫描分辨率
扫描分辨率参数大小的选择,原则上以扫描后的图像清晰、完整、不影响图像的利用效果为准。

采用黑白二值、灰度、彩色几种模式对档案进行扫描时,其分辨率一般均建
议选择≥300dpi 。

特殊情况下,如文字偏小、密集、清晰度较差等,可适当提高分辨率。

需要进行OCR 汉字识别的档案,扫描分辨率建议选择≥300dpi 。

扫描登记
认真填写纸质档案数字化转换过程交接登记表单,登记扫描的页数,核对每份文件的实际扫描页数与档案整理时填写的文件页数是否一致,不一致时应注明具体原因和处理方法。

3图像处理
图像数据质量检验
对图像偏斜度、清晰度、失真度等进行检查。

发现不符合图像质量要求时,应重新进行图像的处理。

由于操作不当,造成扫描的图像文件不完整或无法清晰识别时,应重新扫描。

发现文件漏扫时,应及时补扫并正确插入图像。

发现扫描图像的排列顺序与档案原件不一致时,应及时进行调整。

认真填写相关表单,记录质检结果和处理意见。

纠偏
对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜为准。

对方向不正确的图像应进行旋转还原,以符合阅读习惯。

相关文档
最新文档