DA/T32005纸质档案数字化技术规范标准
《纸质档案数字化技术规范》(DAT 31-2005)
《纸质档案数字化技术规范》(DAT 31-2005)《纸质档案数字化技术规范》(DA/T 31-2005)(2008-05-07 12:48:46)(中华人民共和国档案行业标准 DA/T 31-2005,中华人民共和国国家档案局2005年4月30日发布,2005年9月1日起实施)1 范围本标准规定了纸质档案数字化的主要技术要求。
本标准适用于用扫描仪对各种纸质档案的数字化加工处理。
2 规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。
凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。
凡是不注日期的引用文件,其最新版本适用于本标准。
GB,T 17235.1 连续色调静态图像的数字压缩编码T 17235.2 连续色调静态图像的数字压缩编码 GB,GB,T 18894—2002 电子文件归档与管理规范ITU(CCITT)G3 二值图像压缩算法ITU(CCITT)G4 二值图像压缩算法DA,T18—1999 档案著录规则档案管理软件功能要求暂行规定国家档案局档发[2001]6号3 术语和定义下列术语和定义适用于本标准。
3.1数字化 Digitization用计算机技术将模拟图像转换为数字图像的处理过程。
3.2纸质档案数字化Digitization of Paper—Based Records 对普通(黑色字迹清晰)的油印、铅印、胶印等印刷件或复印件纸质档案进行数字化及应用的过程。
3(3数字图像 Digital Image表示景物图像的整数阵列。
一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。
在矩阵(或其他)网络上采样一连续函数,并在采样点上将值最小化后的阵列。
3(4黑白二值图像 Binary Image只有黑白两级灰度的数字图像。
它对应于黑和白的两种状态文字稿、线条图、指纹图等。
DAT 31-2005 纸质档案数字化技术规范
纸质档案数字化技术规范DA/T 32-2005(2005年4月30日发布2005年9月1日实施)一、概述国家标准《纸质档案数字化技术规范》DA/T 31—2005是由中国国家档案局颁布的,其批准时间为2005年4月30日,实施时间为2005年9月1日。
该标准共分为十三章。
其中包括范围,规范性引用文件,术语和定义,纸质档案数字化基本要求,档案整理,档案扫描,图像处理,图像存储,目录建库,数据挂接,数据验收,数据备份,数字化成果管理等。
该技术规范的出台结束了我国纸质档案数字化的初探阶段,标志着我国各级档案馆馆藏数字化技术的成熟。
二、主要条款简介第一章范围本标准规定了纸质档案数字化的主要技术要求。
本标准适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。
第二章规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。
凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。
凡是不注日期的引用文件其最新版本适用于本标准。
GB/T 17235.1-1998 信息技术连续色调静态图像的数字压缩及编码第一部分:要求和指南。
GB/T 17235.2-1998 信息技术连续色调静态图像的数字压缩及编码第二部分:一致性测试GB/T 18894-2002 电子文件归档与管理规范。
第三章术语和定义下列术语和定义适用于该标准。
(1)数字化digitization用计算机技术将模拟信号转换为数字信号的处理过程。
(2)纸质档案数字化digitization of paper-based records采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。
(3)数字图像digital image表示实物图像的整数阵列。
一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。
DA/T31-2005纸质档案数字化技术要求规范
纸质档案数字化技术规DA/T31-20051 围本标准规定了纸质档案数字化的主要技术要求。
本标准适用于用扫描仪对各种纸质档案的数字化加工处理。
2 规性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。
凡是注日期的引用文件,其随后所有的修改单(不包括勘误的容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。
凡是不注日期的引用文件,其最新版本适用于本标准。
GB/T 17235.1 连续色调静态图像的数字压缩编码GB/T 17235.2 连续色调静态图像的数字压缩编码GB/T 18894?2002 电子文件归档与管理规ITU(CCITT)G3 二值图像压缩算法ITU(CCITT)G4 二值图像压缩算法DA/T18?1999 档案著录规则档案管理软件功能要求暂行规定国家档案局档发[2001]6号3 术语和定义下列术语和定义适用于本标准。
3.1数字化 Digitization用计算机技术将模拟图像转换为数字图像的处理过程。
3.2纸质档案数字化Digitization of Paper?Based Records对普通(黑色字迹清晰)的油印、铅印、胶印等印刷件或复印件纸质档案进行数字化及应用的过程。
3.3数字图像 Digital Image表示景物图像的整数阵列。
一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。
在矩阵(或其他)网络上采样一连续函数,并在采样点上将值最小化后的阵列。
3.4黑白二值图像 Binary Image只有黑白两级灰度的数字图像。
它对应于黑和白的两种状态文字稿、线条图、指纹图等。
3.5连续色调静态图像 Continuous?tone Still Image以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。
3.6失真度 Distortion Measure对档案原件进行数字化转换后,在同等测试环境下,数字图像与档案原件色彩、几何、压缩算法等差值。
纸质档案管理规范
纸质档案数字化技术规范中华人民共和国档案行业标准DA/T 31—20051范围本标准规定了纸质档案数字化的主要技术要求。
本标准适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。
2规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。
凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。
凡是不注日期的引用文件,其最新版本适用于本标准。
GB/T 17235.1—1998信息技术连续色调静态图像的数字压缩及编码第1部分:要求和指南GB/T 17235.2—1998信息技术连续色调静态图像的数字压缩及编码第2部分:一致性测试GB/T 18894-2002电子文件归档与管理规范3术语和定义下列术语和定义适用于本标准。
3.1数字化digitization用计算机技术将模拟信号转换为数字信号的处理过程3.2纸质档案数字化digitization 0fpapeI喃ased records采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。
3.3数字图像digital image表示实物图像的整数阵列。
一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。
在矩阵(或其他)网络上采样——连续函数,并在采样点上将值最小化后的阵列。
3.4黑白二值图像binary image只有黑白两级灰度的数字图像。
它对应于黑白两种状态的文字稿、线条图等。
3.5连续色调静态图像continuous—tone 8till image以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。
在纸质档案数字化过程中,通常表现为灰度扫描和彩色扫描两种模式。
3.6分辨率resolution单位长度内图像包含的点数或像素数,一般用每英寸点数(dpi)表示。
13、纸质档案数字化技术规范(精选合集)
13、纸质档案数字化技术规范(精选合集)第一篇:13、纸质档案数字化技术规范纸质档案数字化技术规范中华人民共和国档案行业标准 DA/T 31—20051范围本标准规定了纸质档案数字化的主要技术要求。
本标准适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。
2规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。
凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。
凡是不注日期的引用文件,其最新版本适用于本标准。
GB/T 17235.1—1998信息技术连续色调静态图像的数字压缩及编码第1部分:要求和指南GB/T 17235.2—1998信息技术连续色调静态图像的数字压缩及编码第2部分:一致性测试GB/T 18894-2002电子文件归档与管理规范3术语和定义下列术语和定义适用于本标准。
3.1数字化digitization用计算机技术将模拟信号转换为数字信号的处理过程 3.2纸质档案数字化digitization 0fpapeI喃ased records采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。
3.3数字图像digital image 表示实物图像的整数阵列。
一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。
在矩阵(或其他)网络上采样——连续函数,并在采样点上将值最小化后的阵列。
3.4黑白二值图像binary image只有黑白两级灰度的数字图像。
它对应于黑白两种状态的文字稿、线条图等。
3.5连续色调静态图像continuous—tone 8till image以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。
在纸质档案数字化过程中,通常表现为灰度扫描和彩色扫描两种模式。
纸质档案数字化工作技术标准
纸质档案数字化工作技术标准1、档案前处理要求:1)应对拟数字化的档案进行涉密性、完整性、有序性及档案实体与目录的一致性检查。
档案实体破损、残缺的要进行登记,征求同意后对破损、残缺档案进行裱糊抢救,目录错误的要予以修正,无数字化目录的要予以著录。
如果该档案为涉密档案,则不进行全文扫描,并予以标记。
2)扫描前,对档案进行拆卷并整理,对不平整的档案进行平整处理,对错误、漏编的页号进行修正或补编页号。
扫描结束,档案需进行恢复性、规范性整理装订。
拆卷和装订不能损害档案原件。
拆卷时不允许裁切档案纸张,装订时应尽量按原有顺序原孔装订,案卷不掉页,右边和底边整齐,左侧不及装订线的要加装订边。
2、档案整理要求具体整理方法参照《机关档案业务建设规范》、《归档文件整理规范》。
档案整理的归档范围和保管期限参照国家档案局第8号令《机关文件材料归档范围和文书档案保管期限规定》。
具体任务包括:区分归档年度、鉴定保管期限、剔除重份文件、组卷、编写页码、打印目录、打印封面、打印备考表、盖归档章、填写档号项、装订、装盒、填写背脊、入库、上架等,具体以业务性标准规范标为准。
3、档案著录要求(1)、需符合国家档案局发布的《纸质档案数字化技术规范》、《档案著录规则》和安徽省档案局发布的《文书档案文件级目录数据库结构与著录细则》在数字化加工方面的相关规定,并按太和县档案局要求,将档案数据著录进太和县档案局档案管理软件系统中。
著录的档案信息要求准确无错别字、符号正确、题名完整通顺、无缺项,对传统方法整理的档案案卷题名、会议记录类档案、无明确题名的通知等需总结完整通顺,符合著录规则,对不完整的题名需要按照要求自拟题名。
(2)、卷内目录需与案卷目录对应,按要求进行录入,并进行校对,确保准确,著录完成后按太和县档案局要求打印相应目录。
(3)、著录时,在文件、会议记录或其他档案材料中如遇到有人员职务任免、离退休、工资福利、关系调动、奖励处罚等的人名需要全部著录到人名项中。
XX市禅城区档案馆纸质档案数字化验收标准
XX市禅城区档案馆纸质档案数字化验收标准为规范XX市XX区档案馆纸质档案数字化处理工作,根据中华人民共和国档案行业标准《纸质档案数字化技术规范》(DA/T31-2005),结合XX区档案馆实际,特制定本标准。
一、适用范围本标准适用于XX区档案馆纸质文书档案、业务档案数字化处理。
二、档案整理、装订验收标准(一)文件排序、页号编制正确1.文件排序要求一份文件内页与页之间的顺序要仔细核对,对页序颠倒、紊乱的页面要予以更正。
2.页号编制要求(1)卷/件内文件含有有效信息的页面,按次序从1开始连续编号,不得有重号、跳号、错号。
不含有效信息的页面不编页号,含有有效信息的页面必须编页号。
(2)图、文混排的档案,每张图视同一页文件编制页号。
(3)卷/件内文件全部页码需要重新编制时,页号的位置为:以扫描后正确的图像方向为基准,以案卷形式归档的,正面在右上角,背面在左上角;以单份文件方式归档的,正面在右下角,背面在左下角。
卷/件内文件只有部分页码需要修订时,需修订部分的新页码的位置应与不需修订部分的页码的位置协调一致。
页号应尽量在页面的空白处编制。
不能在纸质照片上编制页号。
(4)页号用阿拉伯数字编制,可用号码机打印,也可用黑色墨水笔书写,页号字迹要工整、清晰。
(5)页号不可采用加副页(例如:3、3-1、4、5……)的方式进行“理顺”。
(6)档案实体原有页号已是从1开始连续编号,无重号、跳号、漏号、错号现象的,不论页号编制在页面何处位置,也不论页号是否含有前导字符“0”,均不需重新编制页号。
3.文件排序、页号编制方面常见的质量问题示例(二)条目修订准确1.案卷目录修订要求(1)文件份数:指一个案卷内的文件份数,著录时用阿拉伯数字据实录入。
(2)页数:指一个案卷内的总页数,著录时用阿拉伯数字据实录入。
2.卷内文件目录/归档文件目录修订要求(1)顺序号(件号):指文件排列先后顺序的序号,著录时用阿拉伯数字据实录入,例如:1、100等。
中华人民共和国档案行业标准 DA/T 31—2005 纸质档案数字化技术规范
dg i t n itai iz o
用 计 算 机 技 术 将 模 拟 信 号 转 换 为 数 字 信 号 的处 理 方 法 进 行 确认 , 有 符合 一定 要 求 的纸 质 档 案 文 献 才 能 只
3 2 纸 质 档 案 数 字化 .
crs od
dgtai f ae —bsdr- i i tn0 pr ae e iz o D
纸 质 档 案 数 字 化 的 基 本 环 节 主要 包 括 :档 案 整 理 、
样 并 最 化 的 函数 ,由相 同维 数 的 连 续 图 像 产 生 。 在矩 阵 档案 扫描 、 图像 处 理 、 图像 存 储 、 目录 建 库 、 据 挂 接 、 数 数 ( 其他 ) 或 网络 上 采 样 —— 连 续 函数 , 在 采 样 点 上将 值 据验 收 、 据 备 份 、 果 管 理 等 。 并 数 成
图像 的数字压缩及编码 第 1 部分 : 要求和指南 图像 的数 字压缩及编码
3 术语 和 定 义
连 续 色 调 静 态 4 1 基 本 原 则 . 纸 质 档 案 数 字 化 的 基 本 原 则 是 使 档 案 信 息 资 源 准 确 、 便 、 捷 地 提 供 利 用 , 可 以公 开 的 档 案 信 息 资 源 方 快 使
4 2 1 符 合 国家 法 律 法 规 的 原 则 .. 纸 质 档案 的数 字化 ,必 须 符合 国家 档案 开 放 规 定 以
采 用 扫 描 仪 或 数 码 相 机 等 数 码 设 备 对 纸 质 档 案 进 及 有 关 规 定 。
行数 字化加工 , 将其转化为存储在磁带 、 磁盘 、 光盘等载 4 2 2 价 值性 原则 .. 体上并 能被计算机识 别 的数 字图像或 数字文本 的处理
海南省纸质档案数字化技术规范
海南省纸质档案数字化技术规范海南省纸质档案数字化技术规范(试行)为规范我省纸质档案数字化工作,提高纸质档案的数字化质量,维护档案实体和档案信息安全,根据《中华人民共和国档案法》和《纸质档案数字化技术规范》(DA/T31-2005)等相关法规标准,制定本规范。
1.范围本规范规定了我省纸质档案数字化的各项要求。
本规范适用于我省各级国家综合档案馆(室)进行纸质档案数字化转换工作。
机关、团体、企事业单位纸质档案的数字化工作可参照执行。
2.术语本规范所称纸质档案数字化是采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。
源版数字副本是指使用扫描仪等数字成像设备对纸质档案进行数字化转换而直接生成的静态图像文件。
源版数字副本的衍生品是指对源版数字副本进行压缩、格式转换、识别等处理而生成的静态图像文件、版式文件或纯文本文件。
3.项目管理3.1 全程管理应对纸质档案数字化项目的准备、扫描、处理、移交接收等阶段实施全程管理,对数字化工作的安全、标准、质量、进度等进行有效控制。
3.2 制定数字化工作方案应对数字化对象基本情况进行调查摸底,以此为基础并根据本规范提出数字化项目管理与技术要求,编制数字化工作方案。
数字化工作方案应包括安全保密措施、项目管理要求、技术标准、工作文档管理要求、数字化成果移交要求等内容。
采取委托加工方式的数字化项目,数字化工作方案应明确数字化成果的计算标准。
3.3 数字化对象审批对纸质档案数字化对象实行审批制。
尤其是委托加工方式的项目,要有档案原件法定持有保管单位的法人或授权代表的签署《纸质档案数字化审批书》(附录A表A1)3.4 数字化工作文档管理应明确纸质档案数字化过程中形成的工作文档的整理、归档、移交等管理要求,并与全宗卷共同保管。
应归档的数字化文档包括:数字化工作方案、档案原件数字化审批书、档案数字化借用档案登记表、数字化工作登记表、纸质档案数字化加工流程单、纸质档案数字化数据质检登记表、纸质档案数字化数据质检验收登记表、纸质档案数字化项目验收移交清单等凭证性文件;采取委托加工方式的数字化项目,还应包括项目招投标文件、中标通知书、项目合同等。
纸质档案数字化工作流程与规范要求
档案资料保护 档案基础查询 档案全文检索 构建知识服务系 统
档案数据挖掘
总体架构示意图
元数据 人物 时间 地点 事件 特点
展示 关联 网络 地图
文本 数据
挖掘算法
本体
民间传说中,唐末,天下大乱,各路英雄争雄,逐鹿于中原。黄巢农民起 义异军突起,天秸元年(904)八月,朱全忠杀唐昭宗,第二年唐昭宗的遗腹子李 昌翼出生,在徽州婺源考水被一个叫胡三的人收为义子,改姓胡。昌翼长大后, 于五代后唐同光三年(925)中明经科及第,故其后裔称明经胡氏,因其是李姓后 裔,明经胡氏忌与李氏通婚。明经胡氏人才辈出,最著名的有二支,即宋元时 期的婺源胡炳文家族和近代绩溪胡适、胡雪岩家族。
数据检 查及整 理挂接
数字化 成果接 收
归档数 据管理
电 子 档 案 发 布 利 用
电子文 件采集
生成电 子档案
数据检 查及整 理
实时归 档
归档数 据管理
档案数 据鉴定
发布利 用
数据挖 掘
(在线/离线)
数据分 级存储 管理
数据安 全防护
6
馆(室)藏档案数字化工作是数字档案馆(室)资源体系建设的重要手段 和方式,国家档案局对档案数字化工作十分重视。 2002年 国家档案局中央档案馆关于印发《全国档案信息化建设实施纲要》 (档发【2002】8号)的通知中要求各地综合档案馆在“十五”期间以档案信 息资源建设为核心,以扩大档案信息资源开发利用为目标,加强档案目录数据 库建设,积极推进档案全文数据库和多媒体数据库建设,以现实需要为前提, 分阶段、分步骤实施档案数字化进程。 2010年 国家档案局印发《数字档案馆建设指南》,指出传统载体档案数字 化是现阶段数字档案资源建设的一个重要途径。应当统筹规划,分步实施。 应当通过数字化工作,对馆藏档案进行全面的梳理。如果对馆藏档案无法一次 性全面数字化,可以按照特殊载体优先、重要程度优先、共享性强优先等原则 分布实施。 2013年10月 时任国家档案局局长杨冬权在全国数字档案馆(室)建设推 进会上的讲话,要求数字档案馆(室)建设的首要任务,就是要把纸质档案、 音像档案等传统载体的档案数字化。不完成这项任务,档案馆(室)就不能实 现转型升级,就必然要在大数据时代落伍,就肯定不能跨进现代化的门槛。
DA/T31-2005纸质档案数字化技术规范
纸质档案数字化技术规范(DA/T31--2005)1 范围本标准规定了纸质档案数字化的主要技术要求。
本标准适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。
2 规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。
凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。
凡是不注日期的引用文件,其最新版本适用于本标准。
GB/T 17235.1-1998 信息技术连续色调静态图像的数字压缩编码第一部分:要求和指南GB/T 17235.2-1998 信息技术连续色调静态图像的数字压缩编码第二部分:一致性测试GB/T 18894-2002 电子文件归档与管理规范3 术语和定义下列术语和定义适用于本标准。
3.1数字化digitization用计算机技术将模拟信号转换为数字信号的处理过程。
3.2纸质档案数字化digitization of paper-based records采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。
3.3数字图像digital image表示实物图像的整数阵列。
一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。
在矩阵(或其他)网络上采样--连续函数,并在采样点上将值最小化后的阵列。
3.4黑白二值图像binary image只有黑白两级灰度的数字图像。
它对应于黑白两种状态的文字稿、线条图等。
3.5连续色调静态图像continuous-tone still image以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。
在纸质档案数字化过程中,通常表现为灰度扫描和彩色扫描两种模式。
3.6分辨率resolution单位长度内图像包含的点数或像素数,一般用每英吋点数(dpi)表示。
(技术规范标准)纸质档案数字化技术规范
纸质档案数字化技术规范范围本标准规定了纸质档案数字化的主要技术要求。
本标准适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。
2 规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。
凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。
凡足不注日期的引用文件,其最新版本适用于本标准。
GB/T 17235.1-1998信息技术连续色调静态图像的数字压缩编码第一部分:要求和指南GB/T l7235.2-1998信息技术还续色调静态图像的数字压缩编码第二部分:一致性测试GB/T l8894-2004 电子文件归档与管理规范3 术语和定义下列术语利定义适用于本标准。
3.1 数字化digitization用计算机技术将模拟信号转换为数字信号的处理过程。
3.2 纸质档案数字化digitization of paper-based records采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。
3.3 数字图像digital image表示实物图像的整数阵列。
一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。
在矩阵(或其他)网络上采样——连续函数,并在采样点上将值最小化后的阵列。
3.4 黑白二值图像binary image只有黑白两级灰度的数字图像。
它对应于黑白两种状态的文字稿、线条图等。
3.5 连续色调静态图像continuous-tone still image以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。
在纸质档案数字化过程中,通常表现为灰度扫描利彩色扫描两种模式。
3.6分辨率resolution单位长度内图像包含的点数或像素数,一般用每英寸点数(dpi)表示。
《纸质档案数字化规范》解读
《纸质档案数字化规范》解读杨艺【期刊名称】《陕西档案》【年(卷),期】2019(000)002【总页数】2页(P53-54)【作者】杨艺【作者单位】陕西省档案馆【正文语种】中文《纸质档案数字化规范》在组织与管理、数字化前处理、技术指标要求、数字化验收成果以及数字化流程等方面对纸质档案数字化工作进行了重新修订,在计算机信息技术高速发展环境下,纸质档案数字化工作得以顺利规范进行2005年国家档案局发布并实施了档案行业标准《纸质档案数字化技术规范》DA/T 31-2005,首次从规范标准的角度来要求纸质档案数字化工作,对档案信息化的数据资源建设提供了有力的标准规范支持。
十几年过去,由于计算机信息科技高速发展,DA/T 31-2005在实践应用过程中已无法有效规范和处理纸质档案数字化工作中遇到的所有问题,纸质档案数字化工作的管理模式已经由起初单纯的技术性工作向系统化管理性工作转变,因此,国家档案局及时地对本标准进行了修订,调整相关要求,以适应纸质档案数字化发展现状,形成了《纸质档案数字化规范》DA/T31-2017,替代DA/T 31-2005。
修订主要内容有以下几个方面:一、增强组织与管理部分的内容,完善数字化工作中管理相关要求DA/T 31-2017增加第5部分充分详细地对组织与管理提出了规范性要求。
目前,对馆藏纸质档案进行数字化已不仅仅是一项单纯的技术性工作,档案数字化工作组织形式由原先的单一化变得多元化,更多表现为服务外包项目形式,这种科学有效地组织和管理对纸质档案数字化工作的有序进行以及安全保障尤为重要。
故规范名称将原规范标题中的“技术”两字去掉,修订为《纸质档案数字化规范》。
DA/T 31-2017对组织与管理方面的具体要求全面、系统、科学、准确。
内容详细介绍了机构组成及人员要求、基础设施安全保障、工作方案的科学合理及审批归档、管理制度的规范全面、工作流程的有效控制、文件管理的完整标准以及档案数字化外包的监督指导等多个方面,涵盖了纸质档案数字化工作的全部流程,为纸质档案数字化的管理工作提供了切实可行的理论依据,有效保障了数字化工作的有序进行,有章可依。
档案数字化标准
纸质档案数字化技术规范pdf_档案数字化标准1.档案数字化标准本规范依据以纸质档案[按文书、科技工程图纸]、专门档案[照片、声音、影像、实物等分类]为主的档案载体分类的行业标准;其中纸制档案数字化标准中详细约定了档案数字化规范标准过程,专门档案的数字化标准过程类同,但是在格式标准上有专门的要求,整个规约参照国标[DA/T31—2005]等有关档案数字化的标准规范以下内容:1.1纸质档案档案数字化标准1.1.1文书、科技档案数字化标准文书档案和科技档案的数字化通常是以纸介质作为专门的档案载体,其数字化的过程是指通过扫描仪将纸制档案采集为数字化数据并加以处理和存储的过程。
其档案数字化必须保证其真实性、有效性、完整性。
在使用时必须保证数字化数据能从存储介质中正确读取,并还原成电子文件以备查询利用。
纸质档案数字化的基本环节主要包括:档案整理、目录建库、档案扫描、图像处理、图像存储、数据质检、数据挂接、数据验收、数据备份、成果管理等。
应加强纸质档案数字化各环节的安全保密管理机制,确保档案原件和数字化档案信息的安全。
纸质档案数字化的各个环节均应进行详细的登记,并及时整理、汇总,装订成册,在数字化工作完成的同时建立起完整、规范的记录。
1.1.1.1档案整理在扫描之前,根据档案管理情况,按下述步骤对档案进行适当整理,并视需要做出标识,确保档案数字化质量。
目录数据准备按照《档案著录规则》(DA/T18)等的要求,规范档案中的目录内容。
包括确定档案目录的著录项、字段长度和内容要求。
如有错误或不规范的案卷题名、文件名、贾任者、起止页号和页数等,应进行修改。
拆除装订在不去除装订物情况下,影响扫描工作进行的档案,应拆除装订物。
拆除装订物时应注意保护档案不受损害。
页面修整破损严重、无法直接进行扫描的档案,应先进行技术修复,折皱不平影响扫描质量的原件应先进行相应处理(压平或烫平等)后再进行扫描。
档案整理登记制作并填写纸质档案数字化加工过程交接登记表单,详细记录档案整理后每份文件的起始页号和页数。
南京中医药大学档案馆纸质档案数字化技术规范
南京中医药大学档案馆纸质档案数字化技术规范为了规范、科学、合理的开展纸质档案数字化工作,使档案信息资源准确、方便、快捷地提供共享利用,以满足学校对档案的需求,现参照《纸质档案数字化技术规范》(DA/T 31-2005),并结合本馆实际,制订本技术规范。
1 本规范的适用范围本规范规定了南京中医药大学纸质档案数字化的主要技术要求。
本规范适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。
2 规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。
GB/T 17235.1连续色调静态图像的数字压缩编码第一部分:要求和指南GB/T l7205.2还续色调静态图像的数字压缩编码第二部分:一致性测试GB/T l8894电子文件归档与管理规范DA/T 31—2005 纸质档案数字化技术规范3 术语和定义下列术语和定义适用于本标准。
3.1 数字化digitization用计算机技术将模拟信号转换为数字信号的处理过程。
3.2 纸质档案数字化digitizatin of paper-based records采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。
3.3 数字图像digital image表示实物图像的整数阵列。
一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。
在矩阵(或其他)网络上采样——连续函数,并在采样点上将值最小化后的阵列。
3.4 黑白二值图像binary image只有黑白两级灰度的数字图像。
它对应于黑白两种状态的文字稿、线条图等。
3.5 连续色调静态图像continuous-tone still image以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。
在纸质档案数字化过程中,通常表现为灰度扫描和彩色扫描两种模式。
3.6 分辨率resolution单位长度内图像包含的点数或像素数,一般用每英寸点数(dpi)表示。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
纸质档案数字化技术规范DA/T31-20051 范围本标准规定了纸质档案数字化的主要技术要求。
本标准适用于用扫描仪对各种纸质档案的数字化加工处理。
2 规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。
凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。
凡是不注日期的引用文件,其最新版本适用于本标准。
GB/T 17235.1 连续色调静态图像的数字压缩编码GB/T 17235.2 连续色调静态图像的数字压缩编码GB/T 18894?2002 电子文件归档与管理规范ITU(CCITT)G3 二值图像压缩算法ITU(CCITT)G4 二值图像压缩算法DA/T18?1999 档案著录规则档案管理软件功能要求暂行规定国家档案局档发[2001]6号3 术语和定义下列术语和定义适用于本标准。
3.1数字化 Digitization用计算机技术将模拟图像转换为数字图像的处理过程。
3.2纸质档案数字化Digitization of Paper?Based Records对普通(黑色字迹清晰)的油印、铅印、胶印等印刷件或复印件纸质档案进行数字化及应用的过程。
3.3数字图像 Digital Image表示景物图像的整数阵列。
一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。
在矩阵(或其他)网络上采样一连续函数,并在采样点上将值最小化后的阵列。
3.4黑白二值图像 Binary Image只有黑白两级灰度的数字图像。
它对应于黑和白的两种状态文字稿、线条图、指纹图等。
3.5连续色调静态图像 Continuous?tone Still Image以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。
3.6失真度 Distortion Measure对档案原件进行数字化转换后,在同等测试环境下,数字图像与档案原件色彩、几何、压缩算法等差值。
3.7可懂度 intelligibility表示数字图像向人或机器提供信息的能力。
3.8清除图像冗余或对图像近似的任一种过程,其目的是对图像以更紧凑的形式表现。
3. 9分辨率Resolution指单位长度内图像包含的点数或像素数。
3.10TIFF Tagged Tmage File Format标记图像文件格式。
一种基于标记的无损(不丢失信息)压缩格式,用于在应用程序之间和计算机平台之间交换文件。
因为它存储图像细微层次的信息非常多,图像的质量也得以提高,故而非常有利于原件为黑白档案的复制储存。
3.11JPEG Joint photographic Experts Group联合照片专家组。
一种丢失少量信息的压缩格式,尤其适用于屏幕和打印显示,支持所有主要计算机平台和Web浏览器。
JPEG格式文件小,影像质量多数情况下均可接受。
考虑储存空间及传输效率,原件为彩色的档案可迁此格式复制储存。
4 数字化基本流程纸质档案数字化的基本流程主要包括案卷整理、目录建库、批量扫描、数据处理、信息存储、检索利用等工序。
4.1 案卷整理对需要扫描的案卷进行适当整理,做出标识。
4.2 目录建库为数字化的档案检索而建立必要的目录数据库。
4.3 批量扫描按照档案数字化具体任务的整体安排按计划分批次进行扫描。
4.4 数据处理4.4.1 对扫描图像进行校对,确保图像完整无误,并视需要对有问题的扫描图像进行纠偏、去污、拼接等技术处理。
4.4.2 对裸数据进行验收前的相应处理,包括文件的格式转换、逻辑分盘处理、添加说明性文件,以及数据的挂接、检验、上载、质量检查和备份。
4.5 信息存储根据不同的扫描图像选择适当数据格式、编码方式和存储介质对信息进行保存。
4.6 检索利用按用户需求提供检索利用。
5 案卷整理在批量扫描之前,按下述步骤对案卷进行整理,确保档案数字化质量。
5.1 分件5.1.1 把同一案卷中的扫描件和非扫描件分开。
5.1.2 在扫描件中将大图、照片插入指示页,便于扫描工序批量扫描,实际图像放在图像处理时进行重扫,替换指示页。
5.1.3 填写《数据加工过程处理单》(见附录A),对需要特殊处理的页,标识清楚。
5.2 分页对批量扫描前的档案进行页号、件号的标注。
如在标注中与原档案中的件数、页号不一致,应以此为准。
5.3 拆卷去除档案中原来的装订物,以便后续扫描工作的进行。
5.4 装卷按档案保管要求恢复原装订。
6 建目录库6.1 目录著录根据DA/T18确定档案著录项,并进行著录。
6.2 数据格式选择所选定的数据格式通用,应能直接或间接与DBF文件格式或通过XML文档进行数据交换。
6.3 目录输入将著录好的目录输入计算机内,建立机读目录数据库。
7 批量扫描7.1 扫描方式纸质档案扫描可采用黑白二值图像和连续色调图像两种方式。
7.1.1 页面为单色文字的纸质档案,宜采用黑白二值图像扫描;页面为多色文字图像的档案文件,可采用连续色调图像扫描。
7.1.2 字迹清晰、不带图片的档案材料,采用黑白二值图像扫描;清晰度较差或带有图片的档案材料,可采用连续色调图像扫描。
7.2 分辨率选择7.2.1 单色页面档案文件,扫描分辨率一般建议选择100~200dpi。
7.2.2 彩色页面档案文件,扫描分辨率可选择100dpi以上参数值进行。
7.2.3 大幅面档案文件,如工程图纸、报纸等尺寸超过A3的,可选用大幅面图像扫描仪(如A0)、大幅面数码平台、缩微照像后胶片数字转换,也可以采用小幅面扫描后的图像拼接。
扫描分辨率应选择1OOdpi以上。
7.2.4 需要时可根据原件的清晰度适当调整扫描分辨率。
如原件质量较差且尺寸较小,可适当提高分辨率;反之也可相应减少分辨率,增减的多少以扫描后图像按原尺寸显示后是否清晰为准。
7.3 特殊页面的扫描7.3.1 粘贴页与表格对于粘贴折页,可用大幅面扫描仪扫描,或先分部扫描后拼接;对部分字体很小、字迹密集的情况,可适当提高扫描分辨率,选择灰度扫描或彩色扫描,采用局部深化技术解决;对字迹与表格颜色深度不同的,采用局部淡化技术解决7.3.2 一般文本流程图采用适当的分辨率扫描及局部深化技术,确保文本流程图清晰。
同时采用不同设备满足文本流程图的扫描工作。
7.3.3 插图采用高分辨率灰度或彩色扫描技术将插图与文字一起扫描,保证原来的页面布局和插图清晰。
7.3. 4照片对于页面中有黑白或彩色照片的文件,采用JPEG格式扫描,确保照片清晰度,同时可避免图像存储空间过大。
7.4 文件命名方式7.4.1 建立文件夹扫描时文件夹的建立应按档案实体分级建立,其中的每一份文件也需要单独建立文件夹。
7.4.2 文件夹命名方法,以档案实体中的档号命名,一般为3位数,不足3位数的左边补“0”。
8 数据处理8.1 图像处理8.1.1 纠偏对扫描过程中出现的偏斜图像进行整体纠正,保证数字图像的偏斜角度小于1度。
(图像偏斜不超过页面内半个文字)。
8.1.2 去污去除数字图像中影响可懂度的杂质。
档案数字化图像的去污,应遵循在不影响可懂度的前提下展现原貌的原则。
8.1.2.1 局部去污,如去除黑边、污点。
8.1.2.2 整体去污,可一次性去除页面上的污渍。
8.1.3 拼接为保证档案数字化图像的整体性,对幅面分离的数字图像进行拼接。
8.1.4 校对8.1.4.1 一次校对,检查扫描完的图像质量情况,对不合格的图像进行标记退回重新扫描。
8.1.4.2 纠错处理,根据一次校对中提出的诸如污渍、黑边、偏斜、图像质量等问题,结合《数据加工过程处理单》(见附录A)情况,对每份图像进行相应的处理。
8.1.4.3 二次校对,对一次校对及数据处理后的数字图像再次进行检查,并标记图像处理过程中不清晰的页面。
不合格的退回重新处理。
8.2 数据质量检查8.2.1 文字录入质量对录入域清单上所标明的各著录项的文字录入进行正确率控制,保证错误率低于3‰。
8.2.2 图像质量对纸质文件扫描后形成的图像文件进行清晰度、污渍、黑边、偏斜等问题的控制,以达到要求的图像质量。
保证扫描后的数字图像清晰,便于清楚阅读,适应各种纸张和手写、印刷字的情况。
8.3 数据挂接档案条目数据与图像文件的对应准确程度的控制。
在生成裸数据光盘之前,根据资料整理信息、扫描前的标引信息及卷内文件页号信息核查图像文件总数是否与实际文件数相等,如不相等则不能生成裸数据光盘,可打印出清单,回退给图像处理人员补扫。
8.4 数据检验8.4.1 将裸数据进行验收前的相应处理,包括文件的格式转换、逻辑分盘处理、添加说明性文件。
8.4.2 对数据进行检验,给出合格或不合格结论。
8.4.3 将数字加工后的数据转换为裸数据光盘格式,拷贝到活动硬盘上。
8.4.4 系统应自动记录检验进度。
8.5 数据上载档案数字化各工序的数据通过网络及时上载到数据服务器端汇总,其中数字图像自动搜索对应的目录数据,加入对应的电子地址数字图像文件名,建立起一一对应的关系。
8.6 数据备份定期对服务器的各类数据进行备份,防止数据丢失。
9 信息存储以JPEG数字压缩编码或TIFF国际通用标准格式。
采用国际标准的传真文档压缩格式压缩后,分别按页编号后分页存储。
数字图像的存储管理应保持原纸质档案的保管模式对应存储。
9.1 压缩存储格式档案数字图像格式采用TIFF和JPEG数字压缩编码。
9.1.1 黑白二值图像黑白二值扫描图像文件采用TIFF(CCITT G3)格式二值图像压缩算法,压缩率就绪(Cr)为15:1。
也可采用TIFF(CCIFF G4)格式二值图像压缩算法,压缩率(Cr)为3 O:1。
9.1.2 连续色调静态图像连续色调静态图像采用JPEG数字压缩编码,平均压缩率(cr)为15:1。
9.2 编码方式应尽是采用实时操作性强的编码方式。
失真度编码,用较少的比特率获得较好的图像质量;无失真编码,以低压缩保持信息的不失真。
一般情况下宜采用国际通用编解码算法。
9.3 存储方式与载体可选用在线和离线、不同载体进行存储。
10 检索利用10.1 检索利用方式档案数字图像检索利用可采用单机、局域网和互联网三种方式。
局域网中传输利用,应保证数据在内部局域网10Base?T带宽下,平均1秒内显示响应完成。
互联网中传输利用,互联网56Kbit/s带宽下,平均5秒内显示响应完成。
为此要求一般每页档案数字图像的存储容量为50K以内。
10.2 检索软件配置检索软件应符合国家档案局制定的《档案管理软件功能要求暂行规定》的各项要求。
检索软件应具备目录检索与档案数字图像方便调阅的基本功能。