纸质档案数字化工作技术标准
《纸质档案数字化技术规范》(DAT 31-2005)
《纸质档案数字化技术规范》(DAT 31-2005)《纸质档案数字化技术规范》(DA/T 31-2005)(2008-05-07 12:48:46)(中华人民共和国档案行业标准 DA/T 31-2005,中华人民共和国国家档案局2005年4月30日发布,2005年9月1日起实施)1 范围本标准规定了纸质档案数字化的主要技术要求。
本标准适用于用扫描仪对各种纸质档案的数字化加工处理。
2 规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。
凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。
凡是不注日期的引用文件,其最新版本适用于本标准。
GB,T 17235.1 连续色调静态图像的数字压缩编码T 17235.2 连续色调静态图像的数字压缩编码 GB,GB,T 18894—2002 电子文件归档与管理规范ITU(CCITT)G3 二值图像压缩算法ITU(CCITT)G4 二值图像压缩算法DA,T18—1999 档案著录规则档案管理软件功能要求暂行规定国家档案局档发[2001]6号3 术语和定义下列术语和定义适用于本标准。
3.1数字化 Digitization用计算机技术将模拟图像转换为数字图像的处理过程。
3.2纸质档案数字化Digitization of Paper—Based Records 对普通(黑色字迹清晰)的油印、铅印、胶印等印刷件或复印件纸质档案进行数字化及应用的过程。
3(3数字图像 Digital Image表示景物图像的整数阵列。
一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。
在矩阵(或其他)网络上采样一连续函数,并在采样点上将值最小化后的阵列。
3(4黑白二值图像 Binary Image只有黑白两级灰度的数字图像。
它对应于黑和白的两种状态文字稿、线条图、指纹图等。
中华人民共和国档案行业标准 纸质档案数字化技术规范
2 规 范性 引用文 件
下 列 文 件 中 的条 款 通 过 本 标 准 的 引 用 而 成 为 本 标 准 的条 款 。 凡 是 注 日期 的 引用 文 件 , 随后 所 有 的修 改 其 单 ( 包括 勘 误 的 内容 ) 修 订 版均 不适 用 于 本标 准 , 不 或 然
对 档 案 进 行 数 字 化 转 换 后 ,数 字 罔 像 与 案 原 件 在色彩 、 何等方面的偏离程度。 儿
清 除 图像 冗 余 或 对 图 像 近 似 的 仟 一 种 过 程 ,其 目
的是对 图像 以更 紧凑的形式表示。 纸质档案数字化过程
中 , 常 见的 有 TF ( 4 、 E 等压 缩 格 式 。 较 IF G )J G P
4纸质档 案数 字化 基本 要 求
4 1 本 原 则 .基
纸 质档案数 字化 的基本 原则是使 档案信息 资源准 确、 方便 、 快捷地提供利用 , 使可以公开的档案信息 资源
’
采用扫描 仪或数码相 机等数码设 备对纸质档 案进 行数字化加工 , 将其转化 为存储 在磁带 、 磁盘 、 光盘等载
体 上并 能被 计 算 机 识 别 的 数 字 图 像 或 数 字 文 本 的处 理
过程 。 33 数 字 图 像 d i lm g . i t ae ga i
纸 质 档 案 的数 字 化 ,必 须 符 合 国 家 档 案 开 放 规 定 以
及有关规定 。
3 术语 和定 义
下 列 术 语 和 定 义适 用 于 本 标 准 。
31 数 字 化 d izt n , i tai gi o
用计算 机技 术将模拟 信号转换 为数字信 号的处理 +
过程。
3 纸 质档 案数字化 dg i t n f ae b s crs . 2 it ao pp r ae r od iz i o - de
DAT 31-2005 纸质档案数字化技术规范
纸质档案数字化技术规范DA/T 32-2005(2005年4月30日发布2005年9月1日实施)一、概述国家标准《纸质档案数字化技术规范》DA/T 31—2005是由中国国家档案局颁布的,其批准时间为2005年4月30日,实施时间为2005年9月1日。
该标准共分为十三章。
其中包括范围,规范性引用文件,术语和定义,纸质档案数字化基本要求,档案整理,档案扫描,图像处理,图像存储,目录建库,数据挂接,数据验收,数据备份,数字化成果管理等。
该技术规范的出台结束了我国纸质档案数字化的初探阶段,标志着我国各级档案馆馆藏数字化技术的成熟。
二、主要条款简介第一章范围本标准规定了纸质档案数字化的主要技术要求。
本标准适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。
第二章规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。
凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。
凡是不注日期的引用文件其最新版本适用于本标准。
GB/T 17235.1-1998 信息技术连续色调静态图像的数字压缩及编码第一部分:要求和指南。
GB/T 17235.2-1998 信息技术连续色调静态图像的数字压缩及编码第二部分:一致性测试GB/T 18894-2002 电子文件归档与管理规范。
第三章术语和定义下列术语和定义适用于该标准。
(1)数字化digitization用计算机技术将模拟信号转换为数字信号的处理过程。
(2)纸质档案数字化digitization of paper-based records采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。
(3)数字图像digital image表示实物图像的整数阵列。
一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。
纸质档案数字化技术规范
纸质档案数字化技术规范根据国家档案局2005年4月30日发布的《纸质档案数字化技术规范》,制定本局纸质档案数字化技术规范。
特对图像扫描、图像处理、图像存储作如下说明。
一、图像扫描1、扫描方式a、根据档案幅面的大小选择相应规格的扫描仪或专业扫描仪进行扫描。
大幅面档案可采用专用数码平台进行扫描或者采用图像拼接方式处理。
同一页面有两个以上文件,需分别扫描。
b、纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式以提高工作效率。
2、扫描色彩模式、分辨率及扫描格式扫描色彩模式、分辨率及扫描格式的选择见下表:彩色档案举例:带红头的文书档案。
对清晰度有较高要求的图纸可适当提高分辨率。
二、图像处理图像处理以无限还原档案原貌为标准,注意图像偏斜度、清晰度、失真度、排列顺序等等。
三、图像存储1、图像存储格式黑白原稿:*.tiff;彩色档案、图纸:*.pdf, jpg文件需通过pdf转换器来转换成pdf文件。
转换器可以网上下载。
2、图像文件的命名命名原则:以纸质档案目录数据库为依据,将每一份图像文件命名为档案目录数据库中该份文件的档号。
通过档号的一致性和唯一性,建立起一一对应的关联关系,为实现档案目录数据库与图像文件的批量挂接提供条件。
a、命名格式(一)对立卷改革之前的纸质文书档案进行扫描,其图像文件命名格式由全宗号、目录号、案卷号、顺序号所组成,各字段间用“-”连接,即以xxx-xxx-xxxx-xxxx.tiff(或pdf)表示,数据结构见下表:b、命名格式(二)立卷改革后形成的纸质文书档案的扫描,其图像文件命名由全宗号、年度、保管期限、档案室编件号等四部分组成,各字段间用“-”连接,即以xxx-xxxx-xxxx-xxxx.tiff (或pdf)表示,数据结构见下表:全宗号用三位代码标识,用阿拉伯数字标识某一属类全宗的顺序号。
如“002”表示2号全宗。
年度以四位阿拉伯数字标注公元纪年,如“2002”表示2002年。
最新档案数字化规范标准
最新档案数字化规范标准档案数字化是将传统的纸质档案转换为电子形式,以便于存储、检索和利用。
随着信息化时代的到来,档案数字化已成为档案管理工作的重要组成部分。
以下是最新档案数字化规范标准的具体内容:一、档案数字化的目的与意义档案数字化旨在提高档案的保存质量,延长档案的使用寿命,同时提高档案的利用效率和安全性。
通过数字化,档案可以更易于检索、复制和传播,满足现代社会对信息资源的需求。
二、档案数字化的基本原则1. 完整性:确保数字化过程中档案内容的完整性,不得遗漏任何部分。
2. 准确性:数字化后的档案应与原始档案保持一致,无误读或错误。
3. 可读性:数字化后的档案应清晰易读,便于电子设备上的查看和打印。
4. 安全性:在数字化过程中要确保档案信息的安全,防止数据泄露或损坏。
三、档案数字化的流程1. 档案预处理:包括档案的清洁、修复、分类和排序。
2. 扫描:使用高分辨率扫描仪对档案进行扫描,确保图像质量。
3. 图像处理:对扫描后的图像进行去污、去噪、矫正等处理,提高图像质量。
4. 格式转换:将图像转换为通用的电子格式,如PDF或JPEG。
5. 数据录入:将档案的元数据录入数字化管理系统。
6. 质量检查:对数字化后的档案进行质量检查,确保符合标准。
7. 存储与备份:将数字化档案存储在安全的服务器上,并进行定期备份。
四、档案数字化的技术要求1. 扫描分辨率:彩色档案推荐使用300dpi,黑白档案推荐使用600dpi。
2. 色彩管理:确保扫描过程中色彩的准确性和一致性。
3. 文件格式:推荐使用无损压缩的PDF/A格式,以保证档案的长期保存和兼容性。
4. 元数据标准:遵循国际标准,如Dublin Core或EAD,以便于档案的检索和管理。
五、档案数字化的安全管理1. 访问控制:设置用户权限,确保只有授权人员才能访问数字化档案。
2. 数据加密:对存储的档案数据进行加密处理,防止未授权访问。
3. 备份策略:制定定期备份计划,确保档案数据的安全和可恢复性。
纸质档案数字化规范
纸质档案数字化规范
一、总体要求
1、纸质档案数字化必须贯彻落实“以人为本”的方针,尊重用户权益
实现信息共享。
2、纸质档案数字化的内容应充分反映历史价值、文化传承,合理应用
信息技术,实现信息资源的统一集成,确保信息安全与完整性。
二、技术标准
1、采用图像处理技术,对纸质档案进行拍摄和扫描,根据记录需求,
把纸质档案图像、音频、视频数据处理成图像格式、文本格式、文档
格式进行存储。
2、要求文件格式和质量达到标准,采用TIFF带压缩格式保存,便于
存储、检索和调阅,合理利用格式的优势,强化档案的管理、查阅等。
3、利用数据库技术、信息检索技术、图像检索技术等技术,帮助档案
馆实现档案资源的有效管理和识别与应用,优化档案管理能力。
三、管理规范
1、纸质档案数字化时必须完成鉴定,确定档案类别和合法性,保证清晰、完整的档案信息。
2、将原有的档案索引体系迁移至电子文档管理系统,以实现档案的集中、统一、有序管理,保证信息的安全。
3、对档案数字化过程,应记录处理环节,对每一步处理做出核实,并
记录正确性和完整性。
4、定期进行档案数字化管理培训和质量测试,保证档案数字化工作质量。
纸质档案数字化技术规范标准
字化加工,将其转化为存储在磁带、磁盘、光盘等载体上
并能被计算机识别的数字图像或数字文本的处理过程。
•
3·3数字图像digital image
•
表示实物图像的整数阵列。一个二维或更高维的采样
并量化的函数,由相同维数的连续图像产生。在矩阵(或
其他)网络上采样——连续函数,并在采样点上将值最小
化后的阵列。
知识回顾 Knowledge Review
放映结束 感谢各位的批评指导!
谢 谢!
让我们共同进步
9 目录建库
• 9·1数据格式选择
•
目录建库应选择通用的数据格式。所选定的数据格式
应能直接或间接通过XML文档进行数据交换。
• 9·2档案著录
•
按照《档案著录规则》(DA/T18)的要求进行著录,建
立档案目录数据库。
• 9·3目录数据质量检查
•
采用人工校对或软件自动校对的方式,对目录数据库
的建库质量进行检查。核对著录项目是否完整、著录内容
• 破损严重、无法直接进行扫描的档案, 应先进行技术修复,折皱不平影响扫描质 量的原件应先进行相应处理(压平或烫平等) 后再进行扫描。
• 5·5档案整理登记
• 制作并填写纸质档案数字化加工过程 交接登记表单,详细记录档案整理后每份 文件的起始页号和页数。
• 5·6装订
• 扫描工作完成后,拆除过装订物的档 案应按档案保管的要求重新装订。恢复装 订时,应注意保持档案的排列顺序不变, 做到安全、准确、无遗漏。
•
7·1·1对图像偏斜度、清晰度、失真度等进行检查。
发现不符合图像质量要求时,应重新进行图像的处理。
•
7·1·2由于操作不当,造成扫描的图像文件不完整或
纸质档案数字化基本流程与技术要求内容
纸质档案数字化基本流程及技术要求纸质档案数字化的基本环节主要包括:档案整理、档案扫描、图像处理、图像存储、目录建库、数据挂接、数据验收、数据备份等。
具体流程如下:(一)档案整理在扫描之前,根据档案管理情况,按下述步骤对档案进行适当整理,并视需要作出标识,确保档案数字化质量。
1、目录数据准备按照《档案著录规则》(DA/T18)等的要求,规范档案中的目录内容。
包括确定档案目录的著录项、字段长度和内容要求。
如有错误或不规范的案卷题名、文件名、责任者、起止页号和页数等,应进行修改。
(详见附件)2、拆除装订在不去除装订物情况下,影响扫描工作进行的档案,应拆除装订物;将档案原件的装订线拆除,排好顺序,不得出现任何漏缺页及顺序差错,更不能对档案原件有任何损坏。
3、区分扫描件和非扫描件按要求把同一案卷中的扫描件和非扫描件区分开。
普发性文件区分的原则是:无关的重份的文件要剔除,有正式件的文件可以不扫描原稿。
4、页面修整对破损严重、无法直接进行扫描的档案,应先进行技术修复、裱糊;折皱不平影响扫描质量的原件应先进行相应处理(压平或烫平等)后再进行扫描。
5、档案整理登记制作并填写纸质档案数字化加工过程登记表,详细记录档案整理后每份文件的起始页号和页数。
(二)档案扫描1、扫描方式(扫描前必须准备一台专业的高速扫描仪,并带平板)根据档案幅面的大小(A4、A3、AO等)选择相应规格的扫描仪或专业担描仪,如工程图纸可采用0号图纸扫描仪进行扫描。
普通A4纸质文件,采用高速扫描仪的自动进纸方式扫描;纸质过薄、透明的(如信纸、便签纸)采用高速扫描仪的平板扫描;纸质过厚、照片等档案采用高速扫描仪的平板扫描;对文件页面贴有附属小页面、纸张时,将大小页面单独在平板中扫描;2、扫描模式(纸质档案扫描一般采用黑白、灰度和彩色三种模式)页面为黑白两色,字迹清晰的、不带图片的档案材料,采用黑白方式;页面为黑白两色,清晰度较差或者带有图片的档案材料,以及页面多为彩色文字的档案,采用彩色或灰度模式(因情况而定);页面中有红头、印章或插有黑白照片、彩色照片、彩色插图的档案,采用彩色模式扫描。
江西纸质档案数字化管理与技术规范
江西省纸质档案数字化管理与技术规范为规范我省纸质档案数字化工作,保障纸质档案数字副本凭证效力,维护档案实体与档案信息安全,根据《中华人民共和国档案法》以及《文献档案资料数字化工作导则》(GB/T20530-2006)、《纸质档案数字化技术规范》(DA/T31-2005)、《信息与文献—文件档案数字化实施指南》(ISO/TR 13028:2010(E))等相关标准,制定本规范。
1 范围本规范规定了纸质档案源版数字副本制作的各项要求,源版数字副本的衍生品制作可参照执行。
本规范所称纸质档案数字副本是源版数字副本及其衍生品的统称。
源版数字副本是指使用扫描仪等数字成像设备对纸质档案进行数字化转换而直接生成的静态图像文件。
对源版数字副本进行压缩、格式转换、识别等处理而生成的静态图像文件、版式文件或纯文本文件等,为源版数字副本的衍生品。
本规范适用于各级国家综合档案馆对馆(室)藏纸质档案进行批量数字化转换,可作为编制数字化工作方案的依据。
机关、团体、企业事业单位纸质档案(含纸质照片档案)的数字化可参照执行。
2 基本原则2.1统筹规划,分步实施应根据馆藏档案重要程度、破损情况、利用需求等,进行统筹规划、分步实施数字化。
馆藏国家重点档案、重要全宗档案和涉及民生的专业档案优先进行数字化。
2.2保障凭证作用,维护档案安全为保证纸质档案数字副本是档案原件真实、完整、可靠与可用的复制件,必须在纸质档案数字化过程中实施全程安全管理。
应建立安全管理措施,对数字化对象实行审批制,数字副本的制作应符合相关标准的要求,采用适合的数字化技术,执行规定的质量控制程序,准确复制档案原件,并捕获必要的数字化元数据。
数字副本制作各环节应有当事责任人的签字,数字化成果按规范要求移交,确保档案原件与档案信息安全。
对进行数字化的档案原件,在拆装、整理、修复等过程中,应遵循最小干预、保持原貌以及适宜性、相似性与可逆性原则,最大限度减少数字化转换对档案原件可能造成的损伤或形制变化。
纸质档案数字化工作流程与规范要求
确定数字化对象与制定总体方案
(四)工作流程控制 制定的工作流程和各环节操作规范等,可对数字化全过程进行有效的控 制。比如,及时对档案扫描、图像处理等各个环节产生的工作数据进行备份; 应建立完善的问题反馈机制,对纸质档案数字化工作过程中发现的问题及时 进行反馈和完善,确保数字化成果质量。 (五)管理制度 要求从岗位管理、人员管理、场地管理、设备管理、数据管理等方面制 定科学、规范的管理制度,并在数字化工作过程中严格执行,以便使纸质档 案数字化工作质量和档案安全得以有效保障。 岗位管理制度主要规定数字化工作各岗位的目标和职责,形成明确的岗 位业务流程规范、考核标准、奖惩办法等;人员管理制度主要对人员的安全 保密、日常行为、外聘人员信息审核及管理、非工作人员来访登记等进行规 范;场地管理制度主要对工作场地内基础设施及环境、网络、监控设施、现 场物品及证件等的管理进行规范;设备管理制度主要对数字化工作各环节涉 及的全部设备的管理进行规范,确保设备安全、科学、高效运行;数据管理 制度主要对数字化各环节所产生的数据的管理进行规范。
纸质档案数字化工作流程 与规范要求
纸质档案数字化的概念
采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转 化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字 文本的处理过程(DAT/31-2005)。
采用扫描仪等设备对纸质档案进行数字化加工,使其转化为存储在磁带、 磁盘、光盘等载体上的数字图像,并按照纸质档案的内在联系,建立起目录 数据与数字图像关联关系的处理过程。
2005年
2015年
2017年
(DA/T31-2005)
国家档案局出台了《纸质 档案数字化技术规范》( DA/T31-2005)
(征求意见稿)
档案数字化技术标准
档案数字化技术标准对于纸质档案利用扫描仪或数码相机转换成可储存在电脑上或刻成光盘,便于保存及查阅的,称之为档案数字化。
进行档案数字化加工步骤有:整理(弱化)、一次校对、扫描、扫描件校对、装订、目录数据录入及修改、挂接。
一、整理(弱化)。
在扫描之前,对需扫描的档案进行整理,整理时有以下环节应注意:1、拆卷。
将装订成本的档案逐一拆开,为了更好的延长扫描仪的寿命,防止高速扫描时会卡纸的情况,拆卷时应注意:如发现有金属物(钉书针、大头针等)应剃除。
2、顺序号。
根据文件的相关内容进行编码和排序,按照文件的合理排列,要求一份文件对应一条目录,一条目录对应一个顺序号,一条目录中如有几个文件,其中有重要的不属于该目录文件附件的文件,需在目录页的最后加写目录,顺序号应附属在该卷档案的最后一条,页码按文件实际所在页次编写。
凡目录有增减,顺序号必须依次进行调整。
3、页号。
档案常常会有漏编、跳号的情况。
对于漏编如:P7与P8之间有四页未编码,则应依次编为“7-1”、“7-2”、“7-3”、“7-4”,若空号为一份文件的首页,则将该页编为正码,其它依次编为副码,如:P7与P8之间有一页未编码,而该页正好是P8所在文件的首页,则将该页码编为“8”,而原P8编为“8-1”。
出现跳号,若前后两张文件内容完整且连贯,而第一页和第二页分别编码为“1”和“4”,则需在错误登记表和目录备注处注明“P2、P3为跳号”的字样。
若有内容的文件反面漏打页码,需加编副码;若反面是文件首页,则需编正码,原来的正码改为副码,依次类推。
如果空白纸上有编码,需在目录备注中注明“第X页为空白页,无内容”。
文件的最后一页必须是正码,不能编副码。
如两张文件粘贴重叠而只编了一个页码的,应在被覆盖的上面编副码。
正、反面均有内容的文件,若其中一面需扫描的内容被折叠装订,该面应增加一个副码。
凡页码写在折叠后文件反面的,应展开文件写上相同的页码,必须保证文件页码在扫描的图片上。
档案数字化国家标准
档案数字化国家标准档案数字化是指利用信息技术手段对档案进行数字化处理,将档案内容以数字形式保存、管理和利用的过程。
随着信息技术的快速发展,档案数字化已成为档案管理和保护的重要手段。
为了规范档案数字化工作,提高档案数字化质量,我国制定了档案数字化国家标准,以指导和规范档案数字化工作的开展。
首先,档案数字化国家标准明确了档案数字化的基本原则和要求。
其中包括了对档案数字化过程中的保真性、可信度、可持续性等方面的要求。
保真性要求数字化档案的内容、结构和特征应当与原始档案完全一致,不得作任何形式的篡改或损毁;可信度要求数字化档案应当具有可信的认证和可追溯性,确保其内容和形式的真实性和可靠性;可持续性要求数字化档案的保存周期应当与原始档案相适应,保证其长期保存和可持续利用。
其次,档案数字化国家标准规定了档案数字化的技术要求和规范。
在数字化档案的采集、处理、存储、检索和传输等环节,应当采用符合国家标准的技术手段和设备,确保数字化档案的质量和安全。
此外,还明确了数字化档案的格式要求、元数据标准、安全备份和恢复机制等方面的规范,为数字化档案的管理和利用提供了技术支撑和保障。
再次,档案数字化国家标准规定了档案数字化的管理要求和流程。
对于档案数字化的组织、计划、实施、监督和评估等环节,应当建立健全的管理体系和流程,明确各方责任和权限,确保数字化档案工作的有序开展和持续改进。
此外,还规定了数字化档案的质量控制和风险管理要求,为数字化档案的管理提供了指导和支持。
最后,档案数字化国家标准明确了档案数字化工作的监督和评估机制。
各级档案管理部门应当建立档案数字化工作的监督和评估机制,对数字化档案的质量和效果进行定期检查和评估,及时发现和解决问题,不断提高数字化档案工作的水平和质量。
总之,档案数字化国家标准的制定和实施,为我国档案数字化工作提供了科学、规范的指导和保障,有利于提高档案数字化工作的质量和效益,推动档案事业的发展和进步。
档案数字化加工标准
档案数字化加工标准档案数字化加工是指将纸质档案通过扫描、图像处理、文字识别等技术手段转化为数字化的电子档案的过程。
数字化档案具有保存空间大、检索方便、传输快捷等优点,已经成为档案管理的重要手段。
为了保证数字化档案的质量和可持续利用,制定档案数字化加工标准显得尤为重要。
一、扫描质量标准。
1. 扫描分辨率,对于文字类档案,扫描分辨率应不低于300dpi;对于图片类档案,扫描分辨率应不低于600dpi,以保证数字化效果清晰。
2. 扫描色彩模式,文字类档案应采用灰度扫描模式,图片类档案应采用彩色扫描模式,以保证原件色彩的还原。
3. 扫描格式,扫描后的档案应保存为常见的图片格式,如JPEG、TIFF等,以便于不同系统的查看和使用。
二、图像处理标准。
1. 图像裁剪,对于扫描后的图片类档案,应进行适当的裁剪处理,去除多余的边框和空白部分,保留有效信息。
2. 图像修复,对于受损的纸质档案,应进行适当的图像修复,去除污渍、折痕等影响阅读的瑕疵,提高数字化效果。
3. 文字识别,对于文字类档案,应进行文字识别处理,将扫描后的图片转化为可编辑的文字格式,以便于后续的检索和利用。
三、元数据标准。
1. 文件命名规范,对于数字化档案,应按照一定的命名规范进行命名,包括档案名称、日期、编号等信息,以便于管理和检索。
2. 元数据填写,对于每个数字化档案,应填写相应的元数据信息,包括档案来源、作者、关键词、摘要等,以便于后续的管理和利用。
四、存储和传输标准。
1. 存储格式,数字化档案应按照一定的存储格式进行保存,包括本地存储和云端存储,以保证档案的安全性和可持续性利用。
2. 传输加密,在数字化档案的传输过程中,应采取加密措施,保护档案的安全性,防止信息泄露和篡改。
五、质量控制标准。
1. 质量抽查,对于数字化档案加工过程中,应进行定期的质量抽查,确保数字化效果符合标准要求。
2. 效果评估,对于数字化档案的效果,应进行定期的评估和反馈,及时调整和改进加工流程,提高数字化质量。
纸质档案数字化的基本流程及技术要求
纸质档案数字化的基本流程及技术要求一、概述档案是人类社会实践活动的真实记录,是党和国家宝贵的历史文化财富。
这些具有查考凭证作用、依据作用和参考作用的档案,是人们从事科研、生产等工作的必要条件和有力工具。
档案也是各企事业单位运作各个环节的真实记录,是极其珍贵的原始资料和重要的信息资源。
准确、系统、完整的档案是单位工作的重要参考资料,是社会的重要财富。
随着计算机技术、扫描技术、OCR技术、数字摄影技术(录音、录像)、数据库技术、多媒体技术、存储技术的发展而产生的一种新型档案信息形态,它把各种载体的档案资源转化为数字化的档案信息,以数字化的形式存储,网络化的形式互相连接,利用计算机系统进行管理,形成一个有序结构的档案信息库,及时提供利用,实现资源共享。
档案数字化是数字档案建设最基础的工作,传统载体的档案经高科技技术加工成数字档案形式,通过局域网、政务网、互联网进行计算机检索、阅读电子档案,为迎接档案信息服务新环境的挑战,提高管理水平、提高效率,增强档案业务部门的服务水平,为档案内部管理及面向客户服务提供高效率的全面服务。
档案作为一种原生信息资源,其重要性正日益凸显出来,逐步掌握信息技术为档案工作服务,为社会主义经济建设服务,为社会主义精神文明建设服务。
二、基本原则纸质档案数字化的基本原则是使档案信息资源准确方便快捷地提供利用,使可以公开的档案信息资源得到共享,以满足社会对档案利用的需求。
属于归档范围且应永久或长期保存的、社会利用价值高的档案可列入数字化加工的范围,并按照《中华人民共和国行业标准(DA/T31—2005)纸质档案数字化技术规范》对纸质档案进行数字化。
根据档案幅面的大小(如A4、A3、A0等)选择相应规格的扫描仪或专业扫描仪,如工程图纸采用0号图纸扫描仪进行扫描。
纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式以提高工作效率。
扫描过程中,确保不对档案原件造成破坏,保证档案扫描图像与原件一致、整洁、清晰。
纸质档案数字化验收标准
纸质档案数字化验收标准一、扫描质量1.1分辨率:确保扫描的分辨率满足档案数字化的需求,一般应达到200dpi或以上。
1.2色彩:确保扫描的档案色彩准确,无明显色差。
1.3清晰度:扫描后的图像应清晰,无模糊、失真现象。
1.4倾斜与抖动:扫描过程中应保持档案平放,无明显倾斜与抖动。
二、数字处理2.1色彩调整:对扫描后的图像进行色彩调整,以使其更接近原档案的色彩。
2.2去噪与拼接:去除扫描过程中产生的噪点,对于大型文档应进行拼接处理。
2.3裁剪与旋转:对扫描后的图像进行裁剪和旋转,以纠正方向和位置。
三、数据存储3.1格式:数字化后的数据应采用通用的、非专有的文件格式进行存储,如TIFF或PDF。
3.2压缩:对于大型文件,应采用适当的压缩技术以减小存储空间占用。
3.3备份:数字化数据应定期备份,以防数据丢失。
四、安全性4.1访问控制:确保数字化数据只能由授权人员访问。
4.2加密:对数字化数据进行加密处理,以防数据泄露。
4.3防篡改:采取措施防止数字化数据被篡改。
五、完整性5.1校验:对数字化数据进行校验,以确保数据的完整性。
5.2元数据:确保数字化数据相关的元数据完整、准确。
5.3索引:建立数字化数据的索引,以便快速查找和检索。
六、元数据6.1内容描述:对数字化档案的内容进行详细描述。
6.2来源与创建日期:记录数字化档案的来源和创建日期。
6.3使用权限与限制:对数字化档案的使用权限进行定义和限制。
6.4关联信息:记录与数字化档案相关的其他信息,如相关文档、项目等。
七、验收测试7.1功能测试:测试数字化档案的基本功能,如打开、浏览、搜索等。
7.2兼容性测试:测试数字化档案在不同操作系统、浏览器和软件中的兼容性。
7.3数据完整性测试:测试数字化档案的数据是否完整、准确。
7.4安全性能测试:测试数字化档案的安全性能,如防篡改、防病毒等。
八、文档管理8.1文档分类:对数字化档案进行分类管理,以便于查找和使用。
8.2文档编号:为每个数字化档案分配唯一的编号,以便识别和管理。
纸质档案数字化技术标准样本
纸质档案数字化技术原则1范畴本原则规定了纸质档案数字化重要技术规定。
本原则合用于采用各种设备对纸质档案数字化加工解决及数字化成果管理。
2规范性引用文献下列文献中条款通过本原则引用而成为本原则条款。
凡是注日期引用文献,其随后所有修改单(不涉及勘误内容)或修订版均不合用于本原则,然而,勉励依照本原则达到合同各方研究与否可使用这些文献最新版本。
凡是不注日期引用文献,其最新版本合用于本原则。
GB/T 17235 .1-1998信息技术持续色调静态图像数字压缩及编码第1某些:规定和指南GB/T 17235.2-1998信息技术持续色调静态图像数字压缩及编码第2某些:一致性测试GB/T 18894 - 电子文献归档与管理规范3术语和定义下列术语和定义合用于本原则。
3.1数字化用计算机技术将模仿信号转换为数字信号解决过程3.2纸质档案数字化采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机辨认数字图像或数字文本解决过程。
3.3数字图像表达实物图像整数阵列。
一种二维或更高维采样并量化函数,由相似维数持续图像产生。
在矩阵(或其她)网络上采样——持续函数,并在采样点上将值最小化后阵列。
3.4黑白二值图像只有黑白两级灰度数字图像。
它相应于黑白两种状态文字稿、线条图等。
3.5持续色调静态图像以多于两级灰度不同浓淡层次或以不同颜色通道组合成静态数字图像。
在纸质档案数字化过程中,普通体现为灰度扫描和彩色扫描两种模式。
3.6辨别率单位长度内图像包括点数或像素数,普通用每英寸点数( dpi)表达。
3.7失真度对档案进行数字化转换后,数字图像与档案原件在色彩、几何等方面偏离限度。
3.8可懂度数字图像向人或机器提供信息能力。
3.9图像压缩清除图像冗余或对图像近似任一种过程,其目是对图像以更紧凑形式表达。
纸质档案数字化过程中,较常用有TIFF (G4)、JPEG等压缩格式。
4纸质档案数字化基本规定4.1基本原则纸质档案数字化基本原则是使档案信息资源精确、以便、快捷地提供运用,使可以开档案信息资源得到共享,以满足社会对档案运用需求。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
纸质档案数字化工作技术标准
1、档案前处理要求:
1)应对拟数字化的档案进行涉密性、完整性、有序性及档案实体与目录的一致性检查。
档案实体破损、残缺的要进行登记,征求同意后对破损、残缺档案进行裱糊抢救,目录错误的要予以修正,无数字化目录的要予以著录。
如果该档案为涉密档案,则不进行全文扫描,并予以标记。
2)扫描前,对档案进行拆卷并整理,对不平整的档案进行平整处理,对错误、漏编的页号进行修正或补编页号。
扫描结束,档案需进行恢复性、规范性整理装订。
拆卷和装订不能损害档案原件。
拆卷时不允许裁切档案纸张,装订时应尽量按原有顺序原孔装订,案卷不掉页,右边和底边整齐,左侧不及装订线的要加装订边。
2、档案整理要求
具体整理方法参照《机关档案业务建设规范》、《归档文件整理规范》。
档案整理的归档范围和保管期限参照国家档案局第8号令《机关文件材料归档范围和文书档案保管期限规定》。
具体任务包括:区分归档年度、鉴定保管期限、剔除重份文件、组卷、编写页码、打印目录、打印封面、打印备考表、盖归档章、填写档号项、装订、装盒、填写背脊、入库、上架等,具体以业务性标准规范标为准。
3、档案著录要求
(1)、需符合国家档案局发布的《纸质档案数字化技术规范》、《档案著录规则》和安徽省档案局发布的《文书档案文件级目录数据库结构与著录细则》在数字化加工方面的相关规定,并按太和县档案局要求,将档案数据著录进太和县档案局档案管理软件系统中。
著录的档案信息要求准确无错别字、符号正确、题名完整通顺、无缺项,对传统方法整理的档案案卷题名、会议记录类档案、无明确题名的通知等需总结完整通顺,符合著录规则,对不完整的题名需要按照要求自拟题名。
(2)、卷内目录需与案卷目录对应,按要求进行录入,并进行校对,确保准确,著录完成后按太和县档案局要求打印相应目录。
(3)、著录时,在文件、会议记录或其他档案材料中如遇到有人员职务任免、离退休、工资福利、关系调动、奖励处罚等的人名需要全部著录到人名项中。
4、扫描和图像处理要求:
1)扫描时应根据纸质档案的材质选择相应的扫描设备和扫描方式,避免纸张褶皱、撕裂、破损等情况的发生,保证档案不受损。
2)对纸张脆化、较古老、超薄的和不可拆卷的档案需要采用专业不拆卷非接触冷光源扫描仪进行扫描。
3)档案扫描图像色彩模式采用24位真彩式,采用TIFF格式存储,按照统一标准对图像文件命名,以目录数据库内该文件档号对扫描图像进行分文件夹命名,标准以太和县档案馆提供的技术标准为准。
A4纸张大小档案扫描的原始图像文件和修图后的图像文件,必须是TIFF格式,采取适当比例压缩,图像文件容量大小控制在500KB至1MB,A3纸张大小的图像文件控制在500KB至2MB。
特殊情况最大不超过5M。
压缩后的图像文件应清晰、完整,颜色无异常,放大100%比例时图像不失真、无锯齿点。
4)扫描分辨率一般为300dpi,对于案卷中出现字迹较小、较密集、贴有照片以及珍贵档案等情况,分辨率提高到600dpi。
扫描后的图像应清晰、不失真、完整、不影响图像的利用效果和打印后的效果,扫描图像的打印效果不能低于对应的复印效果。
5)对于档案中的“筒子页”,一般应平摊开后进行整幅扫描。
大幅页面可分页扫描后,拼接成一页。
6)扫描时应认真核对实际扫描页码、页数与前处理时填写的页码、页数是否一致,不一致时应注明具体原因和处理方法。
扫描时要保证放纸端正、不压边、不漏扫、错扫,严格确保图像质量,漏扫、压边的要及时补全、补正。
图像顺序要与原档案中页码顺序一致,不可颠倒错乱,不可出现多页、重复页或漏页现象。
7)图像处理后保证图像信息与原档案内容完全一致,不删除页面任何有用信息,包括正文内容、页眉、页脚、手写注释和印鉴等,不裁切纸张部分。
扫描的页面内容基本居中显示,不出现明显偏左或偏右现象。
不准出现页面内容残缺或将其它页面信息扫入本页的现象。
8)图像处理后左右偏斜度控制在2度以内,视觉上基本无偏差。
对方向不正确的图像进行旋转还原,以符合阅读习惯。
9)对图像页面中出现的影响图像质量的杂质如黑点、黑线、黑框、黑边等应进行去污处理。
对图像页面中出现的装订孔、装订洞等应进行技术处理,给予补全,保持和档案原件一致。
残缺页、破损页需用相应大小白纸裱糊后方可进行扫描。
处理过程中应遵循在不影响可读性和可理解性的前提下展现档案原貌的原则,由于档案本身因陈旧、破损或不洁等造成页面上有污点的,如果在页面视图下无法看清,或该污点嵌在文本行中无法清除,可不予清除。
10)保证扫描图像字迹清晰、颜色恰当,不宜过浅或过深,不出现字迹笔画残缺或字迹笔画叠合而
影响阅读的情况。
档案原件存在斑迹变质、颜色过浅、过深或深浅不一致时,保证档案原件能辨认的扫描图像也必须可以辨认。
纸张太薄或字体颜色过浓,扫描时倒映反面文字,文字上的污点无法去污时,采取措施保证正文文字可以看清楚。
11)同一份文件如果纸张大小一致,扫描后的图像大小也需要基本保持一致,合并成PDF文件后,不允许出现明显宽度、高度偏差。
同一份文件,如果纸质档案材质基本一样,扫描后的图片明暗度、色泽也需要基本保持一致。
同一份文件原则上采取同一型号同样设置扫描仪进行扫描,如遇特殊情况,需要高扫、平板同时扫描,也需要保持扫描图像分辨率、亮度、大小尺寸等一致。