南京中医药大学档案馆纸质档案数字化技术规范
《纸质档案数字化技术规范》(DAT 31-2005)
《纸质档案数字化技术规范》(DAT 31-2005)《纸质档案数字化技术规范》(DA/T 31-2005)(2008-05-07 12:48:46)(中华人民共和国档案行业标准 DA/T 31-2005,中华人民共和国国家档案局2005年4月30日发布,2005年9月1日起实施)1 范围本标准规定了纸质档案数字化的主要技术要求。
本标准适用于用扫描仪对各种纸质档案的数字化加工处理。
2 规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。
凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。
凡是不注日期的引用文件,其最新版本适用于本标准。
GB,T 17235.1 连续色调静态图像的数字压缩编码T 17235.2 连续色调静态图像的数字压缩编码 GB,GB,T 18894—2002 电子文件归档与管理规范ITU(CCITT)G3 二值图像压缩算法ITU(CCITT)G4 二值图像压缩算法DA,T18—1999 档案著录规则档案管理软件功能要求暂行规定国家档案局档发[2001]6号3 术语和定义下列术语和定义适用于本标准。
3.1数字化 Digitization用计算机技术将模拟图像转换为数字图像的处理过程。
3.2纸质档案数字化Digitization of Paper—Based Records 对普通(黑色字迹清晰)的油印、铅印、胶印等印刷件或复印件纸质档案进行数字化及应用的过程。
3(3数字图像 Digital Image表示景物图像的整数阵列。
一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。
在矩阵(或其他)网络上采样一连续函数,并在采样点上将值最小化后的阵列。
3(4黑白二值图像 Binary Image只有黑白两级灰度的数字图像。
它对应于黑和白的两种状态文字稿、线条图、指纹图等。
纸质档案数字化工作流程与规范要求
档案资料保护 档案基础查询 档案全文检索 构建知识服务系 统
档案数据挖掘
总体架构示意图
元数据 人物 时间 地点 事件 特点
展示 关联 网络 地图
文本 数据
挖掘算法
本体
民间传说中,唐末,天下大乱,各路英雄争雄,逐鹿于中原。黄巢农民起 义异军突起,天秸元年(904)八月,朱全忠杀唐昭宗,第二年唐昭宗的遗腹子李 昌翼出生,在徽州婺源考水被一个叫胡三的人收为义子,改姓胡。昌翼长大后, 于五代后唐同光三年(925)中明经科及第,故其后裔称明经胡氏,因其是李姓后 裔,明经胡氏忌与李氏通婚。明经胡氏人才辈出,最著名的有二支,即宋元时 期的婺源胡炳文家族和近代绩溪胡适、胡雪岩家族。
数据检 查及整 理挂接
数字化 成果接 收
归档数 据管理
电 子 档 案 发 布 利 用
电子文 件采集
生成电 子档案
数据检 查及整 理
实时归 档
归档数 据管理
档案数 据鉴定
发布利 用
数据挖 掘
(在线/离线)
数据分 级存储 管理
数据安 全防护
6
馆(室)藏档案数字化工作是数字档案馆(室)资源体系建设的重要手段 和方式,国家档案局对档案数字化工作十分重视。 2002年 国家档案局中央档案馆关于印发《全国档案信息化建设实施纲要》 (档发【2002】8号)的通知中要求各地综合档案馆在“十五”期间以档案信 息资源建设为核心,以扩大档案信息资源开发利用为目标,加强档案目录数据 库建设,积极推进档案全文数据库和多媒体数据库建设,以现实需要为前提, 分阶段、分步骤实施档案数字化进程。 2010年 国家档案局印发《数字档案馆建设指南》,指出传统载体档案数字 化是现阶段数字档案资源建设的一个重要途径。应当统筹规划,分步实施。 应当通过数字化工作,对馆藏档案进行全面的梳理。如果对馆藏档案无法一次 性全面数字化,可以按照特殊载体优先、重要程度优先、共享性强优先等原则 分布实施。 2013年10月 时任国家档案局局长杨冬权在全国数字档案馆(室)建设推 进会上的讲话,要求数字档案馆(室)建设的首要任务,就是要把纸质档案、 音像档案等传统载体的档案数字化。不完成这项任务,档案馆(室)就不能实 现转型升级,就必然要在大数据时代落伍,就肯定不能跨进现代化的门槛。
浅谈纸质档案数字化技术规范及归档要求
浅谈纸质档案数字化技术规范及归档要求摘要:随着社会的不断发展,档案管理模式发生了空前改变,目前我国各个行业为了提高档案管理的可靠性,经常采取纸质档案数字化技术。
而且,保证纸质档案数字化技术顺利实施的关键在于全面落实技术规范和归档要求,减少纸质档案数字化管理过程中出现的问题。
本文主要分析纸质档案数字化技术规范和档案归档过程中出现的问题,并据此提出相应规范要求,借以保证纸质档案数字化得到更好的发展。
关键词:纸质档案;数字化技术;规范要求引言为了保证纸质档案数字化技术全面实施,我国在2005年时颁布《纸质档案数字化技术规范》,该项规范要求纸质档案数字化技术在实施过程中遵循相关行业整体性质,并对数字化技术制定规范性指导,确保数字化技术在纸质档案管理中心有更加广泛的应用。
一、确定纸质档案数字化对象的价值原则一般来说,各个行业内部的档案在进行归档处理的过程中,都要遵循档案永久保管原则,并对社会利用价值高的档案实施数字化技术。
另外,不同行业的档案保管制度也存在差异,因此,保证纸质档案保管合理性的关键在于档案管理人员对本单位行业性质有所了解。
在这个过程中,应对档案数字化工程量、人力物力财力和档案保管周期等方面进行深入分析,按照纸质档案的利用率、原始状况好坏制定数字化加工顺序。
二、纸质档案数字化技术规范及归档现状数字化技术能够有效提升纸质档案管理力度,但是纸质档案数字化技术本身就是一项周期长、操作复杂的任务,因此,在实施纸质档案数字化技术时,需要分步实施这项技术,保证数字化技术在纸质档案管理过程中发挥自身最大的作用。
目前我国制定的相应管理规范能够从一定角度上实现纸质档案数字化技术的安全性和稳定性。
对于纸质档案材料可以采取扫描等方式进行字符识别,与此同时将扫描的字符转换成图形文件,并将图形文件储存在计算机中。
但是我国目前实施的纸质档案数字化技术还有些不足,主要表现在三个方面:(一)数字化标准缺失尽管在实施纸质档案数字化技术时有相应技术指导的参与,但是由于纸质档案管理的规范程度较低,导致纸质档案数字化技术不能有效落实。
纸质档案数字化规范
纸质档案数字化规范DA/T31—2017前言本标准按照GB/T 给出的规则起草。
本标准替代DA/T 31-2005《纸质档案数字化技术规范》。
本标准与DA/T 31-2005相比,主要技术变化如下:——标题进行了修改;——增强组织与管理部分的内容,完善数字化工作中管理相关要求;——增强数字化前处理部分的内容,包括对实体档案保护和档案规范化管理方面的要求;——增加数字化过程中元数据采集的要求;——修改了档案扫描部分参数要求;——修改了图像处理部分内容,更加强调保持档案原貌的要求;——细化了数字化成果验收的内容;——删除原标准数据备份和数字化成果管理相关内容。
本标准由国家档案局提出并归口。
本标准起草单位:国家档案局档案科学技术研究所、国家档案局信息管理中心、国家档案局技术部。
本标准主要起草人:王良城、马淑桂、郝晨辉、程春雨、杜琳琳、蔡伟、宋涌、王大众、田军、曹燕、李华峰。
本标准所代替标准的历次版本发布情况为:——DA/T 31—2005。
引言DA/T 31-2005的发布实施,从技术标准方面对纸质档案数字化工作提出了要求,很好的促进了纸质档案数字化工作向科学化、规范化的方向发展,在档案信息化工作中发挥了重要作用。
由于纸质档案数字化工作所依赖的信息技术发展迅速,经过10年的时间,数字化设备、存储、网络等技术条件都发生了较大变化,同时,纸质档案数字化工作管理方法和管理理念等都在不断更新、发展。
因此,及时对本标准进行修订,适时调整相关要求,从档案行业层面科学规范纸质档案数字化工作,具有重要的现实意义。
标准本次修订更加注重我国纸质档案数字化工作自身的特点,结合目前信息技术发展的水平,提出适用于档案行业的纸质档案数字化工作的规范性要求。
纸质档案数字化规范1 范围本标准规定了纸质档案数字化技术和管理要求。
本标准适用于采用扫描设备对纸质档案的数字化加工过程的管理。
2 规范性引用文件下列文件对于本文件的应用是必不可少的。
纸质档案数字化规范DA
目录前言 ......................................................................................................................4.引言 ......................................................................................................................6.纸质档案数字化规范 ....................................................................................................7.1 范围 ........................................................................................................................7.2 规范性引用文件 ......................................................................................................7.3 术语和定义 .............................................................................................................7.4 总则........................................................................................................................................... 8.5 .组织与管理............................................................................................................................. 9.5.1 机构及人员.................................................................................................................. 9.5.2 基础设施.................................................................................................................... 1.05.3 工作方案.................................................................................................................... 1.05.4 管理制度.................................................................................................................... 1.15.5 工作流程控制............................................................................................................ 1.25.6 工作文件管理............................................................................................................ 1.25.7 档案数字化外包....................................................................................................... 1.36 档案出库.................................................................................................................................. 1.37 数字化前处理........................................................................................................................ 1.47.1 确定扫描页 ................................................................................................................. 1.47.2 编制页号.................................................................................................................... 1.47.3 目录数据准备.............................................................................................................1.57.4 拆除装订.................................................................................................................... 1.58 目录数据库建立 .................................................................................................................... 1.59 档案扫描.................................................................................................................................. 1.69.1 基本要求.................................................................................................................... 1.69.2 扫描设备.................................................................................................................... 1.79.3 扫描色采模式............................................................................................................ 1.79.4 扫描分辨率................................................................................................................. 1.89.5 存储格式.................................................................................................................... 1.89.6 图象命名.................................................................................................................... 1.910 图象处理 ............................................................................................................................... 1.910.1 图象拼接.................................................................................................................. 1.910.2 旋转及纠偏............................................................................................................... 1.910.3 裁边............................................................................................................................ 2.010.4 去污............................................................................................................................ 2.010.5 图象质量检查 ......................................................................................................... 2.011 数据挂接 ............................................................................................................................... 2.012 数字化成果验收与移交..................................................................................................... 2.112.1 验收方式.................................................................................................................. 2.112.2 验收内容.................................................................................................................. 2.112.3 验收指标.................................................................................................................. 2.212.4 验收结论.................................................................................................................. 2.212.5 移交............................................................................................................................ 2.3本标准按照 GB/T 1.1-2022 给出的规则起草。
纸质档案数字化技术规范
纸质档案数字化技术规范根据国家档案局2005年4月30日发布的《纸质档案数字化技术规范》,制定本局纸质档案数字化技术规范。
特对图像扫描、图像处理、图像存储作如下说明。
一、图像扫描1、扫描方式a、根据档案幅面的大小选择相应规格的扫描仪或专业扫描仪进行扫描。
大幅面档案可采用专用数码平台进行扫描或者采用图像拼接方式处理。
同一页面有两个以上文件,需分别扫描。
b、纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式以提高工作效率。
2、扫描色彩模式、分辨率及扫描格式扫描色彩模式、分辨率及扫描格式的选择见下表:彩色档案举例:带红头的文书档案。
对清晰度有较高要求的图纸可适当提高分辨率。
二、图像处理图像处理以无限还原档案原貌为标准,注意图像偏斜度、清晰度、失真度、排列顺序等等。
三、图像存储1、图像存储格式黑白原稿:*.tiff;彩色档案、图纸:*.pdf, jpg文件需通过pdf转换器来转换成pdf文件。
转换器可以网上下载。
2、图像文件的命名命名原则:以纸质档案目录数据库为依据,将每一份图像文件命名为档案目录数据库中该份文件的档号。
通过档号的一致性和唯一性,建立起一一对应的关联关系,为实现档案目录数据库与图像文件的批量挂接提供条件。
a、命名格式(一)对立卷改革之前的纸质文书档案进行扫描,其图像文件命名格式由全宗号、目录号、案卷号、顺序号所组成,各字段间用“-”连接,即以xxx-xxx-xxxx-xxxx.tiff(或pdf)表示,数据结构见下表:b、命名格式(二)立卷改革后形成的纸质文书档案的扫描,其图像文件命名由全宗号、年度、保管期限、档案室编件号等四部分组成,各字段间用“-”连接,即以xxx-xxxx-xxxx-xxxx.tiff (或pdf)表示,数据结构见下表:全宗号用三位代码标识,用阿拉伯数字标识某一属类全宗的顺序号。
如“002”表示2号全宗。
年度以四位阿拉伯数字标注公元纪年,如“2002”表示2002年。
纸质档案数字化规范
纸质档案数字化规范纸质档案数字化规范是指将纸质档案通过扫描、录入等技术手段转换成电子形式的一种操作规范。
纸质档案数字化的目的是提高档案管理的效率和便捷性,降低档案的保存成本,并便于档案的检索和共享。
下面是纸质档案数字化的规范要点:1. 核查和整理在数字化过程之前,必须对纸质档案进行核查和整理。
首先,核查档案是否完整,并将缺失或损坏的档案进行补充或修复。
其次,将档案按照分类、时序等原则进行整理,确保顺序和清晰度。
2. 扫描和录入将整理好的纸质档案通过扫描仪或其他相关设备转换为电子文件。
扫描时应保证文件清晰度和色彩准确性。
对于文字类档案,可以通过OCR技术进行文字的自动识别;对于图像、图片类档案,可以进行编辑和修复,以便更好地保留档案的内容和质量。
3. 统一命名和分类对于数字化后的档案文件,应进行统一的命名和分类。
文件名可以采用有意义的命名方式,如档案编号、日期等,以方便检索。
同时,将档案按照不同的类别、主题、格式等进行分类标注,并建立相应的文件夹或目录结构。
4. 元数据录入和索引建立对于数字化后的档案文件,应进行元数据的录入和索引的建立。
元数据包括档案的基本信息,如档案名称、创建日期、创建者、所属机构等;索引是对档案的内容和属性进行关键词标注,以便更方便地进行检索和查找。
5. 存储和备份数字化后的档案文件应按照一定的存储结构进行保存和备份。
可以采用硬盘、服务器、云存储等方式进行存储,并设定访问权限和安全措施,以保护档案的完整性和安全性。
同时,定期进行档案的备份和恢复,以防止文件丢失或损坏。
6. 数据质量和准确性的验证在数字化过程之后,需要对档案的数据质量和准确性进行验证。
首先,对数字化后的档案进行比对和校验,确保数字化结果与原始档案的一致性。
其次,进行数据质量的检测和修复,如修正错别字、调整图像亮度等,以提高档案的可读性和准确性。
7. 档案的检索和共享数字化后的档案应具备便捷的检索和共享功能。
可以通过建立档案管理系统或数据库,进行关键词检索、全文检索等操作,以方便用户查找所需档案。
纸质档案数字化规范
纸质档案数字化规范
一、总体要求
1、纸质档案数字化必须贯彻落实“以人为本”的方针,尊重用户权益
实现信息共享。
2、纸质档案数字化的内容应充分反映历史价值、文化传承,合理应用
信息技术,实现信息资源的统一集成,确保信息安全与完整性。
二、技术标准
1、采用图像处理技术,对纸质档案进行拍摄和扫描,根据记录需求,
把纸质档案图像、音频、视频数据处理成图像格式、文本格式、文档
格式进行存储。
2、要求文件格式和质量达到标准,采用TIFF带压缩格式保存,便于
存储、检索和调阅,合理利用格式的优势,强化档案的管理、查阅等。
3、利用数据库技术、信息检索技术、图像检索技术等技术,帮助档案
馆实现档案资源的有效管理和识别与应用,优化档案管理能力。
三、管理规范
1、纸质档案数字化时必须完成鉴定,确定档案类别和合法性,保证清晰、完整的档案信息。
2、将原有的档案索引体系迁移至电子文档管理系统,以实现档案的集中、统一、有序管理,保证信息的安全。
3、对档案数字化过程,应记录处理环节,对每一步处理做出核实,并
记录正确性和完整性。
4、定期进行档案数字化管理培训和质量测试,保证档案数字化工作质量。
纸质档案数字化技术规范介绍(PPT 73页)
(一) 档 案 整 理
1、目录数据准备
按照《档案著录规则》(DA/T18) 、 DA/T 22-2000《归档文件整理规则》和 《丹东市文书档案目录数据库结构和交换 标准(试行)》等标准的要求,规范档案 中的目录内容。
(一) 档 案 整 理
目录数据准备
一是确定档案目录的著录项、字段长度 和内容要求;
(五)目 录 建 库
3、目录数据质量检查 采用人工校对或软件自动校对的
方式,对目录数据库的质量进行检 查。核对著录项目是否完整、著录 内容是否规范、准确,发现不合格 的数据应进行修改或重录。
(六)数 据 挂 接
1、数据汇总 2、数据关联 3、数据挂接 4、数据挂接质量检查 5、核对登记
(六)数 据 挂 接
(三)图 像 处 理
6、裁边处理 对采用彩色模式扫描的图像应进行
裁边处理,去除多余的白边,以有效缩 小图像文件的容量,节省存储空间。
(三)图 像 处 理
7、图像处理登记 记录质检结果和处理意见。
(四) 图 像 存 储
1、存储格式 2、图像文件的命名
(四) 图 像 存 储
1、存储格式 1) 采用黑白二值模式扫描的图像文件, 用TIFF(G4)格式存储。采用灰度模式和 彩色模式扫描的文件,用JPEG格式存储。 存储时的压缩率的选择,应保证图像清 晰可读,尽量减小存储容量为准则。
旗、奖杯等)翻拍形成的照片。3、 Nhomakorabea字化范围
录音录像档案 1本机关召开的工作会议、业务会议、表彰会议、
代表会议等形成的录音、录像带。 2上级领导、社会著名人物来本机关检查、视察、
指导工作形成的录音、录像带。 3本机关在职能活动中主办或承办的重大活动的
纸质档案数字化基本操作规范及技术经验要求
精心整理纸质档案数字化基本流程及技术要求纸质档案数字化的基本环节主要包括:档案整理、档案扫描、图像处理、图像存储、目录建库、数据挂接、数据验收、数据备份等。
具体流程如下:(一)档案整理在扫描之前,根据档案管理情况,按下述步骤对档案进行适当整理,并视需要作出标识,确保12排34➢ ➢ 5、档案整理登记制作并填写纸质档案数字化加工过程登记表,详细记录档案整理后每份文件的起始页号和页数。
(二)档案扫描1、扫描方式(扫描前必须准备一台专业的高速扫描仪,并带平板)➢ 根据档案幅面的大小(A4、A3、AO 等)选择相应规格的扫描仪或专业担描仪,如工程图纸可采用0号图纸扫描仪进行扫描。
➢普通A4纸质文件,采用高速扫描仪的自动进纸方式扫描;➢纸质过薄、透明的(如信纸、便签纸)采用高速扫描仪的平板扫描;➢纸质过厚、照片等档案采用高速扫描仪的平板扫描;➢对文件页面贴有附属小页面、纸张时,将大小页面单独在平板中扫描;2、扫描模式(纸质档案扫描一般采用黑白、灰度和彩色三种模式)➢页面为黑白两色,字迹清晰的、不带图片的档案材料,采用黑白方式;➢➢3➢➢➢➢➢4否一致,不一致时应注明具体原因和处理方法。
(三)图像处理对图像进行处理,以获得最好的图像质量,保证图像完整、端正、无扭区、版面无暗影、无干扰信息,主要完成图像处理包括:去黑边、去污点、纠偏等,处理完的图像保存格式为PDF。
➢纠偏:对扫描过程中出现的偏斜图像进行整体纠正,包括自校和手校,保证数字图像的偏斜角度小于1度(图像偏斜不超过页面内半个文字);➢旋转:按方字方向将图片旋转至正确方向,没有文字的图片,判断其方向后进行左旋、右旋、翻转、旋转等工具;➢去污:对图像页面中出现的影响图像质量的杂质,去除数字图像中影响可懂度的杂质,如去除黑边、多余边、污点;➢裁边:采用彩色模式扫描的图像应进行裁边处理,去除多余的白边,以有效缩小图像文件的容量,节省存储空间。
➢删除空白页:将扫描后页面之间的空白页进行删除;➢断字修补:对部分文字不清楚可进行修补;➢反白字修正:将部分反白文字可进行描述;➢➢➢➢➢➢➢➢➢➢扫描后的图像文件命名。
DA/T31-2005纸质档案数字化技术规范
纸质档案数字化技术规范(DA/T31--2005)1 范围本标准规定了纸质档案数字化的主要技术要求。
本标准适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。
2 规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。
凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。
凡是不注日期的引用文件,其最新版本适用于本标准。
GB/T 17235.1-1998 信息技术连续色调静态图像的数字压缩编码第一部分:要求和指南GB/T 17235.2-1998 信息技术连续色调静态图像的数字压缩编码第二部分:一致性测试GB/T 18894-2002 电子文件归档与管理规范3 术语和定义下列术语和定义适用于本标准。
3.1数字化digitization用计算机技术将模拟信号转换为数字信号的处理过程。
3.2纸质档案数字化digitization of paper-based records采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。
3.3数字图像digital image表示实物图像的整数阵列。
一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。
在矩阵(或其他)网络上采样--连续函数,并在采样点上将值最小化后的阵列。
3.4黑白二值图像binary image只有黑白两级灰度的数字图像。
它对应于黑白两种状态的文字稿、线条图等。
3.5连续色调静态图像continuous-tone still image以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。
在纸质档案数字化过程中,通常表现为灰度扫描和彩色扫描两种模式。
3.6分辨率resolution单位长度内图像包含的点数或像素数,一般用每英吋点数(dpi)表示。
南京中医药大学档案馆纸质档案数字化技术规范
南京中医药大学档案馆纸质档案数字化技术规范为了规范、科学、合理的开展纸质档案数字化工作,使档案信息资源准确、方便、快捷地提供共享利用,以满足学校对档案的需求,现参照《纸质档案数字化技术规范》(DA/T 31-2005),并结合本馆实际,制订本技术规范。
1 本规范的适用范围本规范规定了南京中医药大学纸质档案数字化的主要技术要求。
本规范适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。
2 规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。
GB/T 17235.1连续色调静态图像的数字压缩编码第一部分:要求和指南GB/T l7205.2还续色调静态图像的数字压缩编码第二部分:一致性测试GB/T l8894电子文件归档与管理规范DA/T 31—2005 纸质档案数字化技术规范3 术语和定义下列术语和定义适用于本标准。
3.1 数字化digitization用计算机技术将模拟信号转换为数字信号的处理过程。
3.2 纸质档案数字化digitizatin of paper-based records采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。
3.3 数字图像digital image表示实物图像的整数阵列。
一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。
在矩阵(或其他)网络上采样——连续函数,并在采样点上将值最小化后的阵列。
3.4 黑白二值图像binary image只有黑白两级灰度的数字图像。
它对应于黑白两种状态的文字稿、线条图等。
3.5 连续色调静态图像continuous-tone still image以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。
在纸质档案数字化过程中,通常表现为灰度扫描和彩色扫描两种模式。
3.6 分辨率resolution单位长度内图像包含的点数或像素数,一般用每英寸点数(dpi)表示。
纸质档案数字化技术规范 pdf
纸质档案数字化技术规范 pdf1、档案数字化标准本规范依据以纸质档案[按文书、科技工程图纸]、专门档案[照片、声音、影像、实物等分类] 为主的档案载体分类的行业标准;其中纸制档案数字化标准中详细约定了档案数字化规范标准过程,专门档案的数字化标准过程类同,但是在格式标准上有专门的要求,整个规约参照国标[DA/T313寸的黑白照片,必须选用300dpi 或350dpi 。
文件存储类型:扫描后的照片以TIF 格式存储,保存时必须选用图像选项中的品质为最佳值的大文件,存入到统一的照片数据库。
文件存储方式:档案照片存储时按全宗、目录、相册分级建立文件夹保存,照片名字以照片的档案号命名。
照片命名方法:每一张照片必须定义完全。
包括此张照片的档案号、拍摄时间、组说明或照片的定义内容。
以上注明需在文件名中全部打出。
补充说明无论彩色照片还是黑白照片都采用全彩格式扫描。
扫描仪有光学分辨率和差值分辨率两个常用技术参数,其中光学分辨率反映的是硬件系统确实可以达到的清晰程度,是扫描仪自身性能的反映。
所扫描的照片必须经过图像处理软件进行图片的亮度、色度调整,对扫描的边框进行裁切。
声音档案数字化标准声音档案数字化是指通过硬件设备将声音档案转为数字化数据并加以存储的过程。
声音档案数字化必须保证其真实性、有效性、完整性。
在使用时必须保证数字化数据能从存储介质中正确读取, 并还原成声音信号输出。
同时作为输出的流媒体信号能正常在网络中播放查阅。
基本概念采样频率和样本大小采样频率和样本大小是反映数字化声音档案的精确度高低的两个最基本的参数。
采样频率即每秒钟采集多少个声音样本, 用Hz 或kHz 来表示。
样本大小一般指声音卡的二进制位数,有8位、12位、16位等。
采样频率越高, 声音波形就表达得越精确, 而需要的存储空间就越大。
奈奎斯特理论奈奎斯特理论指出, 采样频率不应低于声音信号最高频率的两倍, 这样就能把数字表达的声音还原成原来的声音。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
南京中医药大学档案馆纸质档案数字化技术规范为了规范、科学、合理的开展纸质档案数字化工作,使档案信息资源准确、方便、快捷地提供共享利用,以满足学校对档案的需求,现参照《纸质档案数字化技术规范》(DA/T31-2005),并结合本馆实际,制订本技术规范。
1本规范的适用范围本规范规定了南京中医药大学纸质档案数字化的主要技术要求。
本规范适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。
2规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。
GB/T17235.1连续色调静态图像的数字压缩编码第一部分:要求和指南GB/T l7205.2还续色调静态图像的数字压缩编码第二部分:一致性测试GB/T l8894电子文件归档与管理规范DA/T31—2005纸质档案数字化技术规范3术语和定义下列术语和定义适用于本标准。
3.1数字化digitization用计算机技术将模拟信号转换为数字信号的处理过程。
3.2纸质档案数字化digitizatin of paper-based records采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。
3.3数字图像digital image表示实物图像的整数阵列。
一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。
在矩阵(或其他)网络上采样——连续函数,并在采样点上将值最小化后的阵列。
3.4黑白二值图像binary image只有黑白两级灰度的数字图像。
它对应于黑白两种状态的文字稿、线条图等。
3.5连续色调静态图像continuous-tone still image以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。
在纸质档案数字化过程中,通常表现为灰度扫描和彩色扫描两种模式。
3.6分辨率resolution单位长度内图像包含的点数或像素数,一般用每英寸点数(dpi)表示。
3.7失真度distortion measure对档案进行数字化转换后,数字图像与档案原件在色彩、几何等方面的偏离程度。
3.8可懂度intelligibility数字图像向人或机器提供信息的能力。
3.9图像压缩image compression消除图像冗余或对图像近似的任一种过程,其目的是对图像以更紧凑的形式表示。
纸质档案数字化过程中,较常见的有TIFF(G4)、JPEG等压缩格式。
3.10标记图像文件格式Tagged Image File Format(TIFF)一种基于标记的无损(不丢失信息)压缩格式,用于在应用程序之间和计算机平台之间交换文件。
主要适用于黑白二值、灰度以及彩色模式下的图像存储。
3.11联合摄影专家组Joint Potographic Experts Group(JPEG)一种丢失少量信息的压缩格式,尤其适用于屏幕和打印显示,支持所有主要的计算机平台和Web浏览器。
主要适用于灰度以及彩色模式下的图像存储。
4纸质档案数字化基本要求4.1基本原则纸质档案数字化的基本原则是使学校档案信息资源准确方便快捷地提供利用,使可以公开的档案信息资源得到共享,以满足学校及社会对档案利用的需求。
4.2数字化对象的确定原则应当对所要进行数字化的对象按照一定的原则和利用方法进行确认,属于归档范围且应永久或长期保存、符合国家有关规定的档案可列入数字化加工的范围。
4.3基本环节纸质档案数字化的基本环节主要包括:档案整理、目录建库、档案扫描、图像处理、图像存储、数据质检、数据挂接、数据验收、数据备份、成果管理等。
4.4过程管理4.4.1应加强纸质档案数字化各环节的安全保密管理机制,确保档案原件和数字化档案信息的安全。
4.4.2纸质档案数字化的各个环节均应进行详细的登记,并及时整理、汇总,装订成册,在数字化工作完成的同时建立起完整、规范的记录。
5档案整理在扫描之前,根据档案管理情况,按下述步骤对档案进行适当整理,并视需要作出标识,确保档案数字化质量。
5.1目录数据准备按照江苏省《文书档案目录数据库结构与数据交换格式》的要求,规范档案目录内容。
包括确定档案目录的著录项、字段类型、长度和内容要求。
如有错误或不规范的案卷题名、文件名、责任者、起止页号和页数等,应进行修改。
5.2档案交接,出库登记5.2.1档案调出库房应由双方共同清点案卷数量,仔细查看每个案卷,对于案卷有否破损、残缺、漏页、缺页、有无卷内目录、页码是否连续,装订是否牢固,有否破损等情况均记录备案,并作为档案再入库验收的依据。
5.2.2档案数字化外加工(即扫描或翻拍、图像处理)的数量,一般一次30卷左右。
档案离馆之前,应办理交接手续,由档案馆档案保管利用室工作人员和加工方法人代表共同签字后,方可离馆。
5.2.3由档案馆派出代表与加工方共同将待数字化外加工的档案护送至加工场地,以确保档案之安全。
5.3拆除装订在不去除装订物情况下,影响扫描工作进行的档案,应拆除装订物。
拆除装订物时应注意保护档案不受损害。
5.3.1拆卷前,先检查卷内文件是否编有页码。
未编页码的,用铅笔编写在单面材料的右上角、编制双面书写的文字材料时正面编写在右上角,反面编写在左上角。
5.3.2如发现卷内目录和卷内实际分页不符,整理人员校核后用铅笔修改错误的页码。
5.3.3拆卷时,要首先去掉金属物。
对于必须裁页才能扫描的文件,在经档案管理人员同意后方可用裁纸刀沿文件原有折痕细心裁切,不得徒手撕裁;拆卷后的所有案卷一律平放,不得竖放和侧放。
5.4区分扫描件和非扫描件按要求把同一案卷中的扫描件和非扫描件区分开。
普发性文件区分的原则是:无关和重复的文件要剔除,有正式件的文件可以不扫描原稿。
正式文本中的定稿(文件处理签及定稿中有领导人亲笔批示和审改内容的除外)、成批统计报表中的重复性填表说明文字、有正式转发件(发文)的被转发件(收文)等无须列入数字化处理的对象。
5.5页面修整破损严重、无法直接进行扫描的档案,应先进行技术修复,折皱不平影响扫描质量的原件应先进行相应处理(压平或烫平等)后再进行扫描。
5.6档案整理登记制作并填写纸质档案数字化加工过程交接登记表单,详细记录档案整理后每份文件的起始页号和页数。
5.7装订扫描工作完成后,拆除过装订物的档案应按档案保管的要求重新装订。
恢复装订时,应注意保持档案的排列顺序不变,案卷不掉页,做到安全、准确、无遗漏。
5.7.1检查案卷封面、目录、原件、备考表等构成部分是否齐全和一一对应。
5.7.2检查各纸质档案是否有破损、丢失、遗漏、混乱等情况,如发现是属于前环节操作不当导致的,应及时报告项目负责人,则追究有关人员的责任;如是装订人员在工作中操作不当导致的,则应及时纠正,并及时报告,情节严重的,则追究有关人员的责任。
5.7.3正确排序:检查页码排序是否正确,检查文件正反面、横竖面是否正确。
5.7.4检查大幅面纸张折叠是否正确合理,检查是否有破损严重的,如有则应进行裱糊。
5.7.5装订时,须依照右对齐、下对齐的方法将文件纸张对齐。
5.7.6装订穿孔时,尽量使用原装订孔,若原装订孔不能使用,需要打穿新孔的,则应尽量保证装订孔不要压住文字、图表。
5.7.7装订穿线时,须保证装订线不要拧缠在一起,装订线要平整。
装订线要拉紧。
装订线应在案卷背面打结,余线要适中(2cm左右)。
6档案扫描6.1扫描方式6.1.1根据档案幅面的大小(A4、A3等)选择相应规格的扫描仪或专业扫描仪进行扫描。
大幅面档案可采用大幅面数码平台,或者缩微拍摄后的胶片数字化转换设备等进行扫描,也可以采用小幅面扫描后的图像拼接方式处理。
6.1.2纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式以提高工作效率。
6.2扫描色彩模式6.2.1普通文件、档案可采用黑白或灰度模式扫描。
6.2.2永久或长期保存的档案,一半应采用彩色模式进行扫描。
6.3扫描分辨率6.3.1采用黑白二值、灰度、彩色几种模式对档案进行扫描时,其分辨率一般均建议选择≥200dpi。
特殊情况下,如文字偏小、密集、清晰度较差等,可适当提高分辨率。
6.3.2需要进行OCR汉字识别的档案,扫描分辨率建议选择≥300dpi。
6.3.3图纸类文件扫描分辨率建议选择≥300dpi。
6.4扫描登记认真填写纸质档案数字化转换过程交接登记表单,登记扫描的页数,核对每份文件的实际扫描页数与档案整理时填写的文件页数是否一致,不一致时应注明具体原因和处理方法。
7图像处理7.1图像数据质量检验7.1.1对图像偏斜度、清晰度、失真度等进行检查。
发现不符合图像质量要求时,应重新进行图像的处理。
7.1.2由于操作不当,造成扫描的图像文件不完整或无法清晰识别时,应重新扫描。
7.1.3发现文件漏扫时,应及时补扫并正确插入图像。
7.1.4发现扫描图像的排列顺序与档案原件不一致时,应及时进行调整。
7.2纠偏对出现偏斜的图像应进行纠偏处理,图像偏度不得大于3度,以达到视觉上基本不感觉偏斜为准。
对方向不正确的图像应进行旋转还原,以符合阅读习惯。
7.3去污对图像页面中出现的影响图像质量的杂质如黑点、黑线、黑框、黑边等应进行去污处理。
处理过程中应遵循在不影响可懂度的前提下展现档案原貌的原则。
7.4图像拼接对大幅面档案进行分区扫描形成的多幅图像,应进行拼接处理,合并为一个完整的图像,以保证档案数字化图像的整体性。
7.5裁边处理采用彩色模式扫描的图像应进行裁边处理,去除多余的白边,以有效缩小图像文件的容量,节省存储空间。
8图像存储8.1存储格式采用黑白二值模式扫描的图像文件,一般采用TIFF(G4)格式存储。
采用灰度模式和彩色模式扫描的文件,一般采用JPEG、PDF、CEB格式存储。
存储时的压缩率的选择,应以保证扫描的图像清晰可读的前提下,尽量减小存储容量为准则。
8.2图像文件的命名以纸质档案目录数据库为依据,将每一份纸质档案文件扫描所得的一个或多个图像存储为一份图像文件。
将图像文件存储到相应文件夹时,耍认真核查每一份图像文件的名称与档案目录数据库中该份文件的档号是否相同,图像文件的页数与档案目录数据库中该份文件的页数是否一致,图像文件的总数与目录数据库中文件的总数是否相同等。
通过每一份图像文件的文件名与档案目录数据库中该份文件的档号的一致性和唯一性,建立起一一对应的关联关系,为实现档案目录数据库与图像文件的批量挂接提供条件。
9目录建库9.1数据格式选择目录建库应选择通用的数据格式。
所选定的数据格式应能直接或间接通过XML文档进行数据交换。
9.2档案著录按照江苏省《文书档案目录数据库结构与数据交换格式》的要求进行著录,建立档案目录数据库。
9.3目录数据质量检查采用人工校对或软件自动校对的方式,对目录数据库的建库质量进行检查。