海南省纸质档案数字化技术规范
纸质档案数字化规范-DAT-31-2017
纸质档案数字化规范-D A T-31-2017(共22页)-本页仅作为预览文档封面,使用时请删除本页-目录前言................................................. 错误!未定义书签。
引言................................................. 错误!未定义书签。
纸质档案数字化规范....................................... 错误!未定义书签。
1 范围.................................................. 错误!未定义书签。
2 规范性引用文件........................................ 错误!未定义书签。
3 术语和定义............................................ 错误!未定义书签。
4 总则.................................................. 错误!未定义书签。
5.组织与管理............................................ 错误!未定义书签。
机构及人员 ........................................ 错误!未定义书签。
基础设施 .......................................... 错误!未定义书签。
工作方案 .......................................... 错误!未定义书签。
管理制度 .......................................... 错误!未定义书签。
工作流程控制 ...................................... 错误!未定义书签。
纸质档案数字化工作流程与规范要求
档案资料保护 档案基础查询 档案全文检索 构建知识服务系 统
档案数据挖掘
总体架构示意图
元数据 人物 时间 地点 事件 特点
展示 关联 网络 地图
文本 数据
挖掘算法
本体
民间传说中,唐末,天下大乱,各路英雄争雄,逐鹿于中原。黄巢农民起 义异军突起,天秸元年(904)八月,朱全忠杀唐昭宗,第二年唐昭宗的遗腹子李 昌翼出生,在徽州婺源考水被一个叫胡三的人收为义子,改姓胡。昌翼长大后, 于五代后唐同光三年(925)中明经科及第,故其后裔称明经胡氏,因其是李姓后 裔,明经胡氏忌与李氏通婚。明经胡氏人才辈出,最著名的有二支,即宋元时 期的婺源胡炳文家族和近代绩溪胡适、胡雪岩家族。
数据检 查及整 理挂接
数字化 成果接 收
归档数 据管理
电 子 档 案 发 布 利 用
电子文 件采集
生成电 子档案
数据检 查及整 理
实时归 档
归档数 据管理
档案数 据鉴定
发布利 用
数据挖 掘
(在线/离线)
数据分 级存储 管理
数据安 全防护
6
馆(室)藏档案数字化工作是数字档案馆(室)资源体系建设的重要手段 和方式,国家档案局对档案数字化工作十分重视。 2002年 国家档案局中央档案馆关于印发《全国档案信息化建设实施纲要》 (档发【2002】8号)的通知中要求各地综合档案馆在“十五”期间以档案信 息资源建设为核心,以扩大档案信息资源开发利用为目标,加强档案目录数据 库建设,积极推进档案全文数据库和多媒体数据库建设,以现实需要为前提, 分阶段、分步骤实施档案数字化进程。 2010年 国家档案局印发《数字档案馆建设指南》,指出传统载体档案数字 化是现阶段数字档案资源建设的一个重要途径。应当统筹规划,分步实施。 应当通过数字化工作,对馆藏档案进行全面的梳理。如果对馆藏档案无法一次 性全面数字化,可以按照特殊载体优先、重要程度优先、共享性强优先等原则 分布实施。 2013年10月 时任国家档案局局长杨冬权在全国数字档案馆(室)建设推 进会上的讲话,要求数字档案馆(室)建设的首要任务,就是要把纸质档案、 音像档案等传统载体的档案数字化。不完成这项任务,档案馆(室)就不能实 现转型升级,就必然要在大数据时代落伍,就肯定不能跨进现代化的门槛。
纸质档案数字化规范
纸质档案数字化规范DA/T31—2017前言本标准按照GB/T 给出的规则起草。
本标准替代DA/T 31-2005《纸质档案数字化技术规范》。
本标准与DA/T 31-2005相比,主要技术变化如下:——标题进行了修改;——增强组织与管理部分的内容,完善数字化工作中管理相关要求;——增强数字化前处理部分的内容,包括对实体档案保护和档案规范化管理方面的要求;——增加数字化过程中元数据采集的要求;——修改了档案扫描部分参数要求;——修改了图像处理部分内容,更加强调保持档案原貌的要求;——细化了数字化成果验收的内容;——删除原标准数据备份和数字化成果管理相关内容。
本标准由国家档案局提出并归口。
本标准起草单位:国家档案局档案科学技术研究所、国家档案局信息管理中心、国家档案局技术部。
本标准主要起草人:王良城、马淑桂、郝晨辉、程春雨、杜琳琳、蔡伟、宋涌、王大众、田军、曹燕、李华峰。
本标准所代替标准的历次版本发布情况为:——DA/T 31—2005。
引言DA/T 31-2005的发布实施,从技术标准方面对纸质档案数字化工作提出了要求,很好的促进了纸质档案数字化工作向科学化、规范化的方向发展,在档案信息化工作中发挥了重要作用。
由于纸质档案数字化工作所依赖的信息技术发展迅速,经过10年的时间,数字化设备、存储、网络等技术条件都发生了较大变化,同时,纸质档案数字化工作管理方法和管理理念等都在不断更新、发展。
因此,及时对本标准进行修订,适时调整相关要求,从档案行业层面科学规范纸质档案数字化工作,具有重要的现实意义。
标准本次修订更加注重我国纸质档案数字化工作自身的特点,结合目前信息技术发展的水平,提出适用于档案行业的纸质档案数字化工作的规范性要求。
纸质档案数字化规范1 范围本标准规定了纸质档案数字化技术和管理要求。
本标准适用于采用扫描设备对纸质档案的数字化加工过程的管理。
2 规范性引用文件下列文件对于本文件的应用是必不可少的。
DA/T31-2005纸质档案数字化技术规范
纸质档案数字化技术规范(DA/T31--2005)1 范围本标准规定了纸质档案数字化的主要技术要求。
本标准适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。
2 规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。
凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。
凡是不注日期的引用文件,其最新版本适用于本标准。
GB/T 17235.1-1998 信息技术连续色调静态图像的数字压缩编码第一部分:要求和指南GB/T 17235.2-1998 信息技术连续色调静态图像的数字压缩编码第二部分:一致性测试GB/T 18894-2002 电子文件归档与管理规范3 术语和定义下列术语和定义适用于本标准。
3.1数字化digitization用计算机技术将模拟信号转换为数字信号的处理过程。
3.2纸质档案数字化digitization of paper-based records采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。
3.3数字图像digital image表示实物图像的整数阵列。
一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。
在矩阵(或其他)网络上采样--连续函数,并在采样点上将值最小化后的阵列。
3.4黑白二值图像binary image只有黑白两级灰度的数字图像。
它对应于黑白两种状态的文字稿、线条图等。
3.5连续色调静态图像continuous-tone still image以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。
在纸质档案数字化过程中,通常表现为灰度扫描和彩色扫描两种模式。
3.6分辨率resolution单位长度内图像包含的点数或像素数,一般用每英吋点数(dpi)表示。
纸质档案数字化操作规程
纸质档案数字化操作规程根据纸质档案重要程度、破损状况、利用需求等,进行统筹规划,分步实施。
国家重点档案、重要全宗档案和涉及民生的专业档案应优先列入数字化加工对象。
数字化应保持原有档案全宗或目录的完整性。
基本原则1、加强管理,保障安全遵守保密安全要求,对数字化对象进行划控、鉴定。
涉及国家秘密的档案,不得以外包方式委托进行数字化加工。
加强档案数字化各个环节的管理工作,确保档案原件和数字化成果的安全。
2、完善细节,规范流程对因涉密不宜以外包方式委托进行数字化加工的对象,应用文字做出说明,并由数字化实施单位组织工作人员集中进行数字化加T o应加强数字化加工流程管理,界定各个环节的职责任务,堵塞漏洞和缺憾。
3.分工协作,夯实基础加强内设机构的分工协作,把夯实档案基础业务工作与档案数字化相结合,开展传统载体档案清理、整理、鉴定、修裱等基础处理工作,为加快推进档案数字化创造有利条件。
基本环节纸质档案数字化的基本环节为数字化前期准备、数字化前处理、数字化扫描、数字化后处理、数字化成果验收移交。
内容主要包括:制定数字化工作方案、案卷整理与交接登记、目录建库、档案扫描、图像处理、图像存储、数据挂接、数据验收、数据备份、数字化成果移交及管理等。
档案数字化从整理分件到案卷还原的各个环节,应以卷(盒)或批次为单位建立档案数字化加工流程单,记录每卷(盒)或每批档案数字化过程,确保档案扫描加工质量和效率。
制定方案对档案实体的基本情况进行摸底排查,根据排查结果,制定总体规划和分年计划,并按照本规范编制数字化工作方案。
包括档案数字化的内容和范围、数量以及先后顺序、数字化的形式、技术参数、时间安排以及经费预算等内容。
案卷整理开展数字化扫描工作之前,应根据纸质档案实际情况,按步骤对档案实体进行整理鉴别,对需要说明、修裱、扫描等内容进行标识,以确保扫描加工质量和效率。
档案数字化过程需要交接的环节,应当填写档案调还卷登记表,确保交接清楚,手续完备,有据可查。
纸质档案数字化基本操作规范及技术经验要求
纸质档案数字化基本流程及技术要求纸质档案数字化的基本环节主要包括:档案整理、档案扫描、图像处理、图像存储、目录建库、数据挂接、数据验收、数据备份等。
具体流程如下:(一)档案整理在扫描之前,根据档案管理情况,按下述步骤对档案进行适当整理,并视需要作出标识,确保档案数字化质量。
1、目录数据准备按照《档案着录规则》(DA/T18)等的要求,规范档案中的目录内容。
包括确定档案目录的着录项、字段长度和内容要求。
如有错误或不规范的案卷题名、文件名、责任者、起止页号和页数等,应进行修改。
(详见附件)2、拆除装订在不去除装订物情况下,影响扫描工作进行的档案,应拆除装订物;将档案原件的装订线拆除,排好顺序,不得出现任何漏缺页及顺序差错,更不能对档案原件有任何损坏。
3、区分扫描件和非扫描件按要求把同一案卷中的扫描件和非扫描件区分开。
普发性文件区分的原则是:无关的重份的文件要剔除,有正式件的文件可以不扫描原稿。
4、页面修整对破损严重、无法直接进行扫描的档案,应先进行技术修复、裱糊;折皱不平影响扫描质量的原件应先进行相应处理(压平或烫平等)后再进行扫描。
5、档案整理登记制作并填写纸质档案数字化加工过程登记表,详细记录档案整理后每份文件的起始页号和页数。
(二)档案扫描1、扫描方式(扫描前必须准备一台专业的高速扫描仪,并带平板)根据档案幅面的大小(A4、A3、AO等)选择相应规格的扫描仪或专业担描仪,如工程图纸可采用0号图纸扫描仪进行扫描。
普通A4纸质文件,采用高速扫描仪的自动进纸方式扫描;纸质过薄、透明的(如信纸、便签纸)采用高速扫描仪的平板扫描;纸质过厚、照片等档案采用高速扫描仪的平板扫描;对文件页面贴有附属小页面、纸张时,将大小页面单独在平板中扫描;2、扫描模式(纸质档案扫描一般采用黑白、灰度和彩色三种模式)页面为黑白两色,字迹清晰的、不带图片的档案材料,采用黑白方式;页面为黑白两色,清晰度较差或者带有图片的档案材料,以及页面多为彩色文字的档案,采用彩色或灰度模式(因情况而定);页面中有红头、印章或插有黑白照片、彩色照片、彩色插图的档案,采用彩色模式扫描。
纸质档案数字化基本操作规范及技术经验要求
精心整理纸质档案数字化基本流程及技术要求纸质档案数字化的基本环节主要包括:档案整理、档案扫描、图像处理、图像存储、目录建库、数据挂接、数据验收、数据备份等。
具体流程如下:(一)档案整理在扫描之前,根据档案管理情况,按下述步骤对档案进行适当整理,并视需要作出标识,确保12排34➢ ➢ 5、档案整理登记制作并填写纸质档案数字化加工过程登记表,详细记录档案整理后每份文件的起始页号和页数。
(二)档案扫描1、扫描方式(扫描前必须准备一台专业的高速扫描仪,并带平板)➢ 根据档案幅面的大小(A4、A3、AO 等)选择相应规格的扫描仪或专业担描仪,如工程图纸可采用0号图纸扫描仪进行扫描。
➢普通A4纸质文件,采用高速扫描仪的自动进纸方式扫描;➢纸质过薄、透明的(如信纸、便签纸)采用高速扫描仪的平板扫描;➢纸质过厚、照片等档案采用高速扫描仪的平板扫描;➢对文件页面贴有附属小页面、纸张时,将大小页面单独在平板中扫描;2、扫描模式(纸质档案扫描一般采用黑白、灰度和彩色三种模式)➢页面为黑白两色,字迹清晰的、不带图片的档案材料,采用黑白方式;➢➢3➢➢➢➢➢4否一致,不一致时应注明具体原因和处理方法。
(三)图像处理对图像进行处理,以获得最好的图像质量,保证图像完整、端正、无扭区、版面无暗影、无干扰信息,主要完成图像处理包括:去黑边、去污点、纠偏等,处理完的图像保存格式为PDF。
➢纠偏:对扫描过程中出现的偏斜图像进行整体纠正,包括自校和手校,保证数字图像的偏斜角度小于1度(图像偏斜不超过页面内半个文字);➢旋转:按方字方向将图片旋转至正确方向,没有文字的图片,判断其方向后进行左旋、右旋、翻转、旋转等工具;➢去污:对图像页面中出现的影响图像质量的杂质,去除数字图像中影响可懂度的杂质,如去除黑边、多余边、污点;➢裁边:采用彩色模式扫描的图像应进行裁边处理,去除多余的白边,以有效缩小图像文件的容量,节省存储空间。
➢删除空白页:将扫描后页面之间的空白页进行删除;➢断字修补:对部分文字不清楚可进行修补;➢反白字修正:将部分反白文字可进行描述;➢➢➢➢➢➢➢➢➢➢扫描后的图像文件命名。
海南省纸质档案数字化技术规范
海南省纸质档案数字化技术规范海南省纸质档案数字化技术规范(试行)为规范我省纸质档案数字化工作,提高纸质档案的数字化质量,维护档案实体和档案信息安全,根据《中华人民共和国档案法》和《纸质档案数字化技术规范》(DA/T31-2005)等相关法规标准,制定本规范。
1.范围本规范规定了我省纸质档案数字化的各项要求。
本规范适用于我省各级国家综合档案馆(室)进行纸质档案数字化转换工作。
机关、团体、企事业单位纸质档案的数字化工作可参照执行。
2.术语本规范所称纸质档案数字化是采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。
源版数字副本是指使用扫描仪等数字成像设备对纸质档案进行数字化转换而直接生成的静态图像文件。
源版数字副本的衍生品是指对源版数字副本进行压缩、格式转换、识别等处理而生成的静态图像文件、版式文件或纯文本文件。
3.项目管理3.1 全程管理应对纸质档案数字化项目的准备、扫描、处理、移交接收等阶段实施全程管理,对数字化工作的安全、标准、质量、进度等进行有效控制。
3.2 制定数字化工作方案应对数字化对象基本情况进行调查摸底,以此为基础并根据本规范提出数字化项目管理与技术要求,编制数字化工作方案。
数字化工作方案应包括安全保密措施、项目管理要求、技术标准、工作文档管理要求、数字化成果移交要求等内容。
采取委托加工方式的数字化项目,数字化工作方案应明确数字化成果的计算标准。
3.3 数字化对象审批对纸质档案数字化对象实行审批制。
尤其是委托加工方式的项目,要有档案原件法定持有保管单位的法人或授权代表的签署《纸质档案数字化审批书》(附录A表A1)3.4 数字化工作文档管理应明确纸质档案数字化过程中形成的工作文档的整理、归档、移交等管理要求,并与全宗卷共同保管。
应归档的数字化文档包括:数字化工作方案、档案原件数字化审批书、档案数字化借用档案登记表、数字化工作登记表、纸质档案数字化加工流程单、纸质档案数字化数据质检登记表、纸质档案数字化数据质检验收登记表、纸质档案数字化项目验收移交清单等凭证性文件;采取委托加工方式的数字化项目,还应包括项目招投标文件、中标通知书、项目合同等。
纸质档案数字化工作技术标准
纸质档案数字化工作技术标准1、档案前处理要求:1)应对拟数字化的档案进行涉密性、完整性、有序性及档案实体与目录的一致性检查。
档案实体破损、残缺的要进行登记,征求同意后对破损、残缺档案进行裱糊抢救,目录错误的要予以修正,无数字化目录的要予以著录。
如果该档案为涉密档案,则不进行全文扫描,并予以标记。
2)扫描前,对档案进行拆卷并整理,对不平整的档案进行平整处理,对错误、漏编的页号进行修正或补编页号。
扫描结束,档案需进行恢复性、规范性整理装订。
拆卷和装订不能损害档案原件。
拆卷时不允许裁切档案纸张,装订时应尽量按原有顺序原孔装订,案卷不掉页,右边和底边整齐,左侧不及装订线的要加装订边。
2、档案整理要求具体整理方法参照《机关档案业务建设规范》、《归档文件整理规范》。
档案整理的归档范围和保管期限参照国家档案局第8号令《机关文件材料归档范围和文书档案保管期限规定》。
具体任务包括:区分归档年度、鉴定保管期限、剔除重份文件、组卷、编写页码、打印目录、打印封面、打印备考表、盖归档章、填写档号项、装订、装盒、填写背脊、入库、上架等,具体以业务性标准规范标为准。
3、档案著录要求(1)、需符合国家档案局发布的《纸质档案数字化技术规范》、《档案著录规则》和安徽省档案局发布的《文书档案文件级目录数据库结构与著录细则》在数字化加工方面的相关规定,并按太和县档案局要求,将档案数据著录进太和县档案局档案管理软件系统中。
著录的档案信息要求准确无错别字、符号正确、题名完整通顺、无缺项,对传统方法整理的档案案卷题名、会议记录类档案、无明确题名的通知等需总结完整通顺,符合著录规则,对不完整的题名需要按照要求自拟题名。
(2)、卷内目录需与案卷目录对应,按要求进行录入,并进行校对,确保准确,著录完成后按太和县档案局要求打印相应目录。
(3)、著录时,在文件、会议记录或其他档案材料中如遇到有人员职务任免、离退休、工资福利、关系调动、奖励处罚等的人名需要全部著录到人名项中。
纸质档案数字化技术规范
纸质档案数字化技术规范中华人民共和国档案行业标准DA/T 31—20051范围本标准规定了纸质档案数字化的主要技术要求。
本标准适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。
2规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。
凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。
凡是不注日期的引用文件,其最新版本适用于本标准。
GB/T 17235.1—1998信息技术连续色调静态图像的数字压缩及编码第1部分:要求和指南GB/T 17235.2—1998信息技术连续色调静态图像的数字压缩及编码第2部分:一致性测试GB/T 18894-2002电子文件归档与管理规范3术语和定义下列术语和定义适用于本标准。
3.1数字化digitization用计算机技术将模拟信号转换为数字信号的处理过程3.2纸质档案数字化digitization 0fpapeI喃ased records采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。
3.3数字图像digital image表示实物图像的整数阵列。
一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。
在矩阵(或其他)网络上采样——连续函数,并在采样点上将值最小化后的阵列。
3.4黑白二值图像binary image只有黑白两级灰度的数字图像。
它对应于黑白两种状态的文字稿、线条图等。
3.5连续色调静态图像continuous—tone 8till image以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。
在纸质档案数字化过程中,通常表现为灰度扫描和彩色扫描两种模式。
3.6分辨率resolution单位长度内图像包含的点数或像素数,一般用每英寸点数(dpi)表示。
浅谈纸质档案数字化技术规范及归档要求
摘要:纸质档案数字化发展将是未来档案发展的趋势,根据纸质档案数字化技术规范及归档工作的具体要求,按照档案数字化相关标准,本文主要讨论了纸质档案数字化技术规范及归档工作过程中相关问题,并结合具体的实际,提出了促进纸质档案数字化发展的具体措施,从纸质档案数字化的范围和深度,正确把握相关参数,以及正确掌握相关技术等方面进行了分析和总结,对于促进纸质档案数字化发展具有一定的指导意义。
关键词:纸质档案数字化技术规范要求1纸质档案数字化技术规范及归档现状随着我国档案管理技术的发展,对于数字档案管理的认识的也逐渐得到重视和提高,虽然当前数字档案管理技术规范和归档要求还不是很成熟,但是档案数字化在很大程度上可以有效提高档案的管理力度。
纸质档案数字化是一个长期而复杂的任务,不能一步到位,需要在这一过程中突出重点,分步实施,才能稳步推进这一进程。
纸质档案数字化应遵循一定的技术规范和归档要求,以确保物理文件安全为前提,比如属于永久或长期保存的档案文件,大多是以纸张为载体,包括文件,档案,会计记录,业务记录等,针对这些纸质档案材料可以通过扫描仪进行字符识别,然后根据具体的档案内容扫入计算机转换成图形文件。
当前我国纸质档案数字化进程中,针对纸质档案数字化技术规范及归档工作还存在一些问题和不足,主要有:一是相关数字化标准的缺失。
目前,纸质档案数字化的标准技术规范有待进一步完善,虽然数字转化技术的发展为纸质档案数字提供相应的技术指导,但数字档案管理规范建立配套不完善,缺乏一些详细说明,比如在文件和表格的使用过程中,现有的标准和工作流程相对不够全面,在一定程度上影响档案数字化进程,同时,针对不同类型的纸质档案,相应的收集储存条件以及技术水平是不同的,在纸质档案数字化过程中,由于受到时代条件发展的影响,相应的档案保护和转化国家标准也有待进一步完善,甚至在数字档案馆实践过程中经常出现一些标准不统一的情况。
比如针对档案文件的扫描,如果图像要求更加清晰,扫描仪的分辨率就需要越高,转化后的文件就需要更多的图像空间。
纸质档案数字化规范_DAT_31_2017
目录前言 (3)引言 (5)纸质档案数字化规 (6)1 围 (6)2 规性引用文件 (6)3 术语和定义 (6)4 总则 (7)5.组织与管理 (8)5.1 机构及人员 (8)5.2 基础设施 (9)5.3 工作方案 (9)5.4 管理制度 (10)5.5 工作流程控制 (11)5.6 工作文件管理 (11)5.7 档案数字化外包 (12)6 档案出库 (13)7 数字化前处理 (13)7.1 确定扫描页 (13)7.2 编制页号 (13)7.3 目录数据准备 (14)7.4 拆除装订 (14)7.5 技术修复 (14)8 目录数据库建立 (14)9 档案扫描 (15)9.1 基本要求 (15)9.2 扫描设备 (16)9.3 扫描色彩模式 (16)9.4 扫描分辨率 (17)9.5 存储格式 (17)9.6 图像命名 (18)10 图像处理 (18)10.1 图像拼接 (18)10.2 旋转及纠偏 (18)10.3 裁边 (19)10.4 去污 (19)10.5 图像质量检查 (19)11 数据挂接 (19)12 数字化成果验收与移交 (20)12.1 验收方式 (20)12.2 验收容 (20)12.3 验收指标 (21)12.4 验收结论 (21)12.5 移交 (22)13 档案归还入库 (22)前言本标准按照GB/T 1.1-2009给出的规则起草。
本标准替代DA/T 31-2005《纸质档案数字化技术规》。
本标准与DA/T 31-2005相比,主要技术变化如下:——标题进行了修改;——增强组织与管理部分的容,完善数字化工作中管理相关要求;——增强数字化前处理部分的容,包括对实体档案保护和档案规化管理方面的要求;——增加数字化过程中元数据采集的要求;——修改了档案扫描部分参数要求;——修改了图像处理部分容,更加强调保持档案原貌的要求;——细化了数字化成果验收的容;——删除原标准数据备份和数字化成果管理相关容。
纸质档案数字化技术规范 pdf
纸质档案数字化技术规范 pdf1、档案数字化标准本规范依据以纸质档案[按文书、科技工程图纸]、专门档案[照片、声音、影像、实物等分类] 为主的档案载体分类的行业标准;其中纸制档案数字化标准中详细约定了档案数字化规范标准过程,专门档案的数字化标准过程类同,但是在格式标准上有专门的要求,整个规约参照国标[DA/T313寸的黑白照片,必须选用300dpi 或350dpi 。
文件存储类型:扫描后的照片以TIF 格式存储,保存时必须选用图像选项中的品质为最佳值的大文件,存入到统一的照片数据库。
文件存储方式:档案照片存储时按全宗、目录、相册分级建立文件夹保存,照片名字以照片的档案号命名。
照片命名方法:每一张照片必须定义完全。
包括此张照片的档案号、拍摄时间、组说明或照片的定义内容。
以上注明需在文件名中全部打出。
补充说明无论彩色照片还是黑白照片都采用全彩格式扫描。
扫描仪有光学分辨率和差值分辨率两个常用技术参数,其中光学分辨率反映的是硬件系统确实可以达到的清晰程度,是扫描仪自身性能的反映。
所扫描的照片必须经过图像处理软件进行图片的亮度、色度调整,对扫描的边框进行裁切。
声音档案数字化标准声音档案数字化是指通过硬件设备将声音档案转为数字化数据并加以存储的过程。
声音档案数字化必须保证其真实性、有效性、完整性。
在使用时必须保证数字化数据能从存储介质中正确读取, 并还原成声音信号输出。
同时作为输出的流媒体信号能正常在网络中播放查阅。
基本概念采样频率和样本大小采样频率和样本大小是反映数字化声音档案的精确度高低的两个最基本的参数。
采样频率即每秒钟采集多少个声音样本, 用Hz 或kHz 来表示。
样本大小一般指声音卡的二进制位数,有8位、12位、16位等。
采样频率越高, 声音波形就表达得越精确, 而需要的存储空间就越大。
奈奎斯特理论奈奎斯特理论指出, 采样频率不应低于声音信号最高频率的两倍, 这样就能把数字表达的声音还原成原来的声音。
浅谈纸质档案数字化技术规范及归档要求
浅谈纸质档案数字化技术规范及归档要求摘要:随着社会的不断发展,档案管理模式发生了空前改变,目前我国各个行业为了提高档案管理的可靠性,经常采取纸质档案数字化技术。
而且,保证纸质档案数字化技术顺利实施的关键在于全面落实技术规范和归档要求,减少纸质档案数字化管理过程中出现的问题。
本文主要分析纸质档案数字化技术规范和档案归档过程中出现的问题,并据此提出相应规范要求,借以保证纸质档案数字化得到更好的发展。
关键词:纸质档案;数字化技术;规范要求引言为了保证纸质档案数字化技术全面实施,我国在2005年时颁布《纸质档案数字化技术规范》,该项规范要求纸质档案数字化技术在实施过程中遵循相关行业整体性质,并对数字化技术制定规范性指导,确保数字化技术在纸质档案管理中心有更加广泛的应用。
一、确定纸质档案数字化对象的价值原则一般来说,各个行业内部的档案在进行归档处理的过程中,都要遵循档案永久保管原则,并对社会利用价值高的档案实施数字化技术。
另外,不同行业的档案保管制度也存在差异,因此,保证纸质档案保管合理性的关键在于档案管理人员对本单位行业性质有所了解。
在这个过程中,应对档案数字化工程量、人力物力财力和档案保管周期等方面进行深入分析,按照纸质档案的利用率、原始状况好坏制定数字化加工顺序。
二、纸质档案数字化技术规范及归档现状数字化技术能够有效提升纸质档案管理力度,但是纸质档案数字化技术本身就是一项周期长、操作复杂的任务,因此,在实施纸质档案数字化技术时,需要分步实施这项技术,保证数字化技术在纸质档案管理过程中发挥自身最大的作用。
目前我国制定的相应管理规范能够从一定角度上实现纸质档案数字化技术的安全性和稳定性。
对于纸质档案材料可以采取扫描等方式进行字符识别,与此同时将扫描的字符转换成图形文件,并将图形文件储存在计算机中。
但是我国目前实施的纸质档案数字化技术还有些不足,主要表现在三个方面:(一)数字化标准缺失尽管在实施纸质档案数字化技术时有相应技术指导的参与,但是由于纸质档案管理的规范程度较低,导致纸质档案数字化技术不能有效落实。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
海南省纸质档案数字化技术规范(试行)为规范我省纸质档案数字化工作,提高纸质档案的数字化质量,维护档案实体和档案信息安全,根据《中华人民共和国档案法》和《纸质档案数字化技术规范》(DA/T31-2005)等相关法规标准,制定本规范。
1.范围本规范规定了我省纸质档案数字化的各项要求。
本规范适用于我省各级国家综合档案馆(室)进行纸质档案数字化转换工作。
机关、团体、企事业单位纸质档案的数字化工作可参照执行。
2.术语本规范所称纸质档案数字化是采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。
源版数字副本是指使用扫描仪等数字成像设备对纸质档案进行数字化转换而直接生成的静态图像文件。
源版数字副本的衍生品是指对源版数字副本进行压缩、格式转换、识别等处理而生成的静态图像文件、版式文件或纯文本文件。
3.项目管理3.1 全程管理应对纸质档案数字化项目的准备、扫描、处理、移交接收等阶段实施全程管理,对数字化工作的安全、标准、质量、进度等进行有效控制。
3.2 制定数字化工作方案应对数字化对象基本情况进行调查摸底,以此为基础并根据本规范提出数字化项目管理与技术要求,编制数字化工作方案。
数字化工作方案应包括安全保密措施、项目管理要求、技术标准、工作文档管理要求、数字化成果移交要求等内容。
采取委托加工方式的数字化项目,数字化工作方案应明确数字化成果的计算标准。
3.3 数字化对象审批对纸质档案数字化对象实行审批制。
尤其是委托加工方式的项目,要有档案原件法定持有保管单位的法人或授权代表的签署《纸质档案数字化审批书》(附录A表A1)3.4 数字化工作文档管理应明确纸质档案数字化过程中形成的工作文档的整理、归档、移交等管理要求,并与全宗卷共同保管。
应归档的数字化文档包括:数字化工作方案、档案原件数字化审批书、档案数字化借用档案登记表、数字化工作登记表、纸质档案数字化加工流程单、纸质档案数字化数据质检登记表、纸质档案数字化数据质检验收登记表、纸质档案数字化项目验收移交清单等凭证性文件;采取委托加工方式的数字化项目,还应包括项目招投标文件、中标通知书、项目合同等。
3.5 档案安全管理为保证档案数字化成果是档案原件真实、完整、可靠与可用的复制件,必须在纸质档案数字化过程中实施全程安全管理,各制作环节应有当事责任人的签字,数字化成果按规范要求移交,确保档案原件与档案信息安全。
对进行数字化的档案原件,最大限度减少数字化转换对档案原件可能造成的损伤或形体变化。
未解密的档案不得采取委托加工方式进行数字化。
对采取委托加工方式进行数字化的,对其服务、系统及整体设备,必须对承包单位进行资格审查,并采取使用国产计算机产品、硬盘整体验收移交或低级格式化、加强数字化现场安全管理等措施,防止档案原件数字副本外流。
4.流程管理纸质档案数字化全程共有10个基本流程,包括借卷、拆卷整理、目录著录、档案扫描、图像处理、OCR转换、质检、还原入库、挂接、数字化成果验收移交等。
整个环节管理过程,需填写《纸质档案数字化加工流程单》(附录A 表A4)。
4.1借卷严格按照档案库房管理规定为数字化对象办理借卷手续,案卷逐卷(以件为单位的逐件)清点后出库,重点档案逐页清点出库,并填写《档案数字化借用档案登记表》(附录A表A2)。
4.2 拆卷整理4.2.1档案整理主要包括拆除扫描对象装订线及加固件、平整页面、编制页码、修复老化和破损程度高的页面、登记特殊页面等内容。
平整页面时不得破坏档案原件固有形态,不得强行撕破档案页面。
没有编页码的应重新编号,并统一采用铅笔编号或油墨打号机打号。
已经编有连续并清晰可见页码的,不再重编页码。
案卷内存在页码缺漏现象时,应登记跳号情况,不再重编页码。
一份文件在卷内排列位置不连续,应调整件内页面排列顺序,并就受影响部分重新打号。
卷内存有钱币、邮票、照片、地图、证书等特殊材料的页面时应予以登记。
4.2.2 老化、破损页面先进行修裱,再进行数字化扫描;4.2.3准确区分扫描件与非扫描件。
按要求将同一案卷的档案区分为扫描件和非扫描件,并分别装入临时文件袋中,同时注明清楚。
属同一份文件材料的集中存放,做好标识;无关和重复的文件要放入非扫描件。
在区分的过程要做好《数字化工作登记表》(附录A表A3)登记。
4.3 目录著录按照《档案著录规则》(DA/T18)的要求进行著录,建立案卷级、文件级目录数据库。
数字化之前已经建立了文件级目录数据库的,应在数字化过程中进行核对、确保目录数据准确无误并与纸质档案一一对应。
4.4档案扫描4.4.1 每份文件中,只扫描文件正文、附件等。
草稿、重复件及无关材料不扫描;能反映重要文件起草、修订过程的重要稿本,可作为单独件进行扫描和保存;4.4.2 文件处理传阅单中含有领导重要批示的文件,也须将文件处理传阅单一同扫描;4.4.3 无正文的文件应扫描原底稿;4.4.4 扫描时应摆正档案原件页面,减少图像纠偏造成的质量下降。
采用分幅拼接方式对大幅面档案进行数字化时,应在对应的目录数据中记录图像拼接行为。
无法扫描的大幅纸质档案和实物档案应采用数码相机进行数字化处理。
4.5 图像处理应遵循精确复制的原则实施图像处理。
按照《纸质档案数字化技术规范》(DA/T 31-2005)的要求进行图像处理,保证数字图像清晰、端正。
数字副本应能准确反映档案原件的原始面貌,不得出现原件没有的颜色、变形、马赛克、明显皱纹等影像。
不得去除档案页面原有的纸张褪变斑点、水渍、污点、装订孔等,包括破损、歪斜页边。
4.6 OCR转换在图像处理完成后,使用OCR识别软件将图像转换为文本,识别率要在80%以上;纸质档案内容为手写体、图表等不进行OCR识别。
4.7 质检数据质量检验包括数字图像质检和目录数据质检两个部分。
4.7.1 图像质量检查应按批次数据随机抽检方式进行质检,质检次数不少于两次。
一次质检抽检率不少于20%,二次质检抽检率不少于10%,批次抽检合格率应为100%,否则整批数据打回重新制作或不予验收。
4.7.2 目录数据质量检查采用人工校对或软件自动校对的方式,对目录数据库的建库质量进行检查。
核对著录项目是否完整、著录内容是否规范、准确,发现不合格的数据应按要求进行修改或重录。
4.8 还原入库完成数据质检验收后,应将相应的案卷按原保管形态装卷还原。
对已还原案卷实体进行严格的装卷质检,依据档案数字化借用档案登记表(附录A表A2)、《纸质档案数字化加工流程单》(附录A表A4)等检查是否有缺卷、卷内缺页、页面脱落等情况,应保证原有卷内文件齐全完整,装卷质检合格后入库,并履行还卷入库手续。
4.9挂接4.9.1 汇总挂接档案数字化转换过程中形成的目录数据库与图像数据库,通过质检环节确认为“合格”后,通过离线或在线的方式及时加载到数据服务器端汇总。
通过编制程序或借助相应软件,可实现目录数据对应相关联的数字图像的自动搜索、加入对应的电子地址信息等,实现批量、快速挂接。
4.9.2 数据关联以纸质档案目录数据库为依据,将每一份纸质档案文件扫描所得的一个或多个图像存储为一份图像文件。
将图像文件存储到相应文件夹时,要认真核查每一份图像文件的名称与档案目录数据库中该份文件的档号是否相同,图像文件的页数与档案目录数据库中该份文件的页数是否一致,图像文件的总数与目录数据库中文件的总数是否相同等。
通过每一份图像文件的文件名与档案目录数据库中该份文件的档号的一致性和唯一性,建立起一一对应的关联关系,为实现档案目录数据库与图像文件的批量挂接提供条件。
4.10 数字化成果验收移交4.10.1数字化成果内容与要求一个数字化项目形成的数字化成果至少包括三部分内容。
⑴符合标准化要求的纸质档案数字化成果,至少包括一套档案数字化的图像及其档案目录数据,一套以数字化成果为基础转换的PDF 或双层PDF 格式数字副本、一套TXT 格式数字副本。
源版数字副本画幅数应按实际图像数量计算,统计结果应与扫描页面数量保持一致。
目录库应以DBF或XLS 等通用格式移交,验收移交前应确认数字副本与元数据在数字档案管理系统中能够一一对应并挂接成功。
⑵数字化工作文档。
包括本规范中所述的相关数字化工作文档,应装订成册,封面、封底齐全,标识规范。
⑶存储移交介质。
包括两套移动硬盘和三套光盘。
数字副本存储移交介质应按《电子文件归档光盘技术要求和应用规范》(DA/T38-2008)和《海南省数字档案与数据离线备份介质管理规范(征求意见稿)》的要求制作。
纸质档案原件数字化审批书、数字化工作方案、数字化项目招投标文件、中标通知书、数字化项目合同书等凭证性文件的数字副本应一同存储于授权文件夹中。
⑷数据备份后应在相应的备份介质上做好标签,以便查找和管理。
4.10.2 验收移交应依据数字化工作方案、数字化项目合同书、质检验收单等对数字化项目做整体鉴定、验收,填写《纸质档案数字化项目验收移交清单》(附录A表A7),形成鉴定验收报告,移交数字化成果。
5 技术要求5.1 技术参数制作源版数字副本应采用彩色模式实施数字化扫描。
原则上应采用不低于200dpi 的分辨率、彩色JPEG 格式或彩色TIFF 格式、不高于20%的压缩率等技术参数制作源版数字副本。
珍贵档案源版数字副本的制作,应采用彩色无损压缩TIFF 格式,扫描分辨率不低于300dpi。
5.2 源版数字副本命名规则本规范规定了两种源版数字副本命名规则。
全部数字化对象只需扫描一个稿本时,选用命名规则1;部分数字化对象需扫描多个稿本时,则全部源版数字副本采用命名规则2。
⑴命名规则1。
数字图像名称由两部分构成:文件级档号.件内页面流水号。
示例:一份档号为“S085-001-002-001(档号组成:全宗号-目录号-案卷号-页号)”的文件有3 页,经扫描生成的3 个数字图像的名称分别为:S085-001-002-001.001.JPGS085-001-002-001.002.JPGS085-001-002-001.003.JPG⑵命名规则2。
数字图像名称由三部分构成:文件级档号.稿本代码.稿本内页面流水号。
稿本代码为:Z——正本,D——定稿,C——草稿,G——公文处理单。
示例:一份档号为“S085-2012-1-001(档号组成:全宗号-年度-保管期限-件号)”的文件,公文处理单为1页,正本为2 页、定稿为2 页、草稿为4 页,经扫描生成的9 个数字图像名称分别为:S085-2012-1-001-G01.001.JPGS085-2012-1-001-Z01.001.JPGS085-2012-1-001-Z01.002.JPGS085-2012-1-001-D01.001.JPGS085-2012-1-001-D01.002.JPGS085-2012-1-001-C01.001.JPGS085-2012-1-001-C01.002.JPGS085-2012-1-001-C01.003.JPGS085-2012-1-001-C01.004.JPG5.3 衍生数字副本命名规则⑴ PDF 或双层PDF 格式数字副本命名规则。