元数据标准
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
电子文件元数据标准
(征求意见稿)
1.范围
本标准适用于各级机关、团体、企事业单位、社会组织。本标准规定了电子文件元数据的结构、定义、编码体系。
本标准描述的数字对象为通用的电子文件核心元数据,主要为原生电子文件与数字化文件(文本、图像)元数据。根据发展需要,扩展编制图形、影像、声音等文件类型的元数据标准。
2.编制目的
对文件及相关实体进行标准化描述;
实现不同机构、不同系统之间文件及信息的互操作;
为电子文件在不同时间、不同空间、不同应用软件中的再利用提供统一的元数据;
为电子政务、办公自动化、电子文件中心、文档管理、档案管理等系统提供成熟的电子文件全过程管理的设计模式。
3.规范性引用文件
下列文件中的条款,通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。
GB/T 2659-2000 世界各国和地区名称代码
GB/T 2260-2002 中华人民共和国行政区划代码
GB/T 11714-1997 全国组织机构代码编制规则
GB/T 9704-1999 国家行政机关代码编制规则
GB 2312-1980 信息交换用汉字编码字符集基本集
GB/T 4880-1991 语种名称代码
GB/T 语种名称代码第2部分:3字母代码
GB/T 4881-1985 中国语种代码
GB/T 文献著录总则
GB/T 13959-1992 文件格式与代码编制方法
GB/T 15418-1994 档案分类标引规则
GB/T 3760-1995 文献叙词标引规则
GB/T 9704-1999 国家行政机关公文格式
GB 18030-2000 信息技术信息交换用汉字编码字符集基本集的扩充
GB/T 18894-2002 电子文件归档与管理规范
GB/T 7156-2003 文献保密等级代码
GB/T 19667 基于XML电子公文格式规范
DA/T12-1994 全宗卷规范
DA/T13-1994 档号编制规则
DA/T18-1999 档案著录规则
DA/T 19-1999 档案主题标引规则
DA/T 22-2000 归档文件整理规则
DA/T 1-2000 档案工作基本术语
中办发[1996]14号中国共产党机关公文处理条例
国发﹝2000﹞23号关于发布《国家行政机关公文处理办法》的通知
国档发[1987]4号关于颁发《编制全国档案馆名称代码实施细则》的通知ISO15489 信息与文件—文件管理
ISO23081-1 信息与文献—文件管理流程—文件元数据-总则
ISO23081-2 信息与文献—文件管理流程—文件元数据-概念与实施问题ISO14721 空间数据和传输系统—开放档案信息系统—参考模型
ISO11179 信息技术--元数据元素的规范与标准化
ISAD(G)档案著录规则(总则)
W3C Namespaces in XML XML的命名空间(Namespaces)
4.术语与定义
下列术语和定义适用于本标准。
4.1通用术语
4.1.1业务系统Business system
将硬件、软件、信息或服务、政策、程序、人有机地组合在一起,实现对机构业务信息的保存、整理和提供。如:电子政务系统、办公自动化系统等。
4.1.2电子文件管理系统 Electronic Records Manage System (ERMS)
为了满足业务对电子文件管理需要而设计的系统,用以捕获、保存、提供获取业务处理过程中产生的有证据价值的文件的功能。电子文件管理系统包括:档案工作者和文件使用者;授权政策、责任分配、权力授予、程序和做法;政策声明、程序手册、用户指南和其他用以批准和颁布政策的文件、程序和做法;文件本身;控制和记录的专门资料和文件系统;软件、硬件、其它设备、必要工具等。
4.1.3实体Entity
指过去、现在和将来存在的任何具体或抽象的事物以及它们之间的联系。比如:人、物体、事件、想法、过程等等。
4.1.4文件实体Record entity
在处理公务或事务过程中,由团体或个人形成或接收和保存的任何形式或载体的记录信息。可以是单份文件,也可以是文件的集合。
4.1.5责任者实体Agent entity
对文件的信息内容负有责任的个人或团体。
4.1.6业务实体Business entity
指业务过程中对文件进行处理与管理的一系列活动。
4.1.7关系实体Relationship entity
描述文件、责任者、业务等实体自身、相互关系及这种关系的背景信息实体。
4.1.8电子文件元数据Electronic Records Metadata
描述电子文件内容、背景和结构信息及整个管理流程的数据。
4.1.9元数据集Metadata schema
规定和描述标准元数据集元素以及元素间相互关系的框架。语句集为元数据元素提供正式的结构(句法)和语义(定义)。
4.1.10元数据结构Metadata structures
元数据集由一系列的元素组成,元素之间的相互关系形成了元数据的结构。元数据结构体现元数据扩展的方法与机制。元数据抽象模型的建立对其元素的扩展与整个元数据方案的规范具有参考作用。
4.1.11元数据语义Metadata Semantic
元数据的本质是描述对象的各种属性及相关关系等内容,每一个元素的语义明确定义了其含义、内涵与外延。语义定义是一个元数据规范的基本要素,也是元数据应用与元数据互操作的最重要的基础。
4.1.12元数据句法Metadata syntax
句法的问题即是一个形式化描述的问题,元数据集所有语义与结构及描述的内容以计算机可读或人可读的形式化方法描述出来。从标准、开放、互操作角度,采用标识语言对元数据集进行描述。本标准采用XML语言对元数据集进行描述。
4.1.13编码体系 Encoding Scheme
编码体系有助于对元素修饰词值的理解。这类体系包括控制词表及正规的符号或解读方式。值的表示采用来自控制词表的标记符号(如分类体系或主题词表的术语)或者具有特定含义,或以一定形式组成的字符串。
4.1.14信息总体 Information Package
电子文件与其元数据可以分开保存,也可以被封装在一起保存,后者称为电子文件信息总体。