元数据_基础知识
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
元数据
一、定义
元数据(Metadata)是关于数据的数据。它是用于描述信息资源的高度结构化数据。
元数据在数据生产过程中或完成后建立的。
二、功能
元数据是数据与数据用户之间的桥梁
1.支持资源发现
2.组织数字信息资源
3.支持资源的互操作
4.支持数字识别
5.支持存档和保存
三、分类
1. 按功能分
描述性元数据:与事物本质有关的元数据。
管理性元数据:与事物处理方式有关的元数据。包括权限管理、防伪管理、存储和使用管理。
技术性元数据
保存性元数据
使用性元数据
2.按复杂程度分
采用简单的记录格式
结构化的格式
复杂格式
3.按描述的资源类型分
网络资源:Dublin Core、IAFA Template、CDF、Web Collections
文献资料:MARC(with 856 Field),Dublic Core
人文科学:TEI Header
社会科学数据集:ICPSR SGML Codebook
博物馆与艺术作品:CIMI、CDWA、RLG REACH Element Set、VRA Core
政府信息:GILS
地理空间信息:FGDC/CSDGM
数字图像:MOA2 metadata、CDL metadata、Open Archives Format、VRA Core、NISO/CLIR/RLG Technical Metadata for Images
档案库与资源集合:EAD
技术报告:RFC 1807
连续图像:MPEG-7
四、结构
1.内容结构(数据元/字段/数据项)
定义元数据的构成元素,可包括描述性元素、技术性元素、管理性元素和结构性元素。
这些构成元素要满足元数据的功能要求,因此,往往与元数据的功能相对应。
当某个元素来自某个外部标准时,要在内容结构中对此说明。
2.句法结构(元数据实体/数据表/数据结构)
定义元数据内元素之间的相互关系(例如,树状结构)。
定义元数据的格式及其描述方式。包括:
(1)元素的分区分段组织
(2)元素选取使用规则
(3)元素描述方法(如Dublin Core采用ISO/IEC 11179标准)
(4)元素结构描述方法(如MARC记录结构、SGML结构、XML结构)
(5)结构语句描述语言(EBNF Notation)
3.语义结构
定义元素的具体描述方法,体现元数据的语义特征。例如描述元素时所采用的标准、遵循的描述规范或自定义的描述要求。
有些元数据方案本身定义了语义结构,有些则由应用该数据方案的具体单位来定义。
五、层次
1.数据元(字段)
元数据的基本单元。
2.元数据实体(数据表)
一组说明数据相关特性的数据元。
3.元数据子集(数据表)
元数据的子集合,由相关的元数据实体和数据元组成。
由相关的元数据实体和数据元组成的可标识集合,可以是可以是逻辑上或物理上的数据库,也可以是一个文件(如文本文件、图像文件、视频文件等)或文件的集合。
六、元数据字典
采用表格方式描述数据元和元数据实体。
七、元数据标准
对每一个元数据的相关属性进行规范化的说明,称为建立元数据标准。
八、元数据库
元数据库是按照数据结构来组织、存储和管理元数据的数据库。
元数据库是存储和管理元数据的一种特定数据库。
元数据库基本结构与数据库差不多。
九、元数据库管理
元数据库管理模块是一个C/S模式(也可以是B/S模式)的应用,由具有XML存储管理功能的关系型数据库管理系统作为服务器端,通过具有元数据库管理操作功能的客户端应用实现元数据库管理的各项功能,其主要功能包括:
(1) 元数据库创建
元数据库管理模块是将元数据记录存储在关系数据库中,为用户提供建立元数据库的功能。同时,该模块需要支持多个元数据标准及其元数据记录的存储。
(2) 元数据库管理
元数据库管理模块主要是管理元数据,支持元数据信息的网络发布,这要求该模块具有较高效率的数据索引。针对这一要求,模块应采用具有较高效率的静态索引算法对元数据记录进行索引。通过定义数据库的可索引域,将数据库索引至不同的元素字段,较好地适应查全率和查准率的要求。
元数据库管理具有元数据库建立、导入、导出、删除、备份功能,并且具备支持元数据记录的标准一致性和内容正确性验证功能。
(3) 元数据库配置管理
可同时管理多个待发布的元数据库,包括元数据库地址信息配置等多项功能。
十、元数据采集
1.元数据采集方法
2.元数据采集要求
3.
十一、数据采集质量控制
十二、数据管理与应用功能