数据资源元数据分布与收割规范
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
标准草案
文化馆数字资源
元数据分发与收割规范
(草案稿)
目次
目次 (1)
前言 (1)
文化馆数字资源元数据分发与收割规范 (2)
1范围 (2)
2规范性引用文件 (2)
3术语和定义 (2)
4元数据分发与收割规范 (2)
4.1 元数据分发与收割架构 (2)
4.2 元数据分发与收割基础方法 (3)
4.2.1 概述 (3)
4.2.2 GetRecord (3)
4.2.3 Identify (3)
4.2.4 ListIdentifiers (3)
4.2.5 ListMetadataFormats (3)
4.2.6 ListRecords (3)
4.2.7 ListSets (4)
4.3 文化馆元数据核心集 (4)
参考文献 (6)
前言
本标准根据GB/T 1.1-2009 给出的规则起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。本标准由中华人民共和国文化部提出。
本标准由全国文化馆标准化技术委员会(SAC/TC390)归口。
本标准起草单位:文化部全国公共文化发展中心
本标准主要起草人:课题组
文化馆数字资源元数据分发与收割规范
1 范围
本标准规定了文化馆的数字资源元数据分发与收割的基本框架与实施方法。
本标准适用于文化馆数字资源元数据的交互操作。
2 规范性引用文件
无
3 术语和定义
无
4 元数据分发与收割规范
文化馆数字资源元数据分发与收割规范是基于互联网的元数据操作标准,对不同资源和机构的元数据可进行跨库检索与收割。
4.1 元数据分发与收割架构
文化馆数字资源元数据分发与收割规范是一个对立于应用的互操作标准,是数字文化资源元数据的基础互操作构件,元数据分发与收割从技术上遵循以下架构:
图:文化馆数字资源元数据分发与收割架构
底层由收割机与仓库构成,是数据操作层面的技术基础;中间层包括服务提供者与数据提供者,是各类服务与数据提供的抽象层;上层是文化馆数字资源池,是元数据分发收割的服务对象。
国家文化馆
数字资源池 发送OAI-PMH 元数据请求
OAI-PMH 元数据回应 服务提供者
收割机 数据提供者 仓库
抽象层
操作层 省文化馆 数字资源池
4.2 元数据分发与收割基础方法
4.2.1 概述
文化馆数字文化资源元数据分发与收割互操作包括6个命令动词:
——GetRecord;
——Identify;
——ListIdentifiers;
——ListMetadataFormats;
——ListRecords;
——ListSets。
4.2.2 GetRecord
用于检索仓储中一个单独的条目的所有符合系统指定的元数据格式的元数据信息。
可调用参数:
——Identifier:可选参数,指定条目的唯一标识。如果调用该参数则返回仓储中与该标识匹配的条目的详细信息。
——metadataPrefix:必选参数,返回与metadataPrefix指定的元数据格式匹配的元数据信息。
4.2.3 Identify
用于检索有关仓储的信息,返回系统的基地址,接口的版本,系统管理员邮箱,系统建立时间,是否包含删除信息以及日期参数的格式。
4.2.4 ListIdentifiers
用于返回动词ListRecords请求返回信息的头部(headers)信息,包括所有符合参数条件的条目的唯一标识和建立时间。
可调用参数:
——from:格式为YYYY-MM-DD的可选参数,指定了获取信息的建立时间的下限。当不使用该参数时,系统默认将时间下限设置为系统建立时间。
——until:格式为YYYY-MM-DD的可选参数,指定了获取信息的建立时间的上限。当不使用该参数时,系统默认将时间上限设置为当
——metadataPrefix:在不使用resumptionToken的情况下为必选参数,返回与metadataPrefix指定的元数据格式匹配的元数据信息。
——resumptionToken:独立存在的参数,不能与from,until和metadataPrefix同时使用,其值是由前一个Listldentifiers 请求返回的流控制标志的值,用于处理一个不完整列表。
4.2.5 ListMetadataFormats
用于检索仓储中可获取的元数据格式。
可调用参数:
——Identifier:可选参数,指定条目的唯一标识。如果调用该参数则返回仓储中与该标识匹配的元数据格式,否则返回仓储中所支持的所有的元数据格式。
4.2.6 ListRecords
用于从仓储中去所有符合参数条件的条目的详细信息,包括:
——条目唯一标识(在节点identifier中);
——条目建立时间(在节点datestamp中);
——条目标题及别名(在节点dc:title中),dc:title可能有多个,第一个是条目的标题,后面的都是该条目的别名;
——条目类别(dc:type),dc:type可能有多个,第一个表明条目的总分类,irsr中的信息总体分为资源(collection),机构(org),服务(service)三类,后面的为条目在总分类下的具体分类。
——条目语言(dc:language);
——条目描述(dc:description);
——条目格式(dc:format);
——条目主题(dc:subject);
——条目源地址(dc:creator);
——条目版权及调用申明(dc:rights)。
可调用参数:
——from:格式为YYYY-MM-DD的可选参数,指定了获取信息的建立时间的下限。当不使用该参数时,系统默认将时间下限设置为系统建立时间。
——until:格式为YYYY-MM-DD的可选参数,指定了获取信息的建立时间的上限。当不使用该参数时,系统默认将时间上限设置为当
——metadataPrefix:在不使用resumptionToken的情况下为必选参数,返回与metadataPrefix指定的元数据格式匹配的元数据信息。
——resumptionToken:独立存在的参数,不能与from,until和metadataPrefix同时使用,其值是由前一个Listldentifiers 请求返回的流控制标志的值,用于处理一个不完整列表。
4.2.7 ListSets
用于返回仓库的集合结构(set structure),有利于选择性获取。
4.3 文化馆元数据核心集
文化馆数字资源元数据核心集是全国文化馆数字资源的通用描述方法,是文化馆数字资源元数据管理的基础。
文化馆数字资源元数据核心集包括以下14个核心元素:
1)名称
资源对象正式公开的名称。
2)创作者
创建者的实例包括个人,组织或某项服务。
3)主题
采用关键词、关键字短语或从受控词表或规范的分类体系中取值。
4)描述
资源的说明或摘要。
5)出版者
出版者的名称,包括组织,或机构。
6)其他责任者
其他责任者名称,包括个人、组织或机构。