都柏林核心元素集

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

都柏林核心元素集

一、简介:

都柏林核心元素集(Dublin Core Element Set,以下简称DC)是一个致力于规范Web资源体系结构的国际性元数据解决方案,它定义了一个所有Web资源

都应遵循的通用的核心标准,其内容较少,也比较通用,因此得到了其他相关标

准的广泛支持。面向其他类型资源的元数据标准,基本上都兼容DC标准,并对

它作了扩展。它已经成为Internet的正式标准RFC2413和美国国家信息标准。

标识中文翻译解释

Title 标题资源的名称。

Creator 创建者资源的创建者

Subject 主题资源的主题内容。

Description 描述资源内容的描述信息。

Publisher 出版者正式发布资源的实体。

Contributor 贡献人资源生存期中做出贡献的实体,除制作者/创作者之外的其他撰稿人和贡

献者,如插图绘制者、编辑等。

Date 日期资源生存周期中的一些重大日期。

Type 类型资源所属的类别,包括种类、体裁、作品级别等描述性术语。

Format 格式资源的物理或数字表现,可包括媒体类型或资源容量,可用于限定资源

显示或操作所需要的软件、硬件或其他设备,容量表示数据所占的空间

大小等。

Identifier 标识符资源的唯一标识,如URI(统一资源标识符)、URL(统一资源定位符)、

DoI(数字对象标识符)、ISBN(国际标准书号)、ISSN(国际标准刊号)

等。

Language 语言资源的语言类型。

Source 来源信息资源的来源。

Relation 关联与其他资源的索引关系,用标识系统来标引参考的相关资源。Coverage 覆盖范围资源应用的范围,包括空间位置(地名或地理坐标)、时代(年代、Et

期或日期范围)或权限范围。

Rights 权限使用资源的权限信息,它包括知识产权、著作权和各种拥有权。如果没

有此项,则表明放弃上述权力。

二、特点:

●简易性

DC只有15个元素,通俗易懂,如题名项不分正题名、副题名还是并列题名等统称为题名即Title;著者项也没有细分第一责任者、其他责任者等而统一用著者即Creator加以标识,使用起来非常简单。都柏林核心希望能够同时为非编目人员及资源描述专家所用,且多数元素的语义都能被普遍理解,这正适应了数字图书馆信息量迅速膨胀,由专业人员进行著录已是不可能的事实。

●通用性

不针对某个特定的学科或领域,支持对任何内容的资源进行描述,这个有助于统一其他内容标准并普遍为人们所了解的描述符集合增加了跨学科的语义互操作性的可能。

●可选择性

著录项目可以简化,只要确保最低限度的7个元素(题名、出版者、形式、类型、标识符、日期和主题)就可以了。

●可重复与可修饰性

其所有元素都可重复使用,解决了多著者与多出版等重复元素的著录问题,对于需要详细著录的资料,引进了DC修饰词。

●国际通用性

获得万维网上资源发现界国际范围的认同,对有效的发现架构之发展非常关键。

●灵活的可扩展性

提供了更加精心制作的描述模型(如MARC编目)以外的经济的选择,既可以嵌入在HTML(RFC2731)中,也可基于XML进行描述,与当今互联网上的相关置标语言标准有很强的亲和性;允许资料以地区性规范出现,并保持元数据的一些特性,从而适应更丰富的资源标准内部的结构和更详细描述的语义编码。三、限定词

基本的都柏林核心集过于简单,但更多的、复杂的应用要求进一步指定元素的语义内容。元素的限定词提供了一种指定语义内容的方法。比如,采用配置限

定词可以指定Subject元素的来源或指定一个认证系统(如ISBN或ISSN)。又比如,在Author元素标签中使用类型(type)限定词可以给出作者的姓名、电子邮件地址和电话号码等。限定词指定的方法还需要进一步完善。都柏林核心集的扩展也可以通过对局部元素的使用进行定义的方法实现。局部元素的名字应以“X-”作为开始标识,这样Web搜索引擎能够很容易地识别或忽略局部扩展名。DC的限定词主要分为三种类型:语言限定(lang),模式(scheme),类型(type)。

四、应用

经过多年的研究发展,DC已能较好地解决网络资源的发现、控制和管理问题,并对当今数字图书馆的研究也很有意义。因此,世界上研究及采纳DC的各种项目已遍及美洲、欧洲、大洋洲、亚洲等地,涉及社会学、政治、图书馆、教育、商业、科学研究等多个领域,DC已被翻译成了泰、日、德、法、葡、丹麦、挪威、芬兰、瑞典等国家的几十种语言。芬兰、丹麦已选用DC作为官方电子资源的描述方式.1998年9月,因特网工程任务组(IETF)也正式接受了DC这一网络资源的描述方式,将其作为一个正式标准予以发布( RFC2413)。

尽管都柏林核心集简便易学,而且它的使用在提高检索准确率方面效果明显。但是,它的利用情况却并不能令满意。据"Web Developer Magazine"统计,因特网上使用了一个都柏林核心集元素( < Title> )的网页,只占21%;国内的网页中使用3 个元数据(Title、Description 和Subject) 的站点只占10%。

相关文档
最新文档