历届Dublin Core元数据年会取得的主要进展
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
历届Dublin Core元数据年会取得的主要进展
DC-1
1995年3月1-3日,第一届元数据研讨会在美国俄亥俄州的Dublin召开。大会的目的旨在确定所研究的问题的范围,即是否只要一个简单的元数据元素集就能对网上的各种主题资源进行描述,会议为进一步发展描述电子资源的元数据元素的定义打下基础。这届研讨会最主要的成果是设定了一个包含十三个元素的都柏林核心元素集:Dublin Core(或简称为都柏林核心DC)。都柏林核心是在网络环境如因特网中,帮助发现文件类对象(DLO)所需要的最小元数据元素集。而它的结构句法问题则作为一个执行细节没有进行详细说明。DC-1所定义的13个元素:Subject: 主题、Title: 题名、Author: 作者、Publisher: 出版者、
OtherAgent: 相关责任者、Date: 出版日期、ObjectType: 对象类型、Form: 格式、Identifier: 标识、Relation:关联、Source: 来源、
Language: 语种、Coverage: 覆盖范围。
会议还指出了指导元数据发展的原则,这些原则在很大程度上影响了DC元数据的未来形态,为DC的未来发展定下了基调。
●“简单性原则”要求定义一个能得到最广泛应用、被全球所理解和接受
的最小元素集,并能作为特殊用户详细描述需求的一个核心集。
●“易用性原则”要求能方便作者和信息提供者描述自己的文档,而不给
他们增加太多的负担,并能方便地实现资源发现工具之间的互操作性。
●“内在性(intrinsicality)原则”指DC元数据以揭示描述对象自身的内容属
性为主,外部属性为辅。
●“可扩展性原则”希望DC成为一个“核心”元素集合而可以通过各种
方式扩展为适应各领域资源描述需要的元数据方案。
●“句法独立(syntax independence)原则”指DC元数据的元素可以以多种
方式编码,应用于各类技术平台中。DC只规定元素的基本语义。
●“可选择性”指DC元素集合中的任何元素都是可选的。
●“可重复性”指DC元素集合中的任何元素都是可重复的。
●“可修改性”指在具体应用中可以对DC元素集中的任何元素进行进一
步“修饰”或“限定”,但不能扩大或改变元素的基本语义。
确定将来的发展方向:扩展对象类型,扩大功能范围,建立标准的扩展机制,继续优化已有成果。伴随着这些原则将出现这些可能:核心元素集越小越好,且能被大多数用户所理解,元素集能灵活地描述广泛的主题区域内的资源。
DC-2
第二届元数据研讨会于1996年4月1-3日在英国的Warwick召开。它旨在扩大
第一届元数据研讨会的影响。会议的目标之一是明确成功应用INTERNET资源描述格式尚存在哪些障碍,大家认为需要在下述四个方面获得实质性进展:定义应用语法;开发用户指南;明确扩展机制;定义一个可兼容多种不同元数据的框架。这次会议的最主要的成果既是后来被称之为“Warwick框架”的元数据结构的概念基础。这个框架和Meta Content框架,成为了资源描述框架RDF发展的基础。Warwick框架即是这样的一种容器——包型的结构。这一结构具有下述特征:①模块化,可包含不同类型的元数据对象;②扩展性,可纳入新的元数据类型;③分布式,可参引外部的元数据对象;④嵌套型,可将元数据对象视为具有与之联系的元数据结构的信息内容。
DC-3
1996年9月24-25日,在美国的俄亥俄州的Dublin 组织了第三届元数据研讨会。会议专门围绕在网络环境中描述图像和图像数据库的问题进行了讨论。在第三次元数据会议中对DC的几个元素进行了修改,以使它们不至于以文本为中心。另外还在原来十三个元素的基础上又新增加了两个元素:Description和Rights Management。
Description与Subject现在成为了两个独立的元素,因为图像专家认为它们对于图像来说是两个截然不同的概念。这样,Subject将包括关键字,控制词
条和正式分类指定标准。而Description则用于图像方面的描述性文字或内容描述,并包括文本文件下的摘要。
权限管理字段被认为是一个核心描述记录的必要组成部分。它对于图象描述极其重要,因此如果不包括这一元素将阻碍DC在图像领域的广泛应用。
DC-4
1997年3月3-5日,第四届元数据会议在澳大利亚首都堪培拉召开。会议涉及了DC应用的一个根本性问题:如何扩展。讨论扩展问题立刻遇到了分歧:DC是
否可以增加、以及如何增加新的元素?这次会上两派意见的交锋得到了显性化:最小主义(Minimalists)学派坚持简单性原则,强调必须尽可能保持DC“核心”的“纯洁性”;结构主义学派(Structuralists)则认为必须要有一定的限定和修饰才能在应用中得到广泛的采用。
会议的一大成果就是提出了三类“堪培拉限定词”,即对DC元数据元素可以从取值的语种(Language)、模式体系(Scheme)和进一步修饰元素的属性类型(Type)三个方面进行限定或扩展。语种指元素取值描述字段的语言,而不是资源本身所使用的语言;模式体系用来确定元素值遵从的某个体系结构中的合法值,如分类表、主题词、各类代码表以及日期表达方法等;Type是争议最大的一类限定,从名称上也很让人混淆,似乎称为“子元素”更合适一些。它是指给定字段的一个方面,用途是缩小字段的语义范围,提高精度、丰富语义。
堪培拉会议根据扩展需求提出了DC元数据的另一个版本:“修饰版”(或称“限定版”)DC,对DC元数据采用HTML进行编码提出了一些指南性的意见。这次会议对于DC的应用起到了相当大的作用。
DC-5
1997年10月,在芬兰首都赫尔辛基召开了第五次元数据会议。这次会议的成果被概括为“芬兰终结(Finnish Finish)”,Finnish Finish将成为第一个DC正式标