学位论文描述元数据规范.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
学位论文描述元数据规范
1.编写说明(略)
2 著录对象分析
2.1 著录对象的界定
学位论文是学生为了获取学位向学校或其他学术单位提交的学术研究论文。
2.2 著录对象之间的关系
学位论文从其载体形态上来分,有印刷本的和数字化的学位论文。数字化的学位论文的产生方式有两种:由学生通过远程提交系统提交的论文和由印刷本论文扫描而形成的数字化论文。在学生创作学位论文时,还有一些与学位论文内容相关而又脱离论文主体的附加材料,例如:实验数据、实验报告、多媒体、音频、视频、动画、软件系统等“附加资源”,学生通过远程提交系统提交论文为收集这些“附加资源”提供了可能。
学位论文元数据规范的著录对象包括两种载体形式的论文的著录,以及与论文相关的“附加资源”的著录。
2.3 著录单位
学位论文的著录单位,是以单篇学位论文实体为主,不深入到资源的内部,如某一章节、某幅图表等。单篇学位论文实体,是一个集成的概念,包括电子版和印刷版两种不同版本,还包括与本论文相关的实验数据、实验报告、多媒体、音频、视频、动画、软件系统等“附加资源”。在电子版和印刷版同时存在的情况下,以电子版的特征为主著录,涉及到印刷本的特性,需要从印刷本中提取著录项。例如:由于版权和其他应用环境等问题的限制,用户在网络上不能获得电子版论文的情况下,可到指定的馆藏地阅览其相应的印刷本,这样有关印刷本的馆藏地点(即馆藏号)需要著录。在只有电子版学位论文的情况下,从电子版论文提取著录项。在只有印刷版的情况下,从印刷版论文中提取著录项。
学位论文的著录要点是论文的题名、主题、文摘、作者、导师、学位、学位的授予单位、学科专业、资源类型、网址、馆藏地以及权限管理等。因为它们是提供用户发现、评价、选择和获取该论文的重要因素、也是我们创建该资源的目的所在。
2.4 关于“附加资源”的著录
“附加资源”指与学位论文内容相关而又脱离论文主体的附加材料,例如:实验数据、实验报告、多媒体、音频、视频、动画、软件系统等资源。“附加资源”是学位论文的重要组成部分,对“附加资源”的著录可根据需要选择简单著录或详细著录,若采用简单著录,可著录于附注元素的元素修饰词“相关文献附注”项中。若需要详细著录,可先在“相关文献附注”项做简要说明,然后再在“相关文献(Relation)”元素的元素修饰词“附加资源关联(RelationAdditionResource)”项中作详细描述,例如以“附加资源”的题名、唯一标识等予以具体描述。
3 元数据结构
依据《专门数字对象描述元数据规范设计指南》,学位论文描述型元数据由核心元素、论文系列核心元素、个别元素组成。
3.1 核心元素
核心元素是指能在各类资源对象中通用,可以在该层上与其它系统进行交换,支持通用的检索工具的元素,为表达方便起见,我们称之为“通用级核心”。学位论文元数据复用Dublin Core(DC)的12 个元素作为通用级核心元素。它们分别是:题名、作者、主题、附注、导师、日期、资源类型、资源格式、资源标识、语种、相关文献与权限管理。
3.2 论文系列核心元素
论文系列核心元素是指能在论文系列类型数字资源(包括学位论文、期刊论文、会议论文)中通用的元素,在这里我们称之为“系列级核心”。由于论文系列资源类型核心元素采用“通用级核心”元素即可满足,故论文系列资源类型不再另设“系列级核心”元素。3.3 个别元素
学位论文个别元素是指仅适用于描述学位论文资源对象,不一定支持交换的元素。学位论文的个别元素有2 个:学位和馆藏信息。
3.4 元数据列表:
4 各机构应用时的扩展规则
学位论文元数据的扩展规则遵循《专门数字对象描述元数据规范设计指南》中的扩展规则,各机构应用时,应最大可能采用本元数据规范推荐的元素项,并在语义上严格保持一致。对标准中不能描述的特性,可使用横向扩展规则和纵向扩展规则:
4.1 横向扩展规则
学位论文元数据的横向扩展规则应遵守核心元素、资源类型核心元素、个别元素的结构组成;应最大可能采用核心元素集推荐的元数据项,并在语义上保持严格一致;对推荐的元素不能描述的特性可以增加元素,但新增加元素不能与已有元素有任何语义上的重复。
4.2 纵向扩展规则
学位论文元数据的纵向扩展规则:为了更为准确地描述对象,可以使用修饰词的方式向下扩展一层。
修饰词有两种:
a)元素修饰词(element refinement),是对元素的语义进行修饰,提高元素的专指性和精确性。
b)编码体系修饰词(encoding scheme),包括控制词表和正规的符号或者解读方式。
如有必要对元素的语义进行更进一步限定时,建议尽可能使用DCMI 制定的修饰词(详见:/documents/2000/07/11/dcmes-qualifiers/index.shtml),以及各个应用方案中的修饰词,例如dc -education ,dc -lib (/documents/library-application-profile/index.shtml)。复用时要严格遵守其语义。
尽可能遵循dumb-down(向上兼容)原则,增加的修饰词的语义不能超出被修饰词(元素)的语义,修饰词只是对未修饰词的含义范围做了进一步的限定。
如果复用来自其他元数据标准的元素或修饰词,要求必须说明来源,使用时严格遵守其语义。
自行制订的修饰词必须遵循Dumb-Down(向上兼容)原则。也即是修饰词的语义包含于相应的未限定元素中,在范围上对未限定元素的语义进行限定,在深度上对未限定元素的语义进行延伸。对于不具备修饰词知识的用户而言,修饰词可以象未限定元素一样来使用。
5 元素定义
借鉴ISO/IEC 11179 标准,按以下12 个方面定义元素和元素修饰词:
1)名称(Name):元素/修饰词的名称
2)统一资源标识符(URI):元素的唯一标识符。(名称空间待定)
3)标签(Label):关于元素/修饰词的可读的标签。其英文标签在此定义。
4)版本(Version):产生该元素或修饰词的元数据规范版本
5)注册机构(RegistrationAuthority):注册元素/修饰词的授权机构
6)语言(Language):元素说明语言
7)定义(Definition):对元素概念与内涵的说明
8)术语类型(Type of Term):术语的类型。其值为:元素、元素修饰词和编码体系修饰词。9)数据类型(Datatype):元素值中所表现的数据类型
10)频次范围(Occurence):术语使用的频次范围。采用区间的表示方法:[min,max],同时包括了对必备性和最大使用频率的定义。min=0 表示可选; min=1表示必须; max=10 表示最大使用频率为10 次; max=∞表示最大使用频率没有限制.
11)修饰(Qualifies):在定义元素修饰词或编码体系修饰词时,需要明确指出该术语修饰的元素。
12)注释(Comment):元素应用注释。用于说明元素可以扩展的修饰词、或者修饰词修饰的元素等情况。
对于不同的元素和元素修饰词,上述十二个属性中,有 5 个属性是相同的,可以做如下固定取值:
1)版本:
2)语言:缺省为中文
3)注册机构:
4)数据类型:字符串
5)频次范围:不限,为[0, ∞]
以下元素和元素修饰词的定义省略了这 5 个相同的属性。
5.1 题名
名称(Name):题名
统一资源标识符(URI):(名称空间待定)
标签(Label):Title
定义(Definition):同DC 定义,由创建者赋予资源的名称;这里指论文作者赋予论文的名称。
术语类型(Type of Term):元素
修饰(Qualifies):无
注释(Comment):
5.1.1 交替题名
名称(Name):交替题名
统一资源标识符(URI):
标签(Label):Alternative
定义(Definition):正题名之外的其它题名
术语类型(Type of Term):元素修饰词
修饰(Qualifies):题名
注释(Comment):学位论文的缩略题名或译名等