信息资源组织的主题描述语言
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息资源组织的主题描述语言
1.解释下列术语:主题法、标题、单元词、叙词、关键词、
后控制词表、入口词表、搜索引擎、OCLC、MeSH、ILAS。
2.列举标题语言的显著特点并分析其原理。
3.比较字面组配和概念组配。
4.叙词语言如何综合多种标引语言的原理和方法?叙词语言
由此获得了哪些好的性能?
5.简述叙词表的结构体系。
6.试述《汉语主题词表》主题词参照系统的组成。
7.评述关键词语言的性能并分析其原理。
答案:
1 主题法:用语词来表达各种概念,将各种概念不管其相互关系完全按字顺排列。
标题:是主题标目(Subject Heading)的简称,它是直接表达文献主题的标识,大多是对文献内容所论及事物名称及特征的规范表达。
单元词:指一个个最小、最基本的词汇单位,是能够用来描述文献所论及或涉及的事物──主题的那些单词。
叙词:以受控的自然语言词汇作标识,主要以标识的概念组配来表达主题概念的一种后组式主题语言。
关键词:是指那些出现在文献的标题(篇名、章节名)以至摘要、正文中,对描述文献主题内容具有实质意义的语词,亦即对提示和描述文献主题内容来说是重要的、带关键性的(可以作为检索“入口”的)那些语词。
后控制词表:只供检索的主导表,这种词表实际上是一种同义词、近义词和相关词的集合。
入口词表:有的叙词表为了大量收录非叙词,就把非叙词单独编成一表,称为入口词表,其内容包括编表过程中落选的词和标引过程中记录下来的词,每个非叙词都引向正式叙词。
词族索引:它是利用概念的等级关系(概念成族原理)将叙词汇集在一起成为一族,构成一个从泛指叙词到专指叙词的等级系统,可以从一族中外延最广的叙词(族首词)出发,找到一系列同族的叙词,并且可以明确它们之间的层层隶属关系。
范畴索引:它是将叙词按其概念所属学科或范畴分成若干大类,在大类之下再分成若干小类,在小类之下则将叙词按字顺排列,形成一个类似体系分类表的概念分类系统。
搜索引擎:是一种利用网络自动搜索技术,对Internet上各种资源进行标引,并为检索者提供检索的工具。
OCLC:全称(Online Computer Library Center,Inc.),即联机计算机图书馆中心
MeSH:《医学标题表》(Medical Subject Headings)
ILAS:图书馆自动化集成系统
2 标题语言的特点:
①用受控的自然语言语词作标识,直观地表达主题概念,直接地标引文献。
②以字顺序列组织标识,提供直接的主题检索途径。有利于进行特性检索。
③主要用参照系统间接显示标题所表达的主题概念之间的关系,形成语义网络。能为选用标题进行标引和检索提供一定方便。
④按事物集中文献,而不是按学科、专业集中。因此,标题语言适合于从事物出发的检索,不适合于从学科出发的检索,不便族性检索。
⑤提供先组式的主题标识,标识涵义比较明确,选用标识比较容易。但是,多途径检索的可能性较小。
•标引所用的标题不必都是标题表所列举的现成标题。允许必要时自拟标题表达新的或没有列出的主题概念,适应能力较强。
3概念组配与字面组配的区别主要表现在两个方面:
•两者的本质不同
概念组配本质上是在概念分析的基础上进行概念综合。字面组配是利用构词法进行词的分拆和组合,它符合构词规律,但是,不一定符合概念逻辑,字面组配的方法比较简单、直接,但是,对概念的表达时常不够准确。
•两者的词汇单元不同
单元词是字面上不能再分的词汇单元,相对来说,独立表达能力较差。叙词则具有概念特征,尽可能选用能够表达学科或事物的基本概念的语词,不仅收单词,而且收词组,对主题的表达能力较强。
4叙词语言既以单元词语言为直接基础,又综合了多种标引语言的原理和方法,包括:
(1)它保留了单元词法单词组配的基本原理;
(2)采用了组配分类法的概念组配来代替单元词法的字面组配,以及适当采用标题法的预先组配方法(即采用词组),以克服某些词分拆后再组配时产生意义失真的缺点;
(3)采用了标题法对语词进行严格规范化的方法,以保证词与概念的──对应。这是标题法的基本方法之一。单元词法对单元词的规范方法也取自标题法;
(4)采用并进一步完善了标题法的参照系统,采用了体系分类法的基本原理编制叙词分类索引(范畴索引)和等级索引(词族索引),采用了与关键词法类似的方法编制叙词轮排索引,从多方面显示叙词间的相关关系,以保证准确、全面地选用叙词进行标引和检索。
由于叙词语言综合了多种标引语言的原理和方法,并以概念组配为基本原理,因而具有多种有益于标引和检索的特点。
(1)叙词语言所采用的概念组配原理,使其避免了语词字面组配可能产生的概念表达误差,不仅保证了组配语义的准确性,提高查准率,而且也减小了采用复杂句法控制措施的必要性,简化标引和检索。
(2)叙词语言不仅采用了完善的参照系统,而且还使用了多种其它方法显示概念之间的关系,从而增加了查词途径及准确理解和选用叙词的依据,有利于提高查全率和查准率。
(3)灵活的叙词组配,使叙词语言具有较强的概念表达能力,能专指、及时地表达各种复杂、新颖的主题。
(4)叙词语言提供检索同一课题的多条途径,也允许多主题因素检索或增减主题因素进行检索,在检索上有较大的灵活性。
(5)能同时适用于标识单元方式和文献单元方式的检索系统,兼顾手工检索和计算机检索的需要,特别有利于发挥计算机检索系统的优越性。
5 叙词表的结构体系一般由一个主表和若干辅表构成。主表是叙词表的主体,包括的内容最全,对每个叙词的著录也比较完备,所以可独立存在。辅表是为方便叙词表使用而编制的各种辅助索引,包括的内容不全,著录也比较简略,所以不能独立存在。
6 《汉语主题词表》主题词参照系统如图所示:
7关键词语言作为标引语言和检索语言来说,质量比较差,其原因在于:(1)由于关键词法直接采用文献中的自然语词作关键词,对自然语言中大量存在的等同关系词不加规范统一,也不显示等同关系,使相同主题文献常常因作者用词不同而被分排各处且无联系,导致漏检的可能性较大。
(2)关键词法不显示关键词之间的等级关系和相关关系,难以进行族性检索,特性检索的查全率也不高。
(3)为了加速和简化检索工具的编制过程,多限于从文献标题中抽取。由于一些标题对文献内容的表达不充分或不准确,会使关键词检索有一定的漏检或误检。