文献检索语言-PPT优选版
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
叙词语言的特点
• 叙词语言吸收了其他检索语言的优点,并加以改进。 例如,叙词语言吸收了体系分类语言的等级关系, 编制了词族表,吸收了标题词语言的规范化处理方 法和参照系统,达到了一词一义,发展了词与词之 间的逻辑关系 ,形成语义网络,编制了叙词表; 与单元词语言的组配原理,并取代了单元词语言; 吸收了关键词语言的轮排方法,编制了各种叙词索 引。因而,叙词语言在直观性、单义性、专指性、 组配性、多维检索性、网络、语义关联性、手检与 机检的兼容性、符合现代科技发展的适应性诸方面, 都较其他检索语言更加完善和优越。
标题词语言的特点
• 标题词表中的主、副标题词已事先固定组配, 标引和检索时,只能选用已“定型”的标题 词作为标引词和检索词,所反映的主题概念 必然受到限制。尤其是代表现代科技主题的 内涵与外延越来越复杂,几乎不可能用一对 主、副标题词完全 、确切地表达出来,就需 要补充其他的主、副标题词,结果不仅增加 了标引和检索的工作量,而且还降低了标引 和检索的准确性,直接影响到检索系统存储 和检索的质量和效率 。
单元词语言
单元词语言是以单元词作为文献内容标识检索 的语言。
单元词又称元词,是指从文献中抽取出来的, 能够表达文献主题的、不能再分的经规范化 处理的最小最基本的词汇单位,是主题词的 一种,是一种规范化的后组式检索语言。
特点:单元词具有相对独立性,词与词之间没 有隶属关系和固定组合关系,检索时根据需 要进行组配。由于单元词的专指度较低,词 间无语义关系,对查准率有较大的影响,现 已被叙词语言取代。
文献检索语言-1
§2.6.2 文献检索语言的功能
2. 检索语言的功能 ① 标引功能。 ② 集中相关文献信息的功能。
③ 组织功能。 ④ 匹配功能。 3. 检索语言的分类 ⑴ 按结构原理划分:① 分类检索语言 ② 主题检索
语言 ③代码检索语言 ④ 引文检索语言。 ⑵ 按组配形式划分:① 先组式语言② 后组式语言。 ⑶ 按照表达文献的特征分:① 表述文献外表特征的
检索语言分类-2
主题检索语言
是指采用描述文献主题的语词标识并按字 顺序列排检的检索语言。
按主题词性质的不同又分为:
➢ 标题词语言 ➢ 单元词语言
标题词语言
➢ 叙词语言
单元词语言
➢ 关键词语言
叙词语言
关键词语言
标题词语言
标题词是从自然语言中选取的、经过规范化 处理的、表示事物概念的词、词组或短语
标题词表:将标题词按字母顺序编制的词表 如Ei所用的《工程标题词表》(Subject Headings for Engineering, SHE); 《 国会图书馆标题词表》(Library of Congress Subject Headings, LCSH)
检索语言。② 表述文献内容特征的检索语言。
2.《中国图书馆图书分类法》22大类:
T 工业技术又分为16个二级类
体系分类法的特点
• 优点 : (1). 分类体系语言能较好地体现学科的系统性,反映事物 的平行、隶属和派生的关系,适合人们认识事物的习 惯,有利于从学科或专业的角度进行族性检索,能达到 较高的查全率。 (2). 采用国际上广泛使用的拉丁字母和阿拉伯数字作为概念 标识的分类号,比较简明,便于组织目录系统。
(iii)叙词的语义性 语义关系主要有同义关系、属分关系和相关关系。叙词
语言对语义关系的揭示方法,主要通过各种语义参照符号来 反映和联系。
铃薯), 杜鹃(动物)、杜鹃(植物) ② 集中相关文献信息的功能。 ② 表述文献内容特征的检索语言。 学技术交叉渗透而产生的多维性知识空间,对检索结果 如Ei所用的《工程标题词表》(Subject Headings for Engineering, SHE);《 国会图书馆标题词表》(Library of Congress Subject Headings, LCSH) 由于单元词的专指度较低,词间无语义关系,对查准率有较大的影响,现已被叙词语言取代。 ⑵ 按组配形式划分:① 先组式语言② 后组式语言。 概念删除组配 计算机﹣模拟计算机=数字计算机 由于单元词的专指度较低,词间无语义关系,对查准率有较大的影响,现已被叙词语言取代。 题外关键词索引(Keyword Out Contex Index)。 ② 倒查法:根据检索课题分析所得出的年代要求,由近及远的时间顺序逐卷逐期查找的方法。 选择规范化主题词的注意事项 (iii)叙词的语义性 概念删除组配 计算机﹣模拟计算机=数字计算机 与单元词语言的组配原理,并取代了单元词语言; 按主题词性质的不同又分为: 尤其是代表现代科技主题的内涵与外延越来越复杂,几乎不可能用一对主、副标题词完全 、确切地表达出来,就需要补充其他的主、 副标题词,结果不仅增加了标引和检索的工作量,而且还降低了标引和检索的准确性,直接影响到检索系统存储和检索的质量和效率 。 惯,有利于从学科或专业的角度进行族性检索,能达到
叙词语言
叙词语言是以叙词作为文献内容标识和检索的主题语 言。
叙词又称为描述词或叙述词,是以概念为基础,经过 优选和规范化处理并具有概念组配和词语和词间语 义关系显示功能,用以表达文献主题和检索需求的 语词,也是主题词的一种。
通常使用的叙词表有:国内《汉语主题词表》,英国 《科学文摘》使用的《INSPEC Thesaurus》, 《工 程索引》使用的《Ei Thesaurus》等等。 《 INSPEC Thesaurus》由叙词主表和词族表组成
叙词语言的基本特性表现为:
• (i)叙词语言的概念组配性 概念相交组配。 “汽车部件*发动机=汽车发动机”。 概念限定组配。电视机*数字化=数字电视机。 概念并列组配。环境污染+环境保护= 概念删除组配 计算机﹣模拟计算机=数字计算机
(ii)叙词的规范性 词义规范(计算机与电脑),(实验与试验),(土豆与马 铃薯), 杜鹃(动物)、杜鹃(植物) 词类规范。具有实质意义的名词或动名词 词形规范。即对词的繁简体、词序、字母符号等做出规定
• 缺点: (1). 体系分类表具有相对稳定性,难以随时增设新兴学科的 类目,不能及时反映新学科、新技术、新理论方面的信 息,对检索结果的查全率和查准率有一定的影响。 (2). 体系分类表属直线性序列和层垒制结构,难以反映因科 学技术交叉渗透而产生的多维性知识空间,对检索结果 的查全率带来了一定的影响。