3-3主题检索语言

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
轮排索引:利用字面成族的原理,将含有相同单词的词组叙词 汇集在一起,排列在该单词之下,可以从它出发查到任何含有 该单词的词组叙词。
双语种对照索引:提供从另一种语言字顺入手查词的途径,有 助于选准不同语言的叙词。
11
2、4 Keyword indexing
键词法是指以键词作为检索标识的文献标引与检索的方法。键词, 是指从文献题名、文摘或文章中直接选取的表示文献主要内容, 具有实际检索意义的单词或词组。
标题词表:一般由编制说明和主词表等部分构成,主表按主标题 词字顺排序,在同一主标题词下再将与之有关的副标题词逐一排 列。用see和see also显示标题词之间的相互关系。
4
2、2 Uniterm indexing
元词法的概念:以单元词作为检索标识的文献标引和检索方法。 它是对标题法先组式标识进行改革而形成的一种后组式语言。元 词是指能够表达文献主题,经过规范化处理的最小、最基本的词 汇单元,具有概念上的独立性、单元性和规范性的特点。
由此看来,叙词法的基本性质,就是一种采用表示单元概念的规范化 语词的组配来对文献主题进行描述的后组式词汇型标识系统。
7
叙词的类型和语义关系
叙词是以概念为基础,经过优选和规范化并具有概念组配和语 义关系显示功能,用以表达文献主题和检索需求的词或词组。 叙词可以划分为普通叙词和专用叙词。普通叙词指表示各种事 物及其属性的叙词,它表达的通常是普通概念;专用叙词则是 表示某一特定事物的叙词,它表达的都是单独或特定概念。
12
三、《汉语主题词表》与文献标引
Chinese Thesaurus:我国第一部大型的综合性主题词表,1974年 开始编制,近9 000人历经5年时间,于1980年正式问世。词表分3 卷10个分册,11万条叙词。第1卷是社会科学,收录主题词23 500 余条;第2卷是自然科学,收录主题词65 200余条,非正式主题词 12 913条;第3卷是社科与自然科学共用的附表。
Indexing:标引是指通过对文献的分析,选用确切的检索标识用 以反映该文献的内容的过程。标引的实质是对文献的内容特征进 行主题类属的划分和用词的转换。一般分为分类标引和主题标引 (包括受控标引和非受控标引),而自动标引(抽词标引和赋词 标引)则是文献标引的发展趋势。
文献标引的程序:查重→主题分析→归类和查表选词→确定分类号 和主题词→审核。在标引工作中,要尽量避免标引误差。衡量标 引的质量指标,包括标引的穷举度、专指度和一致性等。
元词法的基本原理:任何一个复合概念都可以分解为若干单元概 念,而每个单元概念通常只用一个元词来表达,通过单元词的组 配来表达复杂的文献主题概念。元词法的基本原理有两个构件, 即单元词表和单元词卡片。
元词法的主要特点:用较少的词量反映较多的主题概念,具有灵 活性和专指性,在各种词表中,单元词表的体积最小。但元词法 缺乏直接性和系统性,由于常常采用字面组配,易产生组配误差, 检索的查准率较低。
键词法的主要特点: ⑴ 采用语词作为概念标识,直接从文献中抽取关键词。相对于叙词
法、标题法和元词法来说,要求标引水平低,尤其适用于计算机 处理和自动标引。 ⑵ 具有丰富的轮排方式并建立字顺排列体系,检索非常方便。采用 键词法的检索系统是时差最短和最经济的检索系统。 ⑶ 由于键词的非规范性,词汇质量较粗略,影响到文献检索的查全 率和查准率等。 键词法的表现形式——Keyword Index。
14
⑵ 在语词组配上:适当采用标题法的预先组配,吸收元词法的元词 组配原理和后组技术,采用组配分类法的概念组配和词汇分面分 类表技术。
⑶ 在语词关系上:采用体系分类法的基本原理编制叙词分类索引和 等级索引,采用与键词法类似的方法编制叙词轮排索引,进一步 完善了标题法的参照系统,从而从多方面显示叙词间的相互关系。
13
Chap3 思考题
1、谈谈信息检索语言的概念和特点。 2、信息检索语言有哪些基本类型? 3、信息检索语言有哪些主要功能? 4、什么是分类检索语言?体系分类法有什么基本特征? 5、什么是组配分类法?组配分类法有什么主要特征? 6、主题检索语言有哪些基本特征和类型? 7、如何理解叙词法吸收和发展了多种检索语言的原理和优点? 8、如何认识基本类目、标题词、关键词、元词和叙词? 9、如何看待主题法和分类法的区别与联系? 10、全面熟悉和掌握经济管理分类词表和主题词表的基本内容。
源自文库
C 费边社会主义
参参照
凯恩斯主义/ 瑞典学派/新古典学派、新剑桥学派
10
叙词表·辅表·叙词索引
词族索引(族系表):利用概念成族原理将有关叙词汇集在一 起成为一族,构成一个从泛指叙词到专指叙词的等级系统。
范畴索引(分类表):将叙词按其概念所属学科或范畴分成若 干大类,在大类之下再分成若干小类,在小类之下将叙词按字 顺排列,形成一个类似体系分类法的概念分类系统。
5
2、3 Descriptor indexing
叙词法的概念与原理 叙词的类型和语义关系 叙词表及叙词索引
6
叙词法的概念与原理
叙词法以自然语言为基础,以规范化的叙词作为检索标识的文献标引 与检索方法。叙词法多种信息检索语言的原理和方法的综合。
⑴ 在语词标识上:吸收了标题法对语词进行严格规范化的基本方法, 对语词进行词类、词形、词义、词间关系等多种规范。
1、2主题检索语言的基本特点 规范化的名词术语直接作为文献主题标识,直观性较好;而体系
分类法的类号是规范化的,类目名称却不经过严格规范。 按字顺序列排检标识,检索者较易使用;而分类检索语言按知识
系统排列,用号码表达概念,有一定的间接性。 按主题集中文献信息,对有关某一事物的检索效率高;而分类检
索语言以学科专业为线索集中文献。 用参照系统及其他方法间接显示文献概念之间的关系,其系统性
较差;分类检索语言能够直接显示概念关系。 接近自然语言,容易与自然语言结合使用。
2
二、主题检索语言的基本类型 2、1 System of subject heading 2、2 Uniterm indexing 2、3 Descriptor indexing 2、4 Keyword indexing
8
叙词表及叙词索引
叙词表(Thesaurus)是指将自然语言转换成规范化的叙词型主题 检索语言的术语控制工具,亦称主题词表。它是一种概括某一学 科领域,以规范化的、受控的、动态的叙词为基本成份和以参照 系统显示词间关系,用于标引、存储和检索文献的词典。
叙词表一般由一个主表和若干个辅表组成。主表亦称字顺表,是 将全部主题词按字顺排列,并添加必要的标注项和显示词间等同、 等级或相关关系的参照项,它是叙词表的主体结构。附表则是各 种专有叙词索引,如地区索引、机构索引、人名索引、产品索引 等,它是从主表中分离出来的专用词汇表。附表通常是叙词表的 辅助部分。
3
2、1 System of subject heading
标题法的概念:以标题词作为检索标识的文献与检索方法。具体 而言,标题法是用规范化名词术语作为标识,来直接表达文献所 论及或涉及的主题,并将全部标识按字顺排列,通过参照系统来 显示各个标识所表达的主题之间的相互关系的一种主题法。
标题法的基本特点:⑴采用规范的检索标识,主、副标题词经规 范化处理后按固定的顺序排列在标题词表中。⑵采用定组方式, 即以主标题词与副标题词的固定形式组配来表现某一主题概念。 ⑶采用二元组配,即一组检索款目多由一个主标题词和一个副标 题词组成。此外,标题词表中一般只反映同义词的“用-代”关系, 不反映同族词的“属-分”关系,族性检索功能较差。
叙词语言具有严密的语义关系。根据词义的需要,叙词相互之 间有3种语义关系:⑴ 等同关系(用-代),指叙词与非叙词之 间的关系。⑵ 等级关系(分-属-族),指专指度深浅不同的 两个叙词之间的隶属关系。⑶ 相关关系(参-参),指叙词之 间存在一定的关联、交错、对立和矛盾的关系(或称类缘关 系),两者互为参照。
9
叙词表·主表·款目
Bianji Xiaoyong Xuepai 边际效用学派 05DB
范畴类号 款目叙词
Marginal utility school D 边际学派
代参照
边际主义
F 奥地利学派
分参照
剑桥学派
洛桑学派
数理学派
S 庸俗资产阶级政治经济学 经济学派*
属对照 族首词符号
Z 政治经济学
族首词(有两个族首词)
3-3 Subject Retrieval Language
一、主题检索语言的概念与特点 二、主题检索语言的基本类型 三、《汉语主题词表》与文献标引
思考题
1
一、主题检索语言的概念与特点
1、1主题检索语言是指采用描述文献主题的语词标识并按字顺排检的 信息检索语言。一般由主题词表及其编制和使用规则组成。
相关文档
最新文档