信息检索之检索语言

合集下载

信息检索语言名词解释

信息检索语言名词解释

信息检索语言名词解释在当今信息爆炸的时代,快速准确地获取所需信息成为了一项非常重要的能力。

而信息检索语言作为一种用于检索特定信息的工具,也逐渐引起了人们的关注。

本文将对信息检索语言进行解释,并深入探讨其定义、分类、应用以及未来发展趋势等方面。

一、定义信息检索语言(Information Retrieval Language,简称IRL)是一种用于从大规模的信息资源中获取所需信息的工具。

它通过特定的语法和命令,将用户的查询需求转化为计算机可以理解的形式,并根据用户的要求,精确地匹配和提取相应的信息。

IRL旨在提高信息检索的准确度和效率,帮助用户在海量的信息中迅速找到所需内容。

二、分类基于不同的用途和功能,IRL可以分为几种常见的类型。

1. 布尔检索语言(Boolean Retrieval Language)布尔检索语言是最早应用于信息检索领域的一种语言类型。

它主要依据布尔运算的原理,通过逻辑的组合和排除来实现信息的检索与过滤。

用户可以通过基本的布尔运算符(AND、OR、NOT)和括号组合自己的查询语句,以获取满足特定条件的信息。

2. 自然语言查询语言(Natural Language Query Language)自然语言查询语言是一种使用自然语言描述查询需求的检索语言。

它利用语言理解和处理技术,将用户的自然语言查询转化为计算机可执行的检索语言。

相比于其他IRL类型,自然语言查询语言更加简便易用,能够接受非专业用户的查询。

3. 基于模式的查询语言(Pattern-based Query Language)基于模式的查询语言是一种使用特定模式描述查询需求的检索语言。

它通过定义关键词的组合和排列方式,指导计算机在大数据集中查找与其模式匹配的信息。

基于模式的查询语言常被应用在关键词提取、信息分类和数据挖掘等领域。

三、应用信息检索语言在各个领域具有广泛的应用。

以下是几个常见的应用场景。

1. 互联网搜索引擎互联网搜索引擎通过用户输入的查询语句,利用信息检索语言在大量的网页中进行检索。

常用的检索语言

常用的检索语言

常用的检索语言检索语言在信息检索领域起着非常重要的作用,它是用户与搜索引擎进行交互的桥梁。

本文将介绍几种常用的检索语言,包括关键词检索、布尔检索、模糊检索和自然语言检索。

一、关键词检索关键词检索是最常见的一种检索方法,用户通过输入与所需信息相关的关键词来进行检索。

搜索引擎会根据关键词在数据库中的索引进行匹配,返回相关的结果。

关键词检索对于用户来说比较简单直观,但也存在一些问题。

比如,如果用户输入的关键词过于模糊,可能会返回大量与用户需求不相关的结果;如果用户输入的关键词过于具体,可能会导致相关结果过少。

二、布尔检索布尔检索是一种基于逻辑运算的检索方法,用户可以通过使用布尔运算符(如AND、OR、NOT)来组合多个关键词进行检索。

布尔检索可以更精确地表达用户的需求,提高检索结果的相关性。

例如,用户可以通过输入“电影AND 喜剧”来检索同时包含电影和喜剧两个关键词的相关内容。

三、模糊检索模糊检索是一种考虑到用户输入的不完整或错误的情况下进行的检索方法。

搜索引擎使用模糊匹配算法,将用户输入的关键词与数据库中的内容进行模糊匹配,返回与用户需求最相近的结果。

模糊检索可以有效地解决用户拼写错误或输入不完整的问题,提高搜索的准确性。

四、自然语言检索自然语言检索是一种使用自然语言进行检索的方法,用户可以用自然语言的形式描述自己的需求,而不需要使用特定的检索语法。

搜索引擎会将用户的自然语言转化为机器可理解的查询语言,然后进行检索并返回相关结果。

自然语言检索可以使用户更加方便地表达需求,但也存在一些挑战,如语义理解和查询解析的问题。

总结:常用的检索语言包括关键词检索、布尔检索、模糊检索和自然语言检索。

不同的检索方法适用于不同的用户需求和场景。

关键词检索简单直观,适用于用户已经清楚知道自己需要什么的情况;布尔检索可以更精确地表达用户需求,提高检索结果的相关性;模糊检索可以解决用户输入不完整或错误的问题,提高搜索的准确性;自然语言检索可以使用户更加方便地表达需求,但也面临语义理解和查询解析的挑战。

第二章 检索语言

第二章  检索语言

(一)分类检索语言的类型
1.体系分类法 2.组配分类法
(二)分类检索语言的特点
分类检索语言是信息管理领域经典的 检索语言之一,以1876年《杜威十进分类法》 的问世为标志,已走过了一个多世纪的历 程,形成了自成体系的一套信息组织和检 索方法。
二、分类检索语言结构
(一)类目 1.类目的划分 2.引用次序 3.类目的排列 4.类名的确定 5.类目之间相互关系的处理
一、检索语言的概念 传统意义上的检索语言仅指根据信息
检索需要而创制的人工语言,又称情报语 言、情报存储与检索语言、文献语言、文 献工作语言、索引语言、标引语言、标引 符号、标识系统等。
二、检索语言的基础
(一)概念逻辑 概念逻辑,是一种科学思维方法,通
过明确各种概念及其相互关系而揭示事物 的本质属性及各种事物之间的联系与区别。
词为基础,以概念组配为基本原理,对文 献主题进行描述的后组式检索语言。
(二)叙词表的编制
叙词表是叙词法的核心体现。目前, 国内的叙词表已有七八十种之多。常用的 有《汉语主题词表》、《化工汉语主题词 表》、《机械工程主题词表》、《电子技 术汉语主题词表》、《国防科学技术叙词 表》等。
五、主要主题词表介绍
(一)《汉语主题词表》 《汉语主题词表》是我国第一部大型的
综合性的叙词表,由中国科技信息研究所 和北京图书馆负责主持,1975年开始编制, 1980年正式出版。
(二)《中国分类主题词表》
《中国分类主题词表》是在《中图法》 编委会主持下,经全国40个单位160位专家 学者的共同努力,历时8年编制而成的,于 1994年6月正式出版。
(二)单元词法
单元词又称元词,是从自然语言中选 取,经过规范化处理,表达主题最小的、 最基本的、字面上不能再分的名词术语。

信息检索语言

信息检索语言

中图法分类简表
(/view.do?id=516)
A B C D E F G H I J K 马克思主义、列宁主义、毛泽东思想、邓小平理论 哲学、宗教 社会科学总论 政治、法律 军事 经济 文化、科学、教育、体育 语言、文字 文学 艺术 历史、地理
中国情报检索语言之近代阶段的特点
①从分类体系来看,冲破了四部分类法的束缚,提出了 新的分类理论,能尽量建立在科学的基础之上,为新 旧书籍、中外图书的统一分类开辟了可行的途径; ②从类目设臵与标记制度来看,比较简单、科学、准确、 便于利用,是中国图书分类法史上的一次重大变革; ③从类分表的结构来看,分类法已经形成为一个完整的 系统,并且有一定的科学理论作为其指导依据及一 定的使用范围作为其实践基础; ④从编制技术上看,既继承了古代分类法的优良传统与 经验,更吸收了国外的先进技术,具有科学性;
信息检索语言的类型
分类语言
分类语言是用分类号和相应分类款目来表达 各种概念的,它以学科体系为基础将各种概 念按学科性质和逻辑层次结构进行分类和系 统排序。分类语言能反映事物的从属派生关 系,便于按学科门类进行族性检索。按照分 类方式的不同,分类语言又分为体系分类语 言、组配分类语言和混合分类语言。
中国情报检索语言之近代阶段的特点(续)
⑤受杜威分类法带来的局限与影响,在类目体系的确立 上表现有机械、呆板、生硬的一面; ⑥对分类法理论中的一些重大问题与实践中出现的情 况未能展开充分的讨论并科学的加以解决,从而在 实际操作中各行其是,影响了图书分类法理论研究 的整体性进展; 在主题法方面:我国近代图书馆的主题编目技术也是于 20世纪初由西方传入的。继而从30年代到50年代, 我国虽然有三、四部中文标题表问世,但是都未能 得到实际的应用。

第2章 检索语言

第2章 检索语言
传统意义上的检索语言,是应文献信息的加工、存贮和 检索的共同需要而编制的专门语言,它是表达概括文献信息 内容的概念及相互关系的一种概念标识系统。

广义上的检索语言,指信息检索过程中涉及的人工语言 和自然语言。

人工语言是根据一定的规则人为编制而成的检索语言,有严格的使用规则,可用 于表述文献主要内容,建立信息检索系统。 自然语言是人类交流时使用的语言,不受任何限制,未经加工和规范。




2.1 2.2 2.3 2.4 2.5 2.6
检索语言概述 检索语言的理论基础 分类检索语言 主题检索语言 分类主题一体化检索语言 网络信息检索语言
2.1 检索语言基本知识

2.1.1 检索语言概述 2.1.2 检索语言的功能 2.1.3 检索语言的类型
2.1.1 检索语言概述
3.代表类事物特征的一套代码;
世界常见的检索语言主要有:



《杜威十进制分类法》 《国际十进制分类法》 《冒号分类法》 《中国图书馆分类法》 《中国人民大学图书馆分类法》 《汉语主题词表》
2.1.2检索语言所具备的功能




(1) 对文献的信息内容及其外表特征加以规范化 的标引; (2) 对内容相同及相关的文献信息加以集中或揭 示其相关性; (3) 可使文献信息的存贮集中化、系统化、组织 化,便于检索者按一定的排列次序进行有序化检 索; (4) 便于将标引用语和检索用语进行相符性比较。

狭义上的检索语言,仅指根据信息检索的需要,按照一 定的规则对自然语言进行规范,并专门用于信息标引和用户 检索的人工语言。

2.1.1 检索语言概述
检索语言又称情报语言、情报存储与检索语 言、文献语言、索引语言、标引语言、标示系 统等。 1.从自然语言中精选出来并加以规范化的词汇;

第二章信息检索语言

第二章信息检索语言

D3 小说
D4 散文 ……
C3现代
C4当代 ……
分类语言的标记符号
标记符号:文献分类法中用以表示类目的代号, 又称分类号。 作用:它具有固定类目的位置,明确各个类目的 先后次序,在一定程度上显示类目之间的隶 属、并列关系以及描述某个类目的含义。 标记符号的要求 :
– – – – 容纳性 表达性 简短性 助记性
4.检索语言的类型
• 按规范程度分
– 自然语言 – 规范化语言
• 按组配方式分
– 先组式语言 – 后组式语言
• 按照描述信息特征划分
– 内容特征语言
• 分类语言/主题语言
– 外部特征语言
• 名称语言/著者语言/序号语言
二、分类语言
• 亦称体系分类语言,是以学科范畴和学科体 系为基础来划分事物的一种检索语言。在信 息存储和检索中,它是一种对信息内容的概 念进行逻辑分类和有规律地系统排列而构成 的检索语言,并以分类表(分类法)的形式体现。 • 分类语言最显明的特点是系统性,具有族性 检索的功能,有利于人们从学科专业的角度 进行全面性的检索。
等级列举式分类法
U448各种桥梁 U448.1 桥梁、按用途分 U448.11 人行桥 U448.12 两用桥 U448.13 铁路桥 …… U448.2 桥梁、按结构分
分面组配分类法
地区分面 E1 中国
E2 朝鲜
体裁分面 D1 诗歌
D2 戏剧
时代分面 C1 古代
C2 近代
E3 韩国
E4 日本 ……
• 同一著者的不同作品:
鲁迅:《热风》I210.4 L824 鲁迅:《华盖集》I210.4 L824/2 鲁迅:《两心集》I210.4 L824/3
• 版本不同:

《信息检索》 第2讲 信息检索的基本知识2

《信息检索》 第2讲 信息检索的基本知识2

19
2013-8-1
(2)自然语言和受控语言的一体化发展趋势
在网络环境下自然语言和受控语言的融合或称一体化是检索
语言未来发展的必然趋势。这方面比较前沿的、有代表性的 理论研究和实践是国内张琪玉先生提出的学科——事物概念 组配型检索语言和美国国家医学图书馆所创建的UMLS系统 。 学科——事物概念组配型检索语言具有的特点是:通过学 科聚类和事物聚类的结合、号码标识和词语标识的结合以及 系统序列和字顺序列的结合,实现分类系统和主题系统的完 全一体化。用户从自然语言词汇、分类号和主题词任一途径 入口检索,都能获得相应的文献。这种检索语言具有开放性 ,可不断增补新概念。目前该模式正处于理论研究阶段。 UMLS模式即一体化医学语言系统。UMLS由超级叙词表、语 义网络、情报源图谱和专家词典四个相互联系的部分组成。
13
2013-8-1

用主题法查找文献,要注意以下几点:
注意利用词表
选择主题词要把握概念的含义 要利用概念之间的属种关系和相关关系增加检索线索
14
2013-8-1
注意利用词表
主题词是检索系统使用的专门的规范化语言,用这
种语言表述的概念,只有一种解释,不允许一词多 义、多词一义,这是规范化检索语言的单义性所规 定的。而一般用户的提问用的是自然语言,自然语 言并不遵守特定事物具有特定概念用特定语言表达 这一原则。
10
2.2 关键词语言
关键词语言是适应目录索引编制过程自动化的需要而产
生的。关键词是文献的篇名、摘要、正文中出现的具有 实质意义并能表达文献主题内容的词语。以关键词作为 标识的检索系统就叫做关键词语言。 由于关键词是未经规范的自然语言,一个概念可以用几 个词义相同或相近的词来表达,因此关键词语言没有固 定的词表,只有一个停用词词表,用以识别词语的词性 ,方便计算机自动抽取实质性语词。 关键词语言十分适于计算机编制索引,检索入口多,编 制速度快,但缺点是容易造成漏检。 例如:“国际联机检索概论”中的“国际联机检索”、 “国际联机”、“联机”、“检索”都是能描述这篇文 献主题的关键词,都可以作为检索词。

第4章信息检索语言、途径、方法和步骤

第4章信息检索语言、途径、方法和步骤

第4章信息检索语言及其途径、方法和步骤重点与难点:信息检索语言职能,信息检索途径与方法1 信息检索语言及其职能1.1 信息检索语言信息检索语言是根据信息检索需要创建的一种人工语言,又称信息检索标识。

如果从反映信息特征的角度来看,那些代表了信息外表特征的著者姓名、题名、报告号、标准号、专利等信息检索标识和代表了信息内容特征的类号、叙词、标题词和关键词都是信息检索语言。

但从信息检索标识规范化的角度来看,信息检索语言可分为自然语言检索标识和规范语言检索标识。

前者包括著者姓名、题名、会议名称、机构号、标牌号、专利号和关键词,后者则指分类号、类名、标题词和叙词。

规范化检索语言是存取信息的依据。

在编制检索工具时,标引人员要对各种信息进行内容分析,把它们所包含的内容要点都分析出来,使之形成若干能代表信息内容的概念,并用规范化的语言如叙词、标题词或分类号把这些概念标示出来,纳入检索系统中。

当检索时,检索人员也要对提问进行主题分析,使之形成能代表信息需求的概念,并把这些概念转换成系统能接受的语言,然后才能从系统中得到用这些规范化语言所标引的信息。

因此,将信息需求者的自然语言转化成系统规范化的信息检索语言,对信息检索的成功至关重要。

1.2 信息检索语言的职能信息检索语言的职能主要包括以下三个方面:(1)信息检索语言可以表示文献内容、数据或其他信息形式。

(2)有专用概念表示用户的信息提问。

(3)能够指示计算机执行查询与检索。

2 文献信息检索的途径在进行文献检索时,人们可以利用文献存贮时按其内容特征或外部特征进行排序的方法进行检索。

文献的内容特征是指文献所论及的事物、所提出的问题,涉及的基本概念,即主题以及文献内容所属的学科范围。

文献的外部特征是指题名、作者、作者单位以及某种特殊文献具体的标识。

2.1 内容特征途径(1)主题途径这是根据文献内容的主题特征进行检索的途径。

(2)分类检索这是一种按照文献资料所属学科(专业)类别进行检索的途径。

信息检索 第二章检索语言

信息检索 第二章检索语言

2.3分类检索语言分类检索语言:又称分类法,是将许多类目根据一定的原则组织起来,通过标记符号(分类号)来代表各级类目和固定器先后顺序的分类体系。

体系分类法:基于概念的划分与概括,以学科分类为基础,把概括文献内容与事实的各种类目组成一个层层隶属、详细列举的等级结构体系。

组配分类法:基于概念的可分析性和可综合性,将一个复杂的文献主题概念用若干个表达简单概念的标识组配来表达的一种文献分类法。

一、体系分类法(一)结构分为微观结构和宏观结构。

微观结构指分类法中类目的构成结构。

按照类目之间关系建立起来的类目集合称为类目体系。

类目体系的建立涉及到。

1、类目的划分是把一个类目分成若干小类,从而揭示类目外延的逻辑方法。

类目划分的标准有分类标准、内容标准、形式标准。

类目划分的过程通常是由大到小、由属到种、有整体到部分、由总论到各论、有全面到各方面。

2、引用次序在体系分类法中表现为分类标准的使用次序。

合理的引用次序应满足逻辑性原则、符合检所需要原则、表达性原则。

3、类目的排列直接影响到分类法的质量应体现出系统性、整体性、等级性、逻辑性、连续性、一致性。

4、类名的确定类名的作用是表达类目含义应坚持科学性、确切性、简洁性。

5、类目之间相关关系的处理分类法是依赖于类目之间的相关关系建立起来的。

类目之间的基本关系有从属关系(类目体系中母类与子类的关系,构成分类法类目的纵向排列)、并列关系(在分类法中体现为同位类)、交替关系(使用类目和交替类目之间的关系)、相关关系(在分类法中体现为相关类目)。

宏观结构是按功能分体系分类法的结构。

有以下四部分组成。

1、类目体系按照类目之间关系建立起来的类目集合。

由主表和复分表组成。

主表是由基本部类、基本大类、简表、详表逐级展开而成的类目表。

复分表是供主表有关类目进一步细分用的类目表,有通用复分表和专用复分表两种。

2、标记系统是分类语言所有标记符号的集合。

分类语言的标记符号即分类号,有单纯式号码和混合式号码两种。

信息检索基础 检索语言及其分类

信息检索基础 检索语言及其分类

《中国图书馆图书分类法》
R91下分为R911药物数学、R912药物物理学、R913 药物物理化学、R914药物化学、R915药物生物学。 R914下又分为{R914.1}药物分析、R914.2药物设 计 、 R914.3 无 机 药 学 化 学 、 R914.4 有 机 药 物 化 学 、 R914.5有机合成药物化学。
医学信息检索
检索语言及其分类
教 学
目 标
1
了解检索语言的分类
2
熟悉《中国图书馆图书分类法》
3
熟悉《医学主题词表》(MeSH)
了解检索语言的分类
检索语言是信息检索中用来描述文献特征和表达检索提问内容的一种专门性的人工语言,是一组有规则 的、能够反映出信息内容及特征的标识符,用于联系文献信息与用户需求的“语言括主题词和关键词语言。主题词语言与关键词语言的区别在于规范化程度不同。 ○关键词又名自由词,中选取的具有实质意义的名词,这种词不受主题词表限制,一般是未经规是从文献范
化或略规范化的词,常用于一般检索或精度要求不高的检索。 ○主题词是规范化词汇,最大的优点是概念准确、专指度高。它对文献中出现的同义词、近义词、多义词以
思 考 题
1
简述检索语言的分类及其特点
2
《中国图书馆图书分类法》分类体系是怎样的
3
主题词与关键词的区别是什么
图1主题:氟哌酸*胃肠炎 图2 主题:诺氟沙星*胃肠炎
《医学主题词表》(MeSH)
主题检索语言是信息检索语言中检索效率较高、使用频率较多的一种语言。人们为了更快更 好地检索文献,将概念更准确、专指度更高的反映文献内容的主题词编制成专门的主题词表, 供大家使用。目前国内最常用的主题词表是《医学主题词表》(MeSH)、《中医药学主题 词表》和《汉语主题词表》。 《医学主题词表》(MeSH)是美国国家医学图书馆从1960年起编制,并于1963年正式使 用的一部规范化的可扩充的动态性叙词表,是生物医学领域具有权威性的主题词表。MeSH 主要包括主题词表和树状结构表两个部分。

检索语言

检索语言

检索语言检索语言(Retrieval Language)就是组织文献与检索文献时所使用的语言。

也就是说,文献存储时,文献的内容特征(如分类、主题)和外表特征(如书名、刊名、篇名、号码、著者等)按照一定的语言来描述,检索文献时的提问也按照一定的语言来加以表达。

这种在文献的存储和检索过程中,共同使用、共同遵循的语言就是检索语言。

实质上它是标引和检索之间的约定语言,是人与检索系统对话的基础,检索的匹配就是通过检索语言的匹配来实现的。

使用检索工具和检索系统必须掌握检索语言,它是掌握和提高检索技能的基础。

检索语言的基本成分是检索词。

按检索词的规范化程度和组配程序,检索语言可分为自然语言(Natural Language)和人工语言(Artificial)两种。

自然语言采用的检索词是未加工整理和规范过的,即平常采用的关键词,这种语言又称作关键词语言(Keyword Language)。

人工语言采用经过规范化的词,规定一个词表示一种事物,例如规定“aircraft”表示飞机,而不用“air plane”、“plane”和“aeroplane”,以做到文献存储和检索的一致性。

信息检索语言是根据检索需要而创制的人工语言,也称检索标识系统,专门用于各种手工和计算机信息检索系统。

从不同角度检索文献,就有不同种类的检索语言,常用的有主题语言和分类语言,下面分别加以论述。

(一)分类语言分类语言是用分类号和相应分类款目来表达各种概念的,它以学科体系为基础将各种概念按学科性质和逻辑层次结构进行分类和系统排序。

分类语言能反映事物的从属派生关系。

便于按学科门类迸行族性检索。

分类语言中最常见的是体系分类语言,它按照学科体系从综合到一般、从复杂到简单、从高级到低级的逻辑次序逐级展开,世界著名的分类法有:《国际专利分类表》(IPC)、《杜威十进分类法》(DDC)、《美国国会图书馆图书分类法》(LC)、《中国图书馆图书分类法》(中图法)和《中国科学院图书馆图书分类法》(科图法)。

第二章 信息检索语言

第二章 信息检索语言
款目主题词并按族首词的字顺和等级相结 合编排的一种索引。
二、《汉语主题词表 》

(2)范畴索引:
它又称为分类索引,是将主表的全部主题
词按照主题词的学科和词义范畴,划分若
干大类、二级类或三级类,每类之下按主
题词的汉语拼音字顺排列的一种索引。它 的分类是对主题词的分类。
二、《汉语主题词表 》

(3)英汉对照索引:
号分类法》。
二、信息检索语言的基本类型

C、混合分类语言:
它是结合体系分类语言和组配分类语言所形成的
检索语言。又因对两者的侧重点不同,混合分类
语言又可明显地分为体系—组配分类语言和组
配—体系分类语言。如《国际十进分类法》。
二、信息检索语言的基本类型


(三)检索语言按内容性质划分
2、主题语言
(1)含义:就是对表达信息主题内容特征的主 题词汇概念规范化处理所形成的检索语言。 (2)优点:由于主题词汇表达概念准确,所以 主题途径是检索信息的主要途径。


(3)类型:主题语言按照主题性质的不同,又 分为以下几种:
二、信息检索语言的基本类型

A、标题词语言:
它以标题词作为文献内容标识和检索依据。

2、《中图法》采用了许多辅助符号。
一、《中图法》


(四)特点
1、编制技术和编号方法比较先进、科学; 2、强调分类法的实用性,在层累制的基础上采 用八分法、借号法、双位法等方法,使得类号等 级分明、简短易记; 3、结构完善,使用配套,有相关索引和使用手 册,还有一系列不同类型的版本,为全国文献的 统一分编创造了条件; 4、有一个长设机构负责《中图法》的管理、修 订等工作。

信息检索教程 第二章 检索语言

信息检索教程 第二章 检索语言

17
【例题】检索英语会话类辞典,例如《美国语会话百科》、 《英语会话大全》、《现代英汉生活用语图解词典》,请 选择,哪种检索途径才能够同时查出这3本书? 【选项】 A.用关键词“会话”和“词典” B.用中国图书分类号H319.9-61
C.用书名“英语会话”和“大全”
D.用书名“英语会话”和“词典” 【答案】B
2.1.3.3 按信息标识的组合使用方法,可分 为先组式语言、后组式语言和散组 式语言
2.1.3.4 按语言的规范程度,可分为人工语 言和自然语言
3
第2章 检索语言
2.2.1 概念逻辑
2.2 检索语言 的理论基础
2.2.1.1 概念间的关系 不相容 关系
相容关系
同一 属种
整体与 全面与 不相排斥 交叉 部分 某一方面 的并列
10
第2章 检索语言
2.3.2.3 主要体系分类法介绍 国内常见的体系分类法有:
《中国人民大学图书馆图书分类法》,简称《人大法》 《中国图书馆分类法》,简称《中图法》 《中国科学院图书馆图书分类法》,简称《科图法》 《中国档案分类法》
国外常见的体系分类法有:
《杜威十进分类法》(Dewey Decimal Classification)简称DC或DDC 《美国国会图书馆分类法》(Library of Congress Classification)简称LC 《国际十进制分类法》(Universal Decimal Classification)简称UDC
11
《中国图书馆分类法》 第2 章 检索语言
我国目前广泛使用的分类法是《中国图书馆分类法》。它是由国 家图书馆等单位组织全国力量,以学科分类为基础,并结合图书的特 性所编制的分类法。它将学科分五大部类,基本序列是:马克思主义 列宁主义毛泽东思想、哲学、社会科学、自然科学、综合性图书,由 5大部类、22个大类、6个总论复分表、30多个专类复分表、4万余条 类目组成了一个完善的分类体系。 标记制度采用拉丁字母与阿拉伯数字相结合的混合号码制,用一 个字母代表一个大类,以字母的顺序反映大类的序列,在字母后用数 字表示大类下类目的划分,数字的设置尽可能代表类的级位,并基本 上遵从层累制的原则。

检索语言的名词解释

检索语言的名词解释

检索语言的名词解释
检索语言,也称为信息检索语言或信息检索词汇,是一种专门设计的语言,用于描述和表示文献主题和内容特征,以便计算机进行信息检索。

检索语言的主要作用是将自然语言中任意性的文本转化为规范化的、可比较的、可操作的检索工具,从而能够高效地检索出所需要的文献。

常见的检索语言包括关键词语言、分类语言和主题语言等。

其中,关键词语言是基于文献中出现的词汇进行检索的语言;分类语言则是根据文献的内容和主题,将其划分到不同的知识类别中,然后通过类别的关系进行检索;主题语言则是将文献的主题进行规范化的描述,形成一个标准化的主题词表,然后通过主题词进行检索。

检索语言在图书馆、情报中心、档案馆、网络搜索引擎等领域广泛应用,是实现信息高效检索的重要工具之一。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
② 文字型数据库是指以文字字符为主要记录内容的 数据库,包括书目型、事实型、百科全书型、词 库型和全文型数据库。这类数据库主要用于查找 相关文献信息。 ③ 数值型数据库包括来自科学研究,原始文献或者 调查研究的各种数值型或图表型数据库。这类数 据库主要用于查找确定对象的特定数值信息。
Hale Waihona Puke 数据库的成从使用者观 点观察,数据 库主要由“----记录-----字段----” 三个层次构成。
记录实例 作者: 赵少庆
篇名:信息技术对公共行政的影响论纲。
文章出处:国家行政管理学杂志,2005.12(5) : 345---347
内容摘要:社会信息化是当代社会的一种大趋势, 他正推动着公共行政现在化的进展。信息技术发展 对诸如行政人员、行政决策、行政组织、行政方法、 行政公文、行政管理模式等公共行政管理要素和过 程产生着深远影响。
检索语言是应文献信息的加工、存储和 检索的共同需要而编制的专门语言,是表 达一系列概括文献信息内容和检索课题内 容的概念及其相互关系的一种概念标识系 统。
什么是分类语言?
分类语言也称分类法。用分类号和相应的分类 款目来表达各种概念,以学科体系为基础将各 种概念按学科性质和逻辑层次结构进行分类和 系统排序,能反映事物的从属派生关系,便于 按学科门类进行族性检索。按照分类方式的不 同,分类语言又分为体系分类语言、组配分类 语言和混合分类语言。
布尔逻辑运算:逻辑非
1:组配方式:A NOT B, A-- B表示。检索结果 即为再还有概念A的文献中,排除同时含有B的 概念。 2:作用:排除无关概念,用来缩小检索范围, 提高查准率。 3:实例:ands NOT hearing 检索含有“aids” 的数据,排除含有”hearing”的文献。
谢谢观赏!

主题词表是对主题词进行规范化处理的依据,也是 文献处理者和检索者共同参照的依据。 关键词是属于自然语言的范畴,未经规范化处理, 也不受主题词表的控制。如:对于“白细胞介素2” 这一概念可有白介素2、白细胞介素2、IL2、IL-2等不 同形式来表达。 因此,为了达到较高的查准率和查全率,如果检 索工具提供了主题词这一检索途径的话就应该选择 主题词来进行检索,而不应该选择关键词。
例如:利用MEDLINE光盘数据库检索有关“肝肿瘤” 方面的文献。 MEDLINE光盘数据库既提供了主题词途径,也提供 了自由词(关键词)途径。如果选择关键词途径来 进行检索,欲达到较高的查准率和查全率,就得查 找“liver cancer”、“liver carcinoma”、“liver neoplasm”、“liver tumor”、“hepatic cancer”、 “hepatic carcinoma”、“hepatic neoplasm”、 “hepatic tumor”等词,另外还得考虑像cancer、 carcinoma、neoplasm、tumor等词还有复数形式;而 如果选择主题词途径进行检索就只需查找“liver neoplasms”一词就行了,这一词就包括了以上所提及 的不同的表达形式。由此可见,选用主题词途径检 索,既能满足较高的查准率、查全率,又能提高检 索速度,何乐而不为呢?
(二)表达文献内部特征的 检索语言
1. 分类语言 分类语言是指以数字、字母或字母与数字结合 作为基本字符,采用字符直接连接并以圆点(或其 他符号)作为分隔符的书写法,以基本类目作为基 本词汇,以类目的从属关系来表达复杂概念的一类 检索语言。 以知识属性来描述和表达信息内容的信息处理 方法称为分类法。
结果:增加检索专指,提高差准率。 实例:aspartame AND cancer
布尔逻辑算符:逻辑或
组配方式:A OR B或者A+b,表示检索结果含 有A或含有B,或同时包含A,B两个概念的文献。 它主要应用于概念之间的并列关系。 1作用:检索“微量元素铜、铁、锌与儿童 营养不良”的文献(铜OP铁OR锌)AND(婴儿 OR幼儿OR儿童)AND营养不良 2 例如:aspartame O R saccharine O R swweetener*
布尔逻辑检索有哪几种,其功能是什 么?
常用的布尔逻辑算符有三种,分别是:
逻辑“与” ( “AND”、“*”)
逻辑“或”(“OR”、“+”)
逻辑“非”(“NOT”、“-”)
1. 布尔逻辑算符:逻辑与
组配方式:AandB或者A*B,表示两个概念 的交叉和和限定关系。
作用:检所包含所有关键字的数据。缩 小检索
① 文档从数据库的内部来看,文档的概念是指数据 库内容的组织形式。一般地说,一个数据库至少 包括一个顺排文档和一个倒排文档
② 记录是文档的基本单元。他是对某一实体的全部 属性进行描述的结果。在全文数据库中,一个记 录相当于一篇完整的文献:在书目数据库中,一 个记录相当于一条文摘或题录。
字段是记录的基本单元。它是对实体的具体属性进 行描述的结果。在书目数据库中,记录含有的题名、 作者、出版年、主题词、文摘等字段。 根据与文献内容相关与否,文献数据库的字段 通常分为基本字段和辅助字段两类。 基本字段包括题名、文摘、关键词等,是与文 献内容相关的字段。辅助字段包括作者、着这单位 和期刊名称等,是与文献内容基本相关的字段。
分类语言的依据
中国分类法 专利分类法 标准分类法
中国分类法
标准分类法
A 综合…………………………………… 00/09 标准化管理与一般规定 10/19 经济、文化 20/39 基础标准 40/49 基础学科 50/64 计量 65/74 标准物质 75/79 测绘 B 农业林业……………………………… 00/09 农业、林业综合 10/14 土壤与肥料 15/19 植物保护 20/29 粮食与饲料作物 30/39 经济作物 40/49 畜牧 50/59 水产、渔业
分类语言的特征
1.表达文献外部特征的检索语言 2.表达文献内部特征的检索语言
(一)表达文献外部特征的检索 语言
表达文献外部特征的检索语言主要是指文献 的篇名(题目)、作者姓名、出版者、报告号、 专利号等。将不同的文献按照篇名、作者名称 的字序进行排列,或者按照报告号、专利号的 数序进行排列,所形成的以篇名、作者及号码 的检索途径来满足用户需求的检索语言。 描述文献外表特征的检索语言可简要概述 为:题名、著者、文献编号等索引。
信息检索的原理
4、分类语言的依据和特征,课题概念分 类的方法。
5主题检索语言和关键词检索语言的主要 区别是什么? 6、什么是数据库?文献型数据库的结构 7、布尔逻辑检索有哪几种,其功能是什 么?
分类语言的依据和特征,课 题概念分类的方法。
关键词
分类语言 检索语言 主题语言 叙词
什么是检索语言?
课题概念分类
单概念课题 多概念课题 上位类分类法
主题检索语言和关键词检索语言 的主要区别是什么?
主题词与关键词最大的区别就是主题词经过了规范 化处理。
主题词是规范化的检索语言,它对文献中出现的 同义词、近义词、多义词以及同一概念的不同书写 形式等进行严格的控制和规范,使每个主题词都含 义明确,以便准确检索,防止误检、漏检。如:白 介素2、白细胞介素2、IL2、IL-2等表达同一概念的不 同书写形式规范为“白细胞介素2”。
什么是数据库?文献数据库的结 构.
数据库的定义
数据库是指至少由一种文档组成,能满足特 定目的的或特定功能数据处理系统需要的数据 集合。在计算机情报检索系统中,多数数据库 为关系型数据库。
数据库的类型
按照数据库所含信息内容的不同,文献数据库 可分为文字型、数值型和多媒体型
① 多媒体型数据库是指含有字符、声音、图像信息 的数据库。这种数据库一般为超文本结构。他们 既可以用于查找相文献信息,也可以用于查找特 定的属性值、声音和图像。
相关文档
最新文档