检索语言

合集下载

常用的检索语言

常用的检索语言

常用的检索语言检索语言在信息检索领域起着非常重要的作用,它是用户与搜索引擎进行交互的桥梁。

本文将介绍几种常用的检索语言,包括关键词检索、布尔检索、模糊检索和自然语言检索。

一、关键词检索关键词检索是最常见的一种检索方法,用户通过输入与所需信息相关的关键词来进行检索。

搜索引擎会根据关键词在数据库中的索引进行匹配,返回相关的结果。

关键词检索对于用户来说比较简单直观,但也存在一些问题。

比如,如果用户输入的关键词过于模糊,可能会返回大量与用户需求不相关的结果;如果用户输入的关键词过于具体,可能会导致相关结果过少。

二、布尔检索布尔检索是一种基于逻辑运算的检索方法,用户可以通过使用布尔运算符(如AND、OR、NOT)来组合多个关键词进行检索。

布尔检索可以更精确地表达用户的需求,提高检索结果的相关性。

例如,用户可以通过输入“电影AND 喜剧”来检索同时包含电影和喜剧两个关键词的相关内容。

三、模糊检索模糊检索是一种考虑到用户输入的不完整或错误的情况下进行的检索方法。

搜索引擎使用模糊匹配算法,将用户输入的关键词与数据库中的内容进行模糊匹配,返回与用户需求最相近的结果。

模糊检索可以有效地解决用户拼写错误或输入不完整的问题,提高搜索的准确性。

四、自然语言检索自然语言检索是一种使用自然语言进行检索的方法,用户可以用自然语言的形式描述自己的需求,而不需要使用特定的检索语法。

搜索引擎会将用户的自然语言转化为机器可理解的查询语言,然后进行检索并返回相关结果。

自然语言检索可以使用户更加方便地表达需求,但也存在一些挑战,如语义理解和查询解析的问题。

总结:常用的检索语言包括关键词检索、布尔检索、模糊检索和自然语言检索。

不同的检索方法适用于不同的用户需求和场景。

关键词检索简单直观,适用于用户已经清楚知道自己需要什么的情况;布尔检索可以更精确地表达用户需求,提高检索结果的相关性;模糊检索可以解决用户输入不完整或错误的问题,提高搜索的准确性;自然语言检索可以使用户更加方便地表达需求,但也面临语义理解和查询解析的挑战。

第二章 检索语言

第二章  检索语言

(一)分类检索语言的类型
1.体系分类法 2.组配分类法
(二)分类检索语言的特点
分类检索语言是信息管理领域经典的 检索语言之一,以1876年《杜威十进分类法》 的问世为标志,已走过了一个多世纪的历 程,形成了自成体系的一套信息组织和检 索方法。
二、分类检索语言结构
(一)类目 1.类目的划分 2.引用次序 3.类目的排列 4.类名的确定 5.类目之间相互关系的处理
一、检索语言的概念 传统意义上的检索语言仅指根据信息
检索需要而创制的人工语言,又称情报语 言、情报存储与检索语言、文献语言、文 献工作语言、索引语言、标引语言、标引 符号、标识系统等。
二、检索语言的基础
(一)概念逻辑 概念逻辑,是一种科学思维方法,通
过明确各种概念及其相互关系而揭示事物 的本质属性及各种事物之间的联系与区别。
词为基础,以概念组配为基本原理,对文 献主题进行描述的后组式检索语言。
(二)叙词表的编制
叙词表是叙词法的核心体现。目前, 国内的叙词表已有七八十种之多。常用的 有《汉语主题词表》、《化工汉语主题词 表》、《机械工程主题词表》、《电子技 术汉语主题词表》、《国防科学技术叙词 表》等。
五、主要主题词表介绍
(一)《汉语主题词表》 《汉语主题词表》是我国第一部大型的
综合性的叙词表,由中国科技信息研究所 和北京图书馆负责主持,1975年开始编制, 1980年正式出版。
(二)《中国分类主题词表》
《中国分类主题词表》是在《中图法》 编委会主持下,经全国40个单位160位专家 学者的共同努力,历时8年编制而成的,于 1994年6月正式出版。
(二)单元词法
单元词又称元词,是从自然语言中选 取,经过规范化处理,表达主题最小的、 最基本的、字面上不能再分的名词术语。

第2章 检索语言

第2章 检索语言
传统意义上的检索语言,是应文献信息的加工、存贮和 检索的共同需要而编制的专门语言,它是表达概括文献信息 内容的概念及相互关系的一种概念标识系统。

广义上的检索语言,指信息检索过程中涉及的人工语言 和自然语言。

人工语言是根据一定的规则人为编制而成的检索语言,有严格的使用规则,可用 于表述文献主要内容,建立信息检索系统。 自然语言是人类交流时使用的语言,不受任何限制,未经加工和规范。




2.1 2.2 2.3 2.4 2.5 2.6
检索语言概述 检索语言的理论基础 分类检索语言 主题检索语言 分类主题一体化检索语言 网络信息检索语言
2.1 检索语言基本知识

2.1.1 检索语言概述 2.1.2 检索语言的功能 2.1.3 检索语言的类型
2.1.1 检索语言概述
3.代表类事物特征的一套代码;
世界常见的检索语言主要有:



《杜威十进制分类法》 《国际十进制分类法》 《冒号分类法》 《中国图书馆分类法》 《中国人民大学图书馆分类法》 《汉语主题词表》
2.1.2检索语言所具备的功能




(1) 对文献的信息内容及其外表特征加以规范化 的标引; (2) 对内容相同及相关的文献信息加以集中或揭 示其相关性; (3) 可使文献信息的存贮集中化、系统化、组织 化,便于检索者按一定的排列次序进行有序化检 索; (4) 便于将标引用语和检索用语进行相符性比较。

狭义上的检索语言,仅指根据信息检索的需要,按照一 定的规则对自然语言进行规范,并专门用于信息标引和用户 检索的人工语言。

2.1.1 检索语言概述
检索语言又称情报语言、情报存储与检索语 言、文献语言、索引语言、标引语言、标示系 统等。 1.从自然语言中精选出来并加以规范化的词汇;

检索语言

检索语言

33 电子数字计算机 34 电子模拟计算机
317 程序包 319 各种专用程序
35 混合电子计算机
36 微型计算机 38 其它计算机
3R95151 信造息血处系理疾病
类目之间的关系: ❖从属关系 ❖并列关系
39 计算机的应用
-
392 各种专用数据库 393 计算机网络 399 在其他各方面的应用
《中图法》类目表等级关系
例:“网络浏览器”类号、类目展开示例: T 工业技术 TP 自动化技术、计算机技术 TP3 计算技术、计算机技术 ……. TP39 计算机的应用
…… TP393 计算机网络
…… TP393.0 一般性问题
…… TP393.09 计算机网络应用程序
…… TP393.092 网络浏览器
信息检索语言和方法 1. 概念
检索语言(Retrieval language) 是用来描 述文献特征和表达检索提问的一种专门语言。不 同的检索语言构成不同的检索标识和索引系统, 提供不同的检索点和检索途径。
-
2. 检索语言的类型
检索语言
描述文献内 容特征的语言
分类语言 主题语言 代码语言
描述文献外 表特征的语言
TP1 自动化基础理论 2 自动化技术及设备 3 计算技术、计算机 6 射流技术(流控技术) 7 遥控技术 8 远动技术
30 一般性问题
312 程序语言、算法语言 313 汇编程序
31 计算机软件
314 编译程序、解释程序
315 管理程序、管理系统
32 一般计算器和计算机 316 操作系统
-
❖论述两个具有从属关系的主题,按较大的概念的 主题入类。即多级主题涉及上下位概念则入上位类。
例:“论软件需求分析方法和工具的选用” 软件需求分析方法 TP311.5 软件工程 工具的选用 TP311.56 软件工具 入TP311.5

检索语言

检索语言

3.靠词标引 某些文献主题过于专指,词表中既无专指主题 词,又无法组配标引则可采用靠词标引。 上位词标引:选用最直接的上位主题词标引。 甲基莲心碱——→生物碱类 近义词标引:选择含义相近的主题词标引。 上消化道出血 ——→胃肠出血 自由词标引
4
.组配标引
主题词——主题词交叉组配
胃溃疡出血 肛温 贲门肿瘤 孢子虫感染 ——→消化的溃疡出血+胃溃疡 ——→体温+直肠 ——→胃肿瘤+贲门 ——→原虫感染+孢子虫纲
中图法二十二个大类
A 马克思主义、列宁主义、 毛泽东思想 B 哲学 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理 N O P Q R S T U V X Z 自然科学总论 数理科学和化学 天文学、地球科学 生物科学 医药、卫生 农业科学 工业技术 交通运输 航空、航天 环境科学 综合性图书
④特征词(Check Tags)
人类、动物、病headings)
副主题词是限定主题概念的规范化词汇,对主题词起 细分作用或揭示多个主题词之间的关系。 副主题词没有独立的检索意义,其作用是增加主题概 念的专指性,提高检索效率 。 副主题词现有82个,使用范围详见37页。

Acquired Immunodeficiency Syndrome ⑵ C2.782.815.616.400.40 C2.800.801.400.40 ⑶ 83 ⑷ see related AIDS Arteritis, Central Nervous System HIV Seroprevalence ⑸ X AIDS X Immunodeficiency Syndrome, Acquired ⑹XR CD4-Positive T-Lymphocytes XR HIV-1

检索语言的定义

检索语言的定义

检索语言的定义
检索语言的定义:
检索语言是一种用于在数据库或文件系统中搜索和获取信息的编程语言。

它是
一种特殊的编程语言,旨在帮助用户有效地执行搜索和过滤操作以从大量数据中提取所需的信息。

检索语言通常用于查询和操作存储在数据库中的数据。

它提供了一种结构化的
方式来定义查询条件和过滤规则。

用户可以使用比较运算符、逻辑运算符和其他操作符来指定搜索条件,以获取满足特定条件的记录。

不同的数据库系统使用不同的检索语言。

一些常见的检索语言包括结构化查询
语言(SQL)和XQuery。

SQL是一种广泛使用的关系型数据库语言,用于管理和
操作关系型数据库。

XQuery则是一种用于XML数据查询和转换的标准查询语言。

除了数据库系统,文件系统中的搜索工具也可以使用检索语言来提供高级搜索
功能。

这些工具在文件中搜索特定的文本字符串或者根据文件属性来搜索文件。

总之,检索语言是一种重要的工具,使用户能够准确、高效地从数据库或文件
系统中检索所需的信息。

它提供了一种灵活和强大的方式来定义搜索条件,以便满足用户的需求。

无论是在数据库管理还是文件管理领域,检索语言都扮演着至关重要的角色。

检索语言的名词解释

检索语言的名词解释

检索语言的名词解释
检索语言,也称为信息检索语言或信息检索词汇,是一种专门设计的语言,用于描述和表示文献主题和内容特征,以便计算机进行信息检索。

检索语言的主要作用是将自然语言中任意性的文本转化为规范化的、可比较的、可操作的检索工具,从而能够高效地检索出所需要的文献。

常见的检索语言包括关键词语言、分类语言和主题语言等。

其中,关键词语言是基于文献中出现的词汇进行检索的语言;分类语言则是根据文献的内容和主题,将其划分到不同的知识类别中,然后通过类别的关系进行检索;主题语言则是将文献的主题进行规范化的描述,形成一个标准化的主题词表,然后通过主题词进行检索。

检索语言在图书馆、情报中心、档案馆、网络搜索引擎等领域广泛应用,是实现信息高效检索的重要工具之一。

检索语言名词解释

检索语言名词解释

检索语言名词解释检索语言就是用来存储和检索信息的计算机程序。

它主要包括三方面的内容:一是作为“目标”的信息,二是由其实现的机器或计算机程序,三是对机器或计算机程序进行有效控制和管理的算法。

在实际应用中,检索语言分两种类型,一种称为“记录检索语言”,另一种称为“过程性检索语言”。

1。

记录检索语言指的是专门针对数据库而设计的程序语言,这些程序语言采用一种表格形式将数据库中的相关信息集中到一个固定位置上。

这样使用者只需要选择他们需要的记录即可。

2。

过程性检索语言是针对数据库中每一条记录的某个特定的字段进行检索,常用的是记录内检索和关键字段检索。

记录内检索通过限制检索范围来实现,关键字段检索则通过确定检索关键字来实现。

3。

数据挖掘3。

数据挖掘(data-mining,简称: dba)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。

4。

事务检索语言的最主要特点是能够直接调用存储于数据库系统中的事务数据,因此,这种检索语言主要用于检索数据库中已有的事务记录,这种检索语言称为事务检索语言。

事务检索语言的基本组成部分是事务数据表。

5。

触发式检索语言的输入与输出必须有一个规律性的控制信号,以便进行数据库的控制操作。

这种控制信号通常由计算机外部提供。

触发式检索语言的典型代表是Windows环境下的SQL语句。

6。

存储过程是一个由SQL语句构成的功能模块,它实际上是一组可执行的语句。

存储过程允许你把一个数据库的大部分操作都写成一个过程,并让这个过程自动执行。

7。

视图(View),是一种图形化显示控制台,它被集成到开发环境中。

视图是一种对象,是一种数据透明的查询手段,它以“快照”形式返回数据库中的数据,并且是动态生成的。

7。

视图是一种对象,是一种数据透明的查询手段,它以“快照”形式返回数据库中的数据,并且是动态生成的。

8。

常用的检索语言

常用的检索语言

常用的检索语言
常用的检索语言包括SQL(Structured Query Language)和XPath(XML Path Language)。

SQL是一种用于管理和操作关系型数据库的语言。

它可以用于创建数据库表、插入、更新和删除数据,以及执行查询操作。

通过使用SQL,用户可以使用简单的语句从数据库中检索信息,并根据特定的条件对数据进行过滤和排序。

XPath是一种用于在XML文档中定位和选择节点的语言。

XML是一种标记语言,用于存储和表示数据。

XPath允许用户使用路径表达式来选择文档中的特定节点或一组节点。

这些路径表达式可以根据节点的名称、属性、位置和关系等进行定义,以便准确地定位所需的节点。

总的来说,SQL用于管理和操作关系型数据库,而XPath用于在XML 文档中定位和选择节点。

两者都是常用的检索语言,用于从数据源中获取所需的信息。

信息检索基础 检索语言及其分类

信息检索基础 检索语言及其分类

《中国图书馆图书分类法》
R91下分为R911药物数学、R912药物物理学、R913 药物物理化学、R914药物化学、R915药物生物学。 R914下又分为{R914.1}药物分析、R914.2药物设 计 、 R914.3 无 机 药 学 化 学 、 R914.4 有 机 药 物 化 学 、 R914.5有机合成药物化学。
医学信息检索
检索语言及其分类
教 学
目 标
1
了解检索语言的分类
2
熟悉《中国图书馆图书分类法》
3
熟悉《医学主题词表》(MeSH)
了解检索语言的分类
检索语言是信息检索中用来描述文献特征和表达检索提问内容的一种专门性的人工语言,是一组有规则 的、能够反映出信息内容及特征的标识符,用于联系文献信息与用户需求的“语言括主题词和关键词语言。主题词语言与关键词语言的区别在于规范化程度不同。 ○关键词又名自由词,中选取的具有实质意义的名词,这种词不受主题词表限制,一般是未经规是从文献范
化或略规范化的词,常用于一般检索或精度要求不高的检索。 ○主题词是规范化词汇,最大的优点是概念准确、专指度高。它对文献中出现的同义词、近义词、多义词以
思 考 题
1
简述检索语言的分类及其特点
2
《中国图书馆图书分类法》分类体系是怎样的
3
主题词与关键词的区别是什么
图1主题:氟哌酸*胃肠炎 图2 主题:诺氟沙星*胃肠炎
《医学主题词表》(MeSH)
主题检索语言是信息检索语言中检索效率较高、使用频率较多的一种语言。人们为了更快更 好地检索文献,将概念更准确、专指度更高的反映文献内容的主题词编制成专门的主题词表, 供大家使用。目前国内最常用的主题词表是《医学主题词表》(MeSH)、《中医药学主题 词表》和《汉语主题词表》。 《医学主题词表》(MeSH)是美国国家医学图书馆从1960年起编制,并于1963年正式使 用的一部规范化的可扩充的动态性叙词表,是生物医学领域具有权威性的主题词表。MeSH 主要包括主题词表和树状结构表两个部分。

第四章 检索语言

第四章 检索语言

4、聚类法
在对检索词进行统计的基础上,将有关的索引次进行聚类,可以查出更多 的文献,从而改善查全性。 例如:“枯萎” 是与 “庄稼”、“植物生长” 联系在一起的,如果 “锈菌”也是常与 “植物生长”等词联系在一起的话,我们就可以推断 “枯萎” 与 “锈菌” 之 间存在某种联系。
二、索引语言
5、组 配
2、唯一性
指一个词只应有一种概念,一种概念,一种概念只应由一个词来表达,即 不能模棱两可、一词多义或者多词一义。
3、简洁性
也可以称为压缩性或致密性。这是指表达一定情报含量所要求的一个索引 词的长度与大小。
4、经济性
这里主要指: A、标引一个或多个索引词来表达文献主题内容是做出决策所花的时间代价; B、选择合适的检索词来表达自己情报需求的时间; C、培训人们使用这种语言的花费、辞典的编制与维护、改错的费用等。
二、索引语言
(二)索引语言的结构与种类
结构
反映文献内容特征的索引语言由两部分组成: 词汇 和 句法。 词汇,是索引记录中用来表达文献内容的词的集合。 例如:分类号码的集合,就是分类法这种语言的词汇。 句法,是将词汇中的单元(词)组成语言单元的一套规则。这种语言单 元(句法单元)可能是基本词汇所不能表达的,因而它是扩展词 汇表达能力的手段。 例如:由句法组成的 “学校实验室” 这种概念是基本词汇所不能表达的。
第四章 检索语言
检索语言概述 索引语言 索引Байду номын сангаас言的举例 计算机检索语言
一、检索语言概述
文献存贮时,文献的内外特征按照一定的语言来加以描述,而检索 时情报提问也是按照一定的语言来加以表达。所以这种把文献的存贮与 检索联系起来,把标引人员与检索人员联系起来,以便取得共同理解、实 现交流的语言,就叫做情报检索语言。 检索语言,就其描述文献的有关特征而言,可分为: 描述文献外表特征的语言和描述文献内容特征的语言两大范畴。

文献检索语言

文献检索语言

文献检索语言
文献检索语言是指在进行文献检索时使用的语言。

常见的文献检索语言包括但不限于以下几种:
1. 英文(English):英文是国际学术交流中最为普遍的语言之一,许多重要的学术期刊和数据库都以英文为主要语言进行出版和检索。

2. 中文(Chinese):中文是世界上使用人数最多的语言之一,在中国及其他华人地区的学术界有着广泛应用。

许多重要的学术期刊和数据库也提供中文文献的检索服务。

3. 日文(Japanese):日本是一个科研强国,许多重要的学术成果和研究文献以日文出版。

对于研究日本相关领域的学者来说,使用日文进行文献检索是非常重要的。

4. 德文(German):德国在许多学科领域具有重要影响力,因此德文文献的检索对于研究该领域的学者来说至关重要。

除了以上几种常见的文献检索语言外,还有其他语言如法语、西班牙语、俄语等也在特定的学术领域有着重要地位。

在进行文献检索时,根据自己的研究领域和需求选择相应的语言进行检索可以提高检索效果和准确性。

1。

检索语言

检索语言

检索语言检索语言(Retrieval Language)就是组织文献与检索文献时所使用的语言。

也就是说,文献存储时,文献的内容特征(如分类、主题)和外表特征(如书名、刊名、篇名、号码、著者等)按照一定的语言来描述,检索文献时的提问也按照一定的语言来加以表达。

这种在文献的存储和检索过程中,共同使用、共同遵循的语言就是检索语言。

实质上它是标引和检索之间的约定语言,是人与检索系统对话的基础,检索的匹配就是通过检索语言的匹配来实现的。

使用检索工具和检索系统必须掌握检索语言,它是掌握和提高检索技能的基础。

检索语言的基本成分是检索词。

按检索词的规范化程度和组配程序,检索语言可分为自然语言(Natural Language)和人工语言(Artificial)两种。

自然语言采用的检索词是未加工整理和规范过的,即平常采用的关键词,这种语言又称作关键词语言(Keyword Language)。

人工语言采用经过规范化的词,规定一个词表示一种事物,例如规定“aircraft”表示飞机,而不用“air plane”、“plane”和“aeroplane”,以做到文献存储和检索的一致性。

信息检索语言是根据检索需要而创制的人工语言,也称检索标识系统,专门用于各种手工和计算机信息检索系统。

从不同角度检索文献,就有不同种类的检索语言,常用的有主题语言和分类语言,下面分别加以论述。

(一)分类语言分类语言是用分类号和相应分类款目来表达各种概念的,它以学科体系为基础将各种概念按学科性质和逻辑层次结构进行分类和系统排序。

分类语言能反映事物的从属派生关系。

便于按学科门类迸行族性检索。

分类语言中最常见的是体系分类语言,它按照学科体系从综合到一般、从复杂到简单、从高级到低级的逻辑次序逐级展开,世界著名的分类法有:《国际专利分类表》(IPC)、《杜威十进分类法》(DDC)、《美国国会图书馆图书分类法》(LC)、《中国图书馆图书分类法》(中图法)和《中国科学院图书馆图书分类法》(科图法)。

检索语言

检索语言

单元词语言
它是从文献内容中抽取出来的,以不能再分解 的概念单元的规范化名词作为文献主题概念的标 识。 单元词也称元词,元词语言是后组语言,它将 一些元词在检索执行时组合起来使用。 元词的组配仅限字面组配。单元词检索具有灵 活、自由的组配方式。
思考: 课题的分类标引和主题标引
1、统计技术在信息检索中的应用 2、电子商务的安全性问题研究 3、大量数据的备份与恢复 4、ADO与SQL在VC中共同实现数据库操作 5、在C语言中如何实现数据库的访问 6、教务管理系统的设计与实现 7、网络技术在社区医疗服务的应用 8、单片机与液晶显示器的接口及应用
3、大量数据的备份与恢复 TP309.3 数据备份与恢复 数据备份 数据恢复
J、艺术 K、历史、地理
基本大类
N、自然科学总论
O、数学科学和化学 P、天文学
Q、生物科学
R、 医药、卫生 S 、农业科学
中图法22个基本大类(一级类目)
T、工业技术
基本大类
U、交通运输
V、航空、航天 X、环境科学 Z、综合性图书
《中图法》层层隶属、逐级展开的逻辑体系

30
一般性问题

例:
完美 完美世界 完美主义 …… 胃 胃溃疡 胃炎 胃癌
单级标题:由一个标题词构成 单词标题: 如Romances、物质财富等; 词组标题:如Japanese literature、国家财 富; 短语标题: 如反对自由主义 多级标题(复合标题):由两个或两个以上的 标题词,采用组配符号联接所构成。 多级标题: 如“哲学-手册” 限定标题: 如“红楼梦(越剧)” 带说明语的标题: 如: Sports-England, London Metropolitan area

检索语言

检索语言

分类检索语言
• 分类检索语言是将各种知识领域(学科及 分类检索语言是将各种知识领域( 其研究问题) 其研究问题)的类目按知识分类原理进行 系统排列,以代表类目的分类号( 系统排列,以代表类目的分类号(如字母 符号、数字等) 符号、数字等)作为文献标识的一类检索 语言。 语言。
分类检索语言
• 文献分类法是根据文献所反映的学科知识内 容及其他特征,分门别类地、 容及其他特征,分门别类地、系统地揭示和 组织文献的一种方法。 组织文献的一种方法。其主要目的是为了满 足人们按学科知识体系检索文献的要求。 足人们按学科知识体系检索文献的要求。 • 文献分类法通常分为等级体系分类法(亦称 文献分类法通常分为等级体系分类法( 等级列举式分类法或体系分类法)、 )、分面组 等级列举式分类法或体系分类法)、分面组 配分类法两种基本类型, 配分类法两种基本类型,也有将两者结合编 制而成的等级—组配分类法 组配分类法。 制而成的等级 组配分类法。其中以体系分 类法最为常用,重点介绍《 类法最为常用,重点介绍《中国图书馆分类 法》
R 医药、卫生 医药、
S 农业科学 T 工业技术 U 交通运输 V 航空、航天 航空、 X 环境科学、安全科学 环境科学、 Z 综合性图书
中国图书馆分类法
4. R 医药、卫生 大类下设 个二级类目 医药、 大类下设17个二级类目 R1 预防医学、卫生学 预防医学、 R2 中国医学 R3 基础医学 R4 临床医学 R5 内科学 R6 外科学 R71 妇产科学 R72 儿科学 R73 肿瘤学 R74 神经病学与精神病学 R75 皮肤病学与性病学 R76 耳鼻喉科学 R77 眼科学 R78 口腔科学 R79 外国民族医学 R8 特种医学 R9 药学
图书分类号举例: 图书分类号举例: R28 《中药学》 R28-61《中药学辞典》 中药学》 《中药学辞典》 R28-64 《中药学图谱》 中药学图谱》

002-检索语言

002-检索语言
19
第2章 检索语言
• 它将学科分为五大部类,分别是马克思 主义、列宁主义、毛泽东思想;哲学; 社会科学;自然科学;综合性图书。在 五大部类下,又分为22个大类,这22个 大类的类号分别用22个大写的英文字母 代表。
20
第2章 检索语言
基本部类 基本大类 1.马克思主义、列 A.马克思主义、列宁主义、毛泽东思想、邓小平理 宁主义、毛泽东思想、 论 邓小平理论 2.哲学 3.社会科学 B.哲学 C.社会科学总论 D.政治、法律 E.军事 F.经济 G.文化、科学、教育、体育 H.语 言文字 I.文学 J.艺术 K.地理、历史
●介绍检索语言的概念、功能及 类型 ●重点讲述体系分类检索语言 ●重点讲述关键词主题检索语言
3
第2章 检索语言
2.1 检索语言 概述 2.1.1 检索语言的概念
检索语言又称为索引语 言、存储检索语言、文献工 作语言、标引语言、标识系 统等,是检索系统进行存储 和检索时所使用的语言,是 专门用于各种手工和机器文 献检索系统描述文献的特征 和表达检索提问的一种人工 语言。
32
第2章 检索语言
举例: 如:《供应链管理》 分类:F——经济 F2——经济计划与管理 F25——物资经济 F252——物资流通
33
第2章 检索语言
示例: 书名 分类号 1、《笑傲江湖》 I247.4 2、《国际经济法》 D99 3、《企业管理理论与方法》F270 4、《计算机网络系统结构分析》TP39
N949系统科学在各方面的应用
F252.3物资流通费用、资金和利润
23
第2章 检索语言
《中图法》的类目标记:采用拉丁字母与阿拉伯数字相
结合的混合制标记符号。 • 类目级别 基本大类是类分图书的第一级类目,随着内容的细分,在 一级类目下还有二级类目、三级类目、四级类目…… 如:F 经济 一级类目 F2 经济计划与管理 二级类目 F25 物资经济 三级类目 又例:F252 类目下的图书都是内容为物资流通方面的图书。 (是四级类目) H31 类目下的图书都是内容与英语相关的考试类、语法、 或中英文对照等图书。(是三级类目)

信息检索之检索语言

信息检索之检索语言

布尔逻辑算符:逻辑或
组配方式:A OR B或者A+b,表达检索成果具 有A或具有B,或同步包括A,B两个概念旳文件。 它主要应用于概念之间旳并列关系。
1作用:检索“微量元素铜、铁、锌与小朋 友营养不良”旳文件(铜OP铁OR锌)AND(婴 儿OR幼儿小朋友)AND营养不良
2 例如:aspartame O R saccharine O R swweetener*
检索语言是应文件信息旳加工、存储和 检索旳共同需要而编制旳专门语言,是体 现一系列概括文件信息内容和检索课题内 容旳概念及其相互关系旳一种概念标识系 统。
什么是分类语言?
分类语言也称分类法。用分类号和相应旳分类 款目来体现多种概念,以学科体系为基础将多 种概念按学科性质和逻辑层次构造进行分类和 系统排序,能反应事物旳隶属派生关系,便于 按学科门类进行族性检索。按照分类方式旳不 同,分类语言又分为体系分类语言、组配分类 语言和混合分类语言。
分类语言旳特征
1.体现文件外部特征旳检索语言 2.体现文件内部特征旳检索语言
(一)体现文件外部特征旳检索 语言
体现文件外部特征旳检索语言主要是指文件 旳篇名(题目)、作者姓名、出版者、报告号、 专利号等。将不同旳文件按照篇名、作者名称 旳字序进行排列,或者按照报告号、专利号旳 数序进行排列,所形成旳以篇名、作者及号码 旳检索途径来满足顾客需求旳检索语言。
布尔逻辑运算:逻辑非
1:组配方式:A NOT B, A-- B表达。检索成果 即为再还有概念A旳文件中,排除同步具有B旳 概念。 2:作用:排除无关概念,用来缩小检索范围, 提升查准率。 3:实例:ands NOT hearing 检索具有“aids” 旳数据,排除具有”hearing”旳文件。

检索语言类型

检索语言类型

检索语言类型检索语言类型是指根据特定的关键词或语句来搜索并确定文本或文章所属的语言类型。

在信息爆炸的时代,检索语言类型的需求日益增长,尤其是对于翻译、语言学研究和信息处理领域来说,准确判断语言类型是非常重要的。

一、什么是检索语言类型?检索语言类型是指根据特定的关键词或语句来搜索并确定文本或文章所属的语言类型。

目前常见的语言类型包括中文、英文、法文、德文、俄文等。

1. 翻译需求:在进行翻译工作时,需要准确判断待翻译文本的语言类型,以便选择合适的翻译人员或工具。

2. 语言学研究:语言学家需要对不同语言类型进行分类研究,以深入了解语言的特点和规律。

3. 信息处理:在信息处理和文本挖掘领域,需要根据语言类型进行分类和分析,以便更好地处理和利用大量的语言数据。

三、如何进行检索语言类型?1. 关键词检索:根据文本中的关键词或特定词汇进行检索,比如"你好"、"hello"等关键词可以判断文本为中文或英文。

2. 语句结构分析:通过分析句子的结构和语法特点,可以初步判断文本的语言类型。

3. 词频统计:通过统计文本中不同词汇的出现频率,可以判断文本所属的语言类型。

四、检索语言类型的应用领域1. 翻译工作:在翻译行业中,准确判断语言类型是保证翻译质量的关键。

2. 语言学研究:语言学家可以通过分析不同语言类型之间的差异和共性,深入研究语言现象。

3. 信息处理和文本挖掘:在大数据时代,对海量的语言数据进行分类和分析,可以帮助人们更好地处理和利用信息资源。

五、检索语言类型的发展趋势随着人工智能和自然语言处理技术的不断发展,检索语言类型的准确性和效率将得到进一步提高。

未来可能出现更智能化的语言类型检索工具,能够根据更多的语言特征和数据进行判断。

同时,多语种的检索语言类型技术也将得到广泛应用,以满足全球化时代多语言交流的需求。

六、总结通过检索语言类型,我们可以准确判断文本所属的语言类型,从而进行翻译、语言学研究和信息处理等工作。

检索语言名词解释

检索语言名词解释

检索语言名词解释检索语言是信息科学的一个重要分支,是指用来描述信息资源的语言,可以用来检索信息和文献资源。

它的发展,为信息检索提供了有力的手段。

这里介绍了检索语言名词的几个重要术语,以便大家更好地了解检索语言的本质。

首先,关键词是检索语言中最基本的概念,它是描述资源与相关内容的单词或词组,是信息检索的基础。

关键词可以是单词、词组或句子,比如书名、作者、术语、主题和地理位置等。

其次是检索语言标记。

标记是一种符号,可以用来表示关键词之间的关系。

例如,使用标记“#”可以表示关键词之间的范围,使用标记“$”可以表示关键词之间的耦合。

简而言之,标记可以帮助用户更好地表达搜索意图,并获得更准确的检索结果。

另外,Boolean表达式也是检索语言中的一种重要术语。

Boolean 表达式是一种逻辑表达式,是检索语言中最重要的概念之一。

它可以用来表示用户的搜索意图,比如“X AND Y”(X和Y),“X OR Y”(X 或Y),“NOT X”(非X)等。

简而言之,Boolean表达式可以帮助用户更有效地检索相关的信息,并更精准地定位信息资源。

再者,检索语言还包括计算机可以识别的语法和模式,这些语法和模式用来描述搜索查询,以及检索引擎如何处理搜索查询。

例如,搜索查询(Query)、字段(Field)、限定符(Modifier)、通配符(Wildcard)、短语搜索(Phrase Search)、逻辑操作符(logical operator)和检索限定(retrieval limit)等等,这些术语可以帮助搜索引擎更准确地检索资源,从而获得更加准确的检索结果。

总之,检索语言是信息科学的一个重要分支,在信息检索中有着重要的作用。

它涉及的名词有关键词、检索语言标记、Boolean表达式、搜索查询、字段、限定符、通配符、短语搜索、逻辑操作符以及检索限定等等。

掌握了这些概念,将能够帮助用户更有效地检索信息资源,得到更准确的检索结果。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
I25 中国小说 R521.2 支气管淋巴结核
类名或类目
分类号
资料法中的类号
注释
体系分类法的作用
强调知识的系统化组织 符合人们认识事物的习惯 便于检全某一学科、专业的文献 因课题可随时扩大或缩小检索范围
主题语言 以反映文献内容的主题词或关键词作
为文献存储和检索的标识,并按一定的顺
序排列而成的一种检索语言。 优点:直接性、专指性强,比较适合专 深课题的检索。 主题词、关键词
neoplasm

neoplasm carcinoma
使用规范化的词能相对提高检索效率,但对检索 者和情报存储人员选词上要求比较严格。
按描述的内容划分
题名、刊名 文献外表特征 责任者姓名 专利号、档案号等
检 索 语 言
文献内容特征
分类语言 主题语言
分类号
叙词
关键词
分类语言
是使用分类方法将文献主题概念区分、 归纳形成类目体系,然后以号码为基本字符 ,用分类号表达类目体系中每个主题概念的 检索语言。 体系分类法、分面组配式分类法、 半分面分类法
类目按概念之间的逻辑隶属关系,再往下 逐级展开,划分出更专指、更具体的类目。
如“R521.2支气管淋巴结核”
R R5 R52 R521 R521.1 R521.2 医药、卫生 内科学 结核病 肺结核 原发综合征 支气管淋巴结核
《中图法》的分类号采用拉丁字母和阿拉 伯数字相结合的混合号码。当一个类号的数 字超过三位时,为了醒目而加上圆点‚.”, 并无其他意义。
由简单至复杂进行层层划分,逐级展开,形成
一个严格有序的直线性知识门类等级体系。
《中国图书馆分类法》(CLC) 主 要 类 型 《中国图书资料分类法》
《中国科学院图书馆图书分类法》
《美国国会图书馆图书分类法》 《杜威十进分类法》
中国图书馆分类法
简称《中图法》,为国内94%的信息机 构所使用。 1975年首次出版,1999年出版第四版, 并随后推出电子版。2010年9月已出版 第五版。
主题语言
字顺表的参照系统
“见‛、‚代‛参照(款目 词) “属‛、‚分‛参照 (91年取 消) 相关参照
“见”、“代”参照
用于规范同义词、近义词,反映词与 词之间的同义关系。
例1 例2 Cancer
款目词
see

Neoplasms
主题词
Tumor
see
Neoplasms
逆参照:
例3 Neoplasms 主题词 X(代) Cancer X Tumor
医学主题表(MeSH)
先天性肾发育不全 ①肾疾病(C12)/先天性(C1-12,…) ②肾(A5)/畸形(A1-10,…) 分析:以上两种组配都符合各自的组配范围, 似乎都是正确的,但是‚/先天性‛说明语中规定, 与疾病主题词组配,表明出生时或出生前存在的疾 病,不包括形态学畸形和分娩时的损伤,两者分别 用‘畸形’和‘损伤’。‚/畸形‛的说明语中规 定:与器官组配,表明因先天性缺陷而致器官的形 态改变。②符合说明语的范畴,是正确组配。
(C, F3)
表明诊断的各个方面,包括检查、鉴别诊断及预后, 但不包括普查、放射照相诊断等,对后几种分别用“预防 和控制”、“放射照相术”等。
Nursing 护理
(C,E1-4,F3)
表明对疾病的护理和护理技术,包括诊断、治疗 和预防操作中的护理作用。
副主题词使用举例
例1:查“心脏疾病的治疗”方面的文
不受限制。
缺点: 同一主题的文献可能分散在不同的词
下,从而造成漏检。如要提高查全率, 就必须分别检索表达同一主题的关键 词的同义词、近义词等。
常用主题词表
《医学主题词表》(MeSH) 《医学主题词注释字顺表》 《中国中医药学主题词表》
《汉语主题词表》
医学主题词表(MeSH) 《医学主题词表》( Medical Subject Headings,简称MeSh),是美国国立医学图书馆 编制的权威性主题词表。它是一部规范化的可 扩充的动态性叙词表。美国国立医学图书馆以 它作为生物医学标引的依据,编制了《医学索 引》(Index Medicus)及建立计算机文献联机 检索系统 Medline 数据库。
例如副主题词治疗(therapy)与疾病主题 词组配,可用于综合疗法。例如:消化性溃疡的 心理疗法,用消化性溃疡/治疗;心理疗法组配。
医学主题表(MeSH)
副主题词治疗应用(therapeutic use)
与药物、生物制品和物理作用物主题词组
配,指用于预防和治疗疾病,包括兽医用
药。
例如红霉素治疗链球菌感染,用红霉
副主题词使用说明
Blood 血液 (B2, C, D1-11) (C, F3)
用于表明血液中各种物质的存在或分析,但不包括血 清诊断和积压血清。后两者分别用“诊断”和“免疫学”。
Complication 并发症 Diagnosis 诊断
表明两种疾病同时存在或相继存在的状况,即同时 存在的疾病或后遗症、并发症。

Heart diseases / Therapy 治疗 心脏疾病
例2:查“肝肿瘤 CT诊断”方面的文献
Liver neoplasms / radiography
肝肿瘤 放射照相术
医学主题表(MeSH) 在《医学主题词注释字顺表MeSHAAL》中, 对每个范畴类目的主题词和副主题词的组配原则 进行了严格规定,组配时要按照规则进行。
文献检索教研室 李梅
主要内容
信息组织 分类语言 检索语言 主题语言 主题标引
信息组织
是根据检索的需要,以各种类型的信息 资源为对象,利用一定的规则和方法,依 据信息资源的外部特征或内容特征,通过 对其特征的分析、选择、处理,将无序的 信息资源组织为有序集合的过程。
信息组织与文献检索的关系
信息组织是文献检索的基础和前提。 文献检索则是信息组织的目的和归 宿,是信息组织的反向过程。
词后,系统会自动显示该主题词所能组配
的副主题词。《MeSh》有一个副主题词表,
1989-1990年IM使用的副主题词是77个,
1991-1994年是80个,每年略有变化。目 前使用的副主题词是92个。
副主题词
副主题词(Subheadings) ,与主题词进行组 配,对某一主题词的概念进行限定或复分,使主题词 具有更高的专指性。如诊断(Diagnosis,DI)、药 物治疗(Drug Theray,DT)、血液供给(Blood Supply,BS)等。正确选择副主题词也很关键。
例如肺发育不全,输入主题词‚肺‛后,在副 主题词菜单中选择‚畸形‛表示发育不全;又如双子 宫,用子宫/畸形组配检索。
副主题词表 (Subheading)
abnormalities 畸形 (A1-10,A13-14, B2) administration& dosage (D) 投药与剂量 blood 血液 (B2, C, D1-24, F3) complications 并发症 (C, F) diagnosis 诊断 (C, F3) etiology 病因学 (C, F3) epidemiology 流行病学 (C, F3,Z) metabolism 代谢 (A2-16,B,C,D,F3) virology 病毒学 (A,B1-3,B5-7……)
《MeSh》汇集约20,000多个医学主题词。
Family Health
N1.400.300 91; was see under FAMILY 1979-90 Family Life Cycles see Family Family Planning 主题词
主题语言
N2.421.143.401+ 树状结构号 68; BIRTH CONTROL was see under CONTRACEPTION 1975, was see under FAMILY PLANNING 1968-74, 建词年份 was see heading 1963-67 变更情况 see related 63-67: Family planning see Birth control 参照系统 Contraception 68-74: Birth control see under Family X Birth Control planning 75--: Birth control see under Contraception X Planned Parenthood XR Contraception XR Population Control
体系分类法
概 念 原 理 作 用 类 型
体系分类法
是根据文献所属的学科内容分门别类 地系统化组织、揭示文献的一种方法,亦 称等级列举式分类法、枚举式分类法。 主要用于文献的排架管理和检索工具的 编排组织。
体系分类法的原理
以学科门类为基础,根据文献的内部和某 些外部特征,运用概念划分的原则,按知识门 类的逻辑次序由总体到分支、由一般到具体、
款目词
相关参照
提示主题词含义相近,指引查找相关主题词
主题词 例: Contraception see related 参见 Family planning
相关主题词
Family Planning 主题词 see related 相关主题词 Contraception
副主题词 在进行检索时,用户输入一个主题
对一词多义、多词一义的词语,检索不便
控制语言
又称规范语言、人工语言,采用经过人工控 制的规范性的词语或符号作为检索标目,来专
指或网罗相应的概念,这些规范化的标目能较
好地对同义词、近义词、相关词、多义词及缩
略词等概念进行规范。
例如:‚肿瘤‛
同义词 tumor 肿 tumour cancer
人为规定的词
主题词
相关文档
最新文档