第三周 检索语言-主题检索

合集下载

第三章 计算机检索基础知识

第三章 计算机检索基础知识
在利用计算机进行信息检索的早期,人们只是用单台计
算机的输入输出装置进行检索,用磁带作存储介质,一般为 连续的顺序检索方式。检索部门把许多用户的检索提问汇总
到一起,进行批量检索,然后把检索结果通知各个用户,用
户不直接接触计算机。
联机检索(on-line retrieval)
60年代末,由于计算机软硬件技术的不断提高,出现了一台主机带 多个终端的联机信息检索系统。联机检索是用户利用终端设备,通 过通信网络或通信线路与检索系统联机,进行“人机对话”,从检 索中心的数据库及时查找所需要的文献信息过程。 80年代,发达国家的一些计算机信息联机检索系统,通过卫星通信
注意:这是一种可以不依赖主题词表而直接使用自由词进行检索的技术方法。不同的检 索系统其位置算符的表示方法不尽相同。
截词检索
截词检索就是把检索词截断,取其中的一部分,在加
上截词符号一起进行检索。
• 主要用于检索词的单复数、词性的词尾变化、词根相同的一类词, 以及同一词的拼法变异等。 • 从本质上说,截词算符是一种逻辑“或”的关系。
对信息内容特征进行标引和对信息外部特征进行著录,形成 一条信息题录,并根据信息内容作出摘要,然后将上述检索标识 与著录项目一并填入工作单,就完成了数据库建设的“数据前处 理”工作。
数据库及其编排结构
• 数据库的类型
• 数据库的构成 • 数据库的记录格式 • 数据库的编排结构
数据库的类型
按照信息处理层次划分:
A AND B:检索词A和检索词B同时出现在一条记录中。 • 其作用是缩小检索范围,提高查准率。
例如:查有关“人口控制”的文献,检索式可写成: 人口 AND 控制
逻辑或(OR)
A OR B:记录中出现检索词A或检索词B或两词同时出现 在一条记录中。 • 其作用是扩大检索范围,提高查全率。

信息检索之检索语言

信息检索之检索语言
内容摘要:社会信息化是当代社会的一种大趋势,他正推动着公共行政现在化的进展。信息技术发展对诸如行政人员、行政决策、行政组织、行政方法、行政公文、行政管理模式等公共行政管理要素和过程产生着深远影响。
布尔逻辑检索有哪几种,其功能是什么?
常用的布尔逻辑算符有三种,分别是:
结果:增加检索专指,提高差准率。
描述文献外表特征的检索语言可简要概述为:题名、著者、文献编号等索引。

(一)表达文献外部特征的检索语言
表达文献内部特征的检索语言
分类语言 分类语言是指以数字、字母或字母与数字结合作为基本字符,采用字符直接连接并以圆点(或其他符号)作为分隔符的书写法,以基本类目作为基本词汇,以类目的从属关系来表达复杂概念的一类检索语言。 以知识属性来描述和表达信息内容的信息处理方法称为分类法。
文字型数据库是指以文字字符为主要记录内容的数据库,包括书目型、事实型、百科全书型、词库型和全文型数据库。这类数据库主要用于查找相关文献信息。
数值型数据库包括来自科学研究,原始文献或者调查研究的各种数值型或图表型数据库。这类数据库主要用于查找确定对象的特定数值信息。
数据库的成
从使用者观点观察,数据库主要由“-----记录-----字段----”三个层次构成。
文档从数据库的内部来看,文档的概念是指数据库内容的组织形式。一般地说,一个数据库至少包括一个顺排文档和一个倒排文档
记录是文档的基本单元。他是对某一实体的全部属性进行描述的结果。在全文数据库中,一个记录相当于一篇完整的文献:在书目数据库中,一个记录相当于一条文摘或题录。
字段是记录的基本单元。它是对实体的具体属性进行描述的结果。在书目数据库中,记录含有的题名、作者、出版年、主题词、文摘等字段。
基本字段包括题名、文摘、关键词等,是与文献内容相关的字段。辅助字段包括作者、着这单位和期刊名称等,是与文献内容基本相关的字段。

第三信息检索语言

第三信息检索语言

信息检索途径
四. 责任途径
责任途径是依据文献信息责任者的名称特征进行检索的途
径。
责任者一般指作者、译者、编者等。不仅有个人责任者, 还有团队责任者。许多检索工具或检索系统对这些类型的责任 者,都按其名称字顺编制相应的目录或索引。
信息检索途径
五. 引文途径
引文途径是根据文献所附参考文献或引用文献的特征进行
检索语言的概念
检索语言(Retrieval language) 是用来描述文献特
征和表达检索提问的一种专门语言,是根据信息检索的需
要而创建的,又称信息检索语言、索引语言、标引语言、 系统语言等。
检索语言概念及其特点
检索语言的特点
其特点是简明、专指、单一,其主要功能有以下4方面:
1. 是信息的外部特征和内容特征之概念描述的依据和标引
局 限 性
信息检索途径
二. 主题途径
主题途径是根据信息内容的主题特征进行检索的途径。在
信息检索中,主题途径使用较为方便。按照主题词的选词方式 习惯上可分为: 1. 标题索引 2. 单元词索引
3. 关键词索引
4. 叙词索引
信息检索途径
三. 文献提名途径
文献题名途径是根据文献信息外表的名称特征进行检索的 途径。即把文献信息上记录的书名、刊名、篇名等作为文献信 息存储的标识和检索的出发点。
的规则。
2. 对内容相同及相关的信息加以集中或揭示相关性。 3. 使大量的、分散的、杂乱无章的信息加以系统化、有序 性。 4. 便于将标引用语和检索用语进行相献特征划分
二.按组配方式划分
三.按结构原理划分
检索语言种类
一.按表达文献特征划分
1. 行组配的检索语言。
检索语言种类

文献检索知识点复习

文献检索知识点复习

2020年文献检索课程知识点梳理第一章绪论1.信息素养的内容:信息意识,信息知识,信息能力,信息道德2.情报的三个基本要素:知识性、传递性、效用性3.文献的三要素:内容、载体、记录方式例题:以下关于文献的说法正确的有( B )A.可以没有物质载体,但一定要有知识内容B.记载知识内容的物质载体C.可以没有物质载体,但一定要有知识内D.凡是被人们加以利用的知识均可称为文献第二章文献检索基础知识4.《中国图书馆分类法》简称《中图法》,它将知识按照学科属性分为马列主义、毛泽东思想,哲学,社会科学,自然科学,综合性图书五大部类,22个基本大类,其中R代表医学,H代表语言、文字,I代表文学。

图书馆对馆藏资料进行加工的时候,会依据一定的标准分配给每本图书一个索书号,作为工作人员进行图书上架的依据,同时也是读者查找和获取图书的依据。

5. 数据库类型:数值型数据库、事实型数据库、图像型数据库、全文型数据库。

6.按文献内容的加工深度和内容性质划分:(1)一次文献:即原始文献,是以作者本人的工作经验、观察或实际科研成果为依据而创作的具有一定发明创造或一些新见解的文献。

如:期刊论文、专著、科技报告、专利说明、会议论文、学位论文、技术标准等。

(特点:内容先进、成熟,叙述具体、详尽,数量庞大、分散)(2)二次文献:即对一定范围、时间和类型的大量一次性文献按其特征收集整理、压缩、加工,并按一定顺序组织编排、用于检索查找利用这些文献而编制的文献。

如:书目、索引、文摘、题录、简介等。

(特点:汇集性、工具性、综合性、系统性)(3)三次文献:是在充分利用二次文献提供的基础上对一次文献做出的系统整理和概括的论述,并加以分析综合编写而成的概括性文献。

主要包括三种类型:①综述研究,如:专题述评、总结报告、动态综述、进展通讯、信息预测、未来展望等;②参考工具书,如:年鉴、手册、百科全书、词典、大全等;③文献指南,如:专科文献指南、索引与文摘、服务目录、书目之书目、工具书目录等。

主题检索语言

主题检索语言

主题检索语言摘要:一、主题检索语言的定义与作用1.定义2.作用二、主题检索语言的分类与特点1.分类2.特点三、主题检索语言的应用领域1.信息检索2.知识管理3.其他应用四、主题检索语言的发展趋势与挑战1.发展趋势2.挑战正文:一、主题检索语言的定义与作用主题检索语言(Subject Language)是一种用于描述和表示信息主题(Subject)的规范化语言,其主要目的是为了提高信息检索的效率和准确性。

通过使用主题检索语言,用户可以更加方便地在大量的信息资源中找到所需要的内容。

主题检索语言在信息检索领域具有重要作用。

首先,它可以提高检索效率,通过使用规范化的词汇和表达方式,避免用户在检索时使用不同的词汇描述同一主题,从而减少检索结果中的无关信息。

其次,主题检索语言有助于提高检索结果的准确性,通过对主题进行精细化描述,可以减少用户检索时对主题的误解和歧义。

最后,主题检索语言可以促进信息资源的组织和管理,使得信息资源的分类和存储更加规范和有序。

二、主题检索语言的分类与特点主题检索语言可以根据其表现形式和应用范围进行分类。

常见的分类包括:1.分类主题词表:这是一种较为传统的主题检索语言,它通过预先编制好的主题词表来描述和表示信息主题。

分类主题词表具有明确的主题分类体系和规范的词汇表,可以很好地支持信息检索。

2.关键词主题词表:与分类主题词表相比,关键词主题词表更加灵活,它允许用户自由地选择关键词来描述信息主题。

关键词主题词表具有较强的适应性,可以应对不断变化的信息需求。

3.叙词主题词表:叙词主题词表是一种较为复杂的主题检索语言,它通过对信息主题进行详细的描述和叙事,来提高检索的准确性。

叙词主题词表适用于对主题描述要求较高的领域。

主题检索语言具有以下特点:1.规范化:主题检索语言采用统一的词汇和表达方式,避免歧义和误解。

2.层次化:主题检索语言通常采用树状结构来组织主题,方便用户进行逐级检索。

3.动态更新:随着信息资源的不断增加和更新,主题检索语言也需要不断完善和更新。

第三章 文献信息检索基本原理及方法

第三章   文献信息检索基本原理及方法

标题词语言关键词语言单词语言叙词语言检索语言
主题语言 由于不同概念相交就会 形成一个新概念, 形成一个新概念,这个 新概念是组配前各概念的 下位概念。 电子” 下位概念。如:“电子”和 信息”组配产生电子信息。 “信息”组配产生电子信息。 同级词间不同概念并 组配结果,可提高查准率。 组配结果,可提高查准率。 列也会形成一个新概 念,这个新概念是组配 前各概念的上位概念。 前各概念的上位概念。 数字计算机” 如“数字计算机”和“模 拟计算机” 拟计算机”组培后得 到“计算机”这一新的 计算机” 是不同级词间的组配, 是不同级词间的组配,是用 上位概念。组配结果, 上位概念。组配结果, 时间、 时间、空间和学科范围某一 提高查全率。 提高查全率。 方面的属性进行限定的一种 概念关系。 建筑物” 概念关系。如:“建筑物”为 主体事物, 设计” 主体事物,“设计”为某个方 组配结果被限定为“ 面,组配结果被限定为“建 筑物设计”这个新概念, 筑物设计”这个新概念,组配 结果可使检索到的文献专指度 和查全率提高。 和查全率提高。
3.1.1 文献信息检索的基本含义 一、文献信息检索的基本含义
“检索”即“查找”之意。信息检索,是将信息按照一定的方式 检索”即“查找”之意。信息检索 信息检索,是将信息按照一定的方式 组织、存储起来,并针对用户的需要查找所需信息的过程。因此信 息检索包含了信息的存储和检索两个不可分的部分。我们通常所说 的信息检索是指狭义的信息检索,即从检索工具和检索系统中查找 所需信息的过程及其所采取的一系列方法和策略。
手工检索和计算机检索的关系:手检是基础,机检是发展方向。 手工检索和计算机检索的关系:手检是基础,机检是发展方向。
3.1.2 文献信息检索的类型 按检索要求划分: 按检索要求划分: 相关性检索——是系统不直接回答用户所提出的 相关性检索 技术问题本身,而是只提供与之相关的文献供用 户参考。 确定性检索——是以数据或事实为检索对象,系 确定性检索 统要直接问答用户提出的技术问题,即直接提供 用户需要的确切的数据或事实。

文献检索(第三章)

文献检索(第三章)

社 会 科 学
自 然 科 学
(2)主题途径 主题途径
这是通过文献资料的内容主题进行检索的途径,主 题途径依据的是各种主题索引或关键词索引,主题索引 或关键词索引按检索词的字顺排列,检索者只要根据课 题确定了检索词(主题词或关键词),便可以像查字典那 样,按照字顺去逐一查找,从检索词下的索引款目,找到 所需文献的线索。 主题途径检索文献关键在于分析课题,提炼主题 概念,运用词语来表达主题概念。对于主题索引,需 要把自拟的语词同相应的词表核对。主题途径是一种 主要的检索途径。
五 文献信息检索的方法
1.常用法
常用法又称直接法,是指直接利用检索工具(系 统)检索文献信息的方法,这是文献检索中最常用的 一种方法。它又分为顺查法,倒查法和抽查法。
1.1 顺查法
顺查法指按照时间的顺序,由远及近地利用检索 系统进行文献信息检索的方法。这种方法能收集到某 一课题的系统文献,它使用于较大课题的文献检索。 例如,已知某课题的起始年代,现在需要了解其发展 的全过程,就可以用顺查法从最初的年代开始,逐渐 向近期查找。优点是漏检,误检率低,但劳动量较 大。
(1)基本部类:如中图法分五大类部:马列毛邓;哲学; 社会科学;自然科学;综合性图书。 (2)基本大类:构成分类表的第一级类目。中图法为22个 基本大类。 (3)简表:由基本大类与由其直接展开的一、二类目所形 成的类目表。 (4)详表:由简表展开的各种不同登记的类目所组成的类 目表,是文献分类的真正依据。
OPAC :是指以计算机编码形式存贮在计算机 系统内,供读者通过终端设备进行联机检索的 图书馆目录,即书目数据库的一种形式。
2.题录(bibliography 、bibliographic、citation)
题录是单篇文献外表特征的揭示和报导,即对某一文献外部特 征的描述,由一组著录项目构成一条文献记录。 题录的著录项目一般有著者,篇名及出处等,常以一个内容上 独立的文献单元(如一篇文章,图书中的一部分,有时也可以是整 本出版物)为基本著录单位。题录在揭示文献内容的深度方面,比 目录深入,但又比文摘简单。 示例1:

信息检索教程(第三版)PPT6

信息检索教程(第三版)PPT6

3.2.1 概念逻辑
2.概念逻辑方法 检索语言在表达各种概念及其相互关系时,普遍地应用了概念逻辑的原理,有效地利 用了
“概念的划分与概括”和 “概念的分析与综合”这两种逻辑方法来建立自己的结构 体系。 (1)概念的划分与概括 (分类) 即利用概念内涵由反映事物本质属性的概念因素构成,概念因素的增加或减少可以形 成新的
之间相互交叉渗透和综合而形成的新知识领域很困难,也难以反映客观实际中多维的知 识 空间结构。
3.3.2 体系分类法
(三)主要体系分类法介绍 目前,国内常见的体系分类法有 《中国人民大学图书馆图书分类法》,简称 《人大
法》,初版于1953年; 《中国图书馆分类法》,简称 《中图法》,初版于1975年,名为 《中 国图书馆图
1.标引信息内容特征及某些外表特征,保证不同标引人员表达信息的一致性 2.对内容相同及相关的文献信息加以集中或揭示其相关性 3.使信息的存储集中化、系统化、组织化,便于检索人员按照一定的排列次序进行 有
序化检索 检索语言将表达成千上万个信息主题概念的全部信息标识排列成一个有序的系统。排 列
信息标识的方法主要有三种: ①分类排列法,用于号码标识系统; ②字顺排列法,用于 语词标识系统和代码标识系统; ③分类和字顺结合的排列法,即先按照分类排,再按字顺 排,用于语词标识系统 (如分
3.1.3 检索语言的分类
2.描述文献内容特征的检索语言 描述文献内容特征的语言指主要依据文献内容特 征而形成的检索语言,这是检索语言 研究的核心部分,具体有分类语言、主题语言 和代码语言。
3.1.3 检索语言的分类
(二)按结构或原理,可分为分类语言、主题语言、代码语言和引文语言 分类语言用分类号来表达各种概念,将各种概念按学科性质进行分类和系统编排。分

文献信息检索实用教程 第三版 第3章 文献信息检索的类型、语言及工具

文献信息检索实用教程 第三版 第3章 文献信息检索的类型、语言及工具
新世纪应用型高等教育基础类课程规划教材
文 献 信 息 检 索 实 用 教 程 (第三版)
目录
CONTENTS
第3章 文献信息检索的类型、语言及工具
3. 1 文献信息检索的类型 3. 2 文献信息检索的语言 3. 3 文献信息的检索工具 3. 4 文献信息检索的意义和作用 3. 5 文献信息检索的发展趋势
第3章 文献信息检索的 类型、语言及工具
3.检索工具的类型
3. 3 文献信息的检索工具
01 控制一检索性工具
02 资料一参考性工具
03
文献一全文型检索 工具
第3章 文献信息检索的 类型、语言及工具
4.检索工具的结构
3. 3 文献信息的检索工具
文前栏目
主体部分
附属部分
第3章 文献信息检索的 类型、语言及工具
第3章 文献信息检索的 类型、语言及工具
3. 1 文献信息检索的类型
1.按检索对象 划分
文献检索 数据检索 事实检索
2.按检索手段 划分
手工检索 机械检索 计算机检索
3.按检索途径 划分
直接检索 间接检索
4.按检索载体 划分
文献信息检索 非文献信息检索
第3章 文献信息检索的 类型、语言工具3. 2 文献信息检索的语言
第3章 文献信息检索的 类型、语言及工具
3.2.2.检索语言的类型
3. 2 文献信息检索的语言
第3章 文献信息检索的 类型、语言及工具
3. 2 文献信息检索的语言
3.2.3.检索语言的功能
(1) (2) (3)
对信息的内容特征及某些外在特征加以标引.赋子其检索标识.保证不同的标 引者表述信息特征的一致性。
一般情况下.检索工具必须具备以下四个基本条件: (1)必须详细记录文献的外在特征和内容特征。 (2)必须具有既定的检索标识.如主题词、分类号、作者姓名和文献序号等。 (3)必须根据标识的顺序.系统地、科学地排列文献.使其成为一个有机的整体。 (4)能够提供多种检索途径。

信息检索基础 检索语言及其分类

信息检索基础 检索语言及其分类

《中国图书馆图书分类法》
R91下分为R911药物数学、R912药物物理学、R913 药物物理化学、R914药物化学、R915药物生物学。 R914下又分为{R914.1}药物分析、R914.2药物设 计 、 R914.3 无 机 药 学 化 学 、 R914.4 有 机 药 物 化 学 、 R914.5有机合成药物化学。
医学信息检索
检索语言及其分类
教 学
目 标
1
了解检索语言的分类
2
熟悉《中国图书馆图书分类法》
3
熟悉《医学主题词表》(MeSH)
了解检索语言的分类
检索语言是信息检索中用来描述文献特征和表达检索提问内容的一种专门性的人工语言,是一组有规则 的、能够反映出信息内容及特征的标识符,用于联系文献信息与用户需求的“语言括主题词和关键词语言。主题词语言与关键词语言的区别在于规范化程度不同。 ○关键词又名自由词,中选取的具有实质意义的名词,这种词不受主题词表限制,一般是未经规是从文献范
化或略规范化的词,常用于一般检索或精度要求不高的检索。 ○主题词是规范化词汇,最大的优点是概念准确、专指度高。它对文献中出现的同义词、近义词、多义词以
思 考 题
1
简述检索语言的分类及其特点
2
《中国图书馆图书分类法》分类体系是怎样的
3
主题词与关键词的区别是什么
图1主题:氟哌酸*胃肠炎 图2 主题:诺氟沙星*胃肠炎
《医学主题词表》(MeSH)
主题检索语言是信息检索语言中检索效率较高、使用频率较多的一种语言。人们为了更快更 好地检索文献,将概念更准确、专指度更高的反映文献内容的主题词编制成专门的主题词表, 供大家使用。目前国内最常用的主题词表是《医学主题词表》(MeSH)、《中医药学主题 词表》和《汉语主题词表》。 《医学主题词表》(MeSH)是美国国家医学图书馆从1960年起编制,并于1963年正式使 用的一部规范化的可扩充的动态性叙词表,是生物医学领域具有权威性的主题词表。MeSH 主要包括主题词表和树状结构表两个部分。

检索语言

检索语言

检索语言检索语言(Retrieval Language)就是组织文献与检索文献时所使用的语言。

也就是说,文献存储时,文献的内容特征(如分类、主题)和外表特征(如书名、刊名、篇名、号码、著者等)按照一定的语言来描述,检索文献时的提问也按照一定的语言来加以表达。

这种在文献的存储和检索过程中,共同使用、共同遵循的语言就是检索语言。

实质上它是标引和检索之间的约定语言,是人与检索系统对话的基础,检索的匹配就是通过检索语言的匹配来实现的。

使用检索工具和检索系统必须掌握检索语言,它是掌握和提高检索技能的基础。

检索语言的基本成分是检索词。

按检索词的规范化程度和组配程序,检索语言可分为自然语言(Natural Language)和人工语言(Artificial)两种。

自然语言采用的检索词是未加工整理和规范过的,即平常采用的关键词,这种语言又称作关键词语言(Keyword Language)。

人工语言采用经过规范化的词,规定一个词表示一种事物,例如规定“aircraft”表示飞机,而不用“air plane”、“plane”和“aeroplane”,以做到文献存储和检索的一致性。

信息检索语言是根据检索需要而创制的人工语言,也称检索标识系统,专门用于各种手工和计算机信息检索系统。

从不同角度检索文献,就有不同种类的检索语言,常用的有主题语言和分类语言,下面分别加以论述。

(一)分类语言分类语言是用分类号和相应分类款目来表达各种概念的,它以学科体系为基础将各种概念按学科性质和逻辑层次结构进行分类和系统排序。

分类语言能反映事物的从属派生关系。

便于按学科门类迸行族性检索。

分类语言中最常见的是体系分类语言,它按照学科体系从综合到一般、从复杂到简单、从高级到低级的逻辑次序逐级展开,世界著名的分类法有:《国际专利分类表》(IPC)、《杜威十进分类法》(DDC)、《美国国会图书馆图书分类法》(LC)、《中国图书馆图书分类法》(中图法)和《中国科学院图书馆图书分类法》(科图法)。

3课检索语言与主题标引(4、5章)

3课检索语言与主题标引(4、5章)

的形式:(所有词按字顺排列)
1) 单词: neoplasms、 heart、 smoking、 liver、 eye、……
2) 代号: A-23187(卡西霉素) 3) 词组: 顺置词组:liver neoplasms、stomach neoplasms,……
主题语言包括:关键词语言、单元词语言、标题词语言、
叙词语言等,它们有不同的主题词表。主题词表达概念本 身,在主题词表中通过参照系统来指示词汇之间的关系。
8
其他需要注意的检索语言类型划分方式:
按规范程度:自然语言(非规范语言) 、人工语言 (规范语言)
natural language :自然语言是取其自然形态,不受控,使用非 规范词(uncontrolled term)或称自由词(free term)。自然 语言极其丰富、复杂和多样,存在着一词多义、多词一义及词义交 叉的现象。常见的有同义词、近义词、同型异义词等。 artificial language:受信息检索的控制,使用控制、规范词 (controlled term)。人工语言的规范处理重在两个方面:一是 使一个概念只用一个词汇来表达,这样就避免了多词一义的情况; 二是使一个标引词只能表达一个概念,这样就排除了一词多义现象。
历史注释信息说明:“Family Planning”从1968年起用作主题词,但在1963~1967年用 “BIRTHCONTROL”作主题词。在1968~1974年“BIRTH CONTROL”不做主题词,它是属 于主题词FAMILY PLANNING下的次要叙词,到1975年它又属于主题词 CONTRACEPTION(避孕)的次要叙词。 换句话说,欲用《IM》检索计划生育方面的文献,在不同的时期要用不同的主题词检索, 1967年前须用主题词“BIRTH CONTROL”,1968~1974年须用主题词“FAMILY PLANNING”,1975年还须用主题词“CONTRACEPTION”。目前“Family Planning”和 23 “Contraception”这两个词都作主题词,可以相互参照。

3-1检索语言概述

3-1检索语言概述
Natural Language 是指采用Uncontrolled term,即不加规范、不 受控制的Free term,它们直接来自所处理的文献本身的标引用 语或检索用语,在使用前未经优选和规范化处理。
6
2、3 检索语言的谱系
一般地,可以将检索语言类型按亲属关系划分为4个层次,从而构成 检索语言的谱系。
10
9
五、信息检索语言的基本要求
1、保证较高的检全率和检准率。 2、能满足多种检索要求。从学科、专业出发的族性检索,
从事物出发的特性检索,多途径、多因素检索以及检 索范围的自由改变。 3、易于标引,易于检索,减少标引和检索误差。这就需 要语词或符号的明确性,语法的严谨性,标识的直观 性,排序的易理解性,查词查号手段的多样性以及整 个语言包含概念的丰富和完备性等。 4、多方面的适应性。 5、具有与其它检索语言的兼容性和通用性。 6、具有不断进行现代化改造的可能性。
3
二、检索语言的类型与谱系
2、1 依据检索语言的构成原理,把检索语言划分为分类检索语言、 主题检索语言、分类-主题一体化语言、代码语言和引文语言等 类型。
2、2 依据检索语言的受控情况,把检索语言分为Artificial Language 和Natural Language。
此外,可以按检索语言的学科或专业范围、适用范围、检索标识的 组合使用方法以及对信息特征的描述等标准,对检索语言进行划 分。
维方式,它反映概念之间的关系,确定概念的类型、内涵和外延 等。检索语言就是运用概念之间的各种关系,对文献内容和外部 特征进行标引。具体而言,概念的划分与概括,侧重于概念的隶 属关系和并列关系,并据此建立检索语言的概念等级体系。概念 的分析与综合,主要是利用概念的交叉关系,依此建立检索语言 的概念组配体系。 2、基本原理与机制之二:知识分类 知识分类是指以各门科学所研究的运动形态的固有特征及其互相关 联与转变的次序为依据,对整个科学知识领域所做的分类。目的 是考察各门科学之间的区别与联系,确定各门科学的内部结构, 建立相应的分类体系,以反映当代科技水平并指导科学的发展。

3-3主题检索语言

3-3主题检索语言
标题词表:一般由编制说明和主词表等部分构成,主表按主标题 词字顺排序,在同一主标题词下再将与之有关的副标题词逐一排 列。用see和see also显示标题词之间的相互关系。
4
2、2 Uniterm indexing
元词法的概念:以单元词作为检索标识的文献标引和检索方法。 它是对标题法先组式标识进行改革而形成的一种后组式语言。元 词是指能够表达文献主题,经过规范化处理的最小、最基本的词 汇单元,具有概念上的独立性、单元性和规范性的特点。
叙词语言具有严密的语义关系。根据词义的需要,叙词相互之 间有3种语义关系:⑴ 等同关系(用-代),指叙词与非叙词之 间的关系。⑵ 等级关系(分-属-族),指专指度深浅不同的 两个叙词之间的隶属关系。⑶ 相关关系(参-参),指叙词之 间存在一定的关联、交错、对立和矛盾的关系(或称类缘关 系),两者互为参照。
键词法的主要特点: ⑴ 采用语词作为概念标识,直接从文献中抽取关键词。相对于叙词
法、标题法和元词法来说,要求标引水平低,尤其适用于计算机 处理和自动标引。 ⑵ 具有丰富的轮排方式并建立字顺排列体系,检索非常方便。采用 键词法的检索系统是时差最短和最经济的检索系统。 ⑶ 由于键词的非规范性,词汇质量较粗略,影响到文献检索的查全 率和查准率等。 键词法的表现形式——Keyword Index。
3-3 Subject Retrieval Language
一、主题检索语言的概念与特点 二、主题检索语言的基本类型 三、《汉语主题词表》与文献标引
思考题
1
一、主题检索语言的概念与特点
1、1主题检索语言是指采用描述文献主题的语词标识并按字顺排检的 信息检索语言。一般由主题词表及其编制和使用规则组成。
3
2、1 System of subject heading

文献检索与利用(2000)讲义(4)

文献检索与利用(2000)讲义(4)

马 列 马 列 主 义 毛 泽 东 思 想 、 学 学
哲 综 合 政 治 科 学 总 论 、 体 育 论 律 学 理 总 法 、 事 军 济 、 科 地 学 、 科 经 教 言 文 语 学 文 术 史 然 化 科 学 学 、 科 学 生 卫 艺 历 自 理 球 文 物 、 学 术 数 地 天 生 药 业 科 技 输 天 业 运 航 学 医 农 工 通 、 科 交 空 境 航 环
水 利 工 程
检索语言-分类法- 检索语言-分类法-中图法
O 数理化 …………………………… 一级类目 O1 数学 ……………………………二级类目 二级类目 …… O3 力学 ……………………………二级类目 二级类目 O31 理论力学 ……………………三级类目 三级类目 O311 运动学 ……………………四级类目 四级类目 .1 质点运动 ……………… 五级类目 …… O4 物理学 …………………………二级类目 二级类目
同义词标引--引起漏检 同义词标引 引起漏检
– 主题 检索体系是按主题 词 字顺排列的,而用于 标引的关键词呈现出多种字面形式-同义词时, 将使同一主题的文献分散到不同的字顺位置, 使查全率受到影响。
例:飞机
Airplane Aircraft Planes
主题词种类- 主题词种类-关键词
多义词标引--引起误检 多义词标引--引起误检 -- 多义词 cell 电池 两个完全不同的概念 细胞 检索词 cell 查找细胞方面的文献 结果: 电池、 结果: 电池、细胞两方面的文献同时 被检出
中图法- 中图法-图书的排架顺序
按索书号排架 先顺序分类号, 先顺序分类号,对位排列 再顺序书次号 –种次号:由数字构成,按数字大小顺序 –著者号:由字母和数字构成,对位排列

检索语言--医学文献检索

检索语言--医学文献检索
14.12.2 中医诊断学、治疗学 14.12.21 脉学 14.12.22 四诊八纲 14.12.221 望诊 14.12.222 闻诊 14.12.223 问诊
实习:图书馆的利用
了解: 图书分类法:《中图法》、《人大法》 图书排架方法:图书馆架上的图书按索 书号从小到大、从左至右排列的。
下一页
作用
使文献存储与文献检索两个过程实现语言表述上 的统一,从而使文献标引者和检索者在文献的特 征描述上达到一致。
┌──┐ ┌──┐ ┌─┐ ┌────┐ ┌─┐ │一次│ 分析 │文献│ 根据 │检│ 标引 │文献特征│ 编排 │ │ 存贮│ ├──→│ ├──→│ ├──→│ ├──→│信│ │文献│ │特征│ │ │ │ 标识 │ │息│ 过程└──┘ └──┘ │索│ └────┘ │检│ │ │ │索│ │ │ │系│ ┌──┐ ┌──┐ │语│ ┌────┐ │统│ 检索│待查│分析 │检索│ 根据 │ │拟定 │ 检索 │ 检索 │或│ │ ├──→│提问├──→│ ├──→│ 提问 │ │工│ 过程│文献│ │词 │ │言│ │ 标识 │ │具│ └──┘ └──┘ │ │ └────┘ │ │ └─┘ └─┘

主题词:表达确切的概念,用来标引和检索文词:是对主题词起定性、修饰、限定的一类 规范化词汇,其作用是增加主题词的专指性,提高 检索效率。

入口词(款目词):指主题词的同义词或近义词, 不能用来标引和检索文献;
以见代参照(See)的方式引导使用者查找相应的 主题词;如:Acetylsalicylic Acid (乙酰水杨酸) see Aspirin(阿斯匹林)。
《中图法》中国医学类目(三级)
R21 中医预防、卫生学 R22 中医基础理论 R24 中医临床学 R25 中医内科 R26 中医外科 R271 中医妇产科 R272 中医儿科 R273 中医肿瘤科 R274 中医骨伤科
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
正式主题词及入口词;
又称主表,是词表的主体部分,收录全部的
所有主题词和入口词按汉语拼音字母顺序 排列; 主题词与主题词、主题词与入口词之间用
参照系统相互关联。
(1)主题词著录格式
以“肝火上炎”为例
注 释


gan huo shang yan1 1.主题词的汉语拼音 肝火上炎2 2 .主题词 LIVER FIRE FLAMING-UP 3 3.主题词英译名 TC23.10.10.15.25.25.15.154 4.树状结构号 TC23.10.10.20.10.40.15. 4 属实火;属里实;属肝系证候;肝经气火上逆所表现的证候; 生理状态下的肝火用肝阳5.1 5.1 标引注释 95;1987-1994 肝火亢盛5.2 5.2历史注释 用肝火亢盛检索1995年前文献5.3 5.3.检索注释 C 肝阳上亢6.1 6.1. 指引至概念相关的主题词 D 肝火亢盛6.2 6.2指出正式主题词的同义词或代词
返回
《中国中医药学主题词表》

概况

由中国中医研究院中医药信息研究所编辑出 版 ;主要供中医药人员使用。 目前新版词表共收主题词8307多个,副主题 词5598个。 在《汉语主题词表》(中医药学部分)的基 础上编制而成的,同时借鉴了《MeSH》词表 的结构和体例。


结构(3部分):
1.
字顺表
《中图法》二级类目(医学)
R1 预防医学、卫生学 R2 中国医学 R3 基础医学 R4 临床医学 R5 内科学 R6 外科学 R71 妇产科学 R72 儿科学 R73 肿瘤学 R74 神经病学与精神病学 R75 皮肤病学与性病学 R76 耳鼻咽喉科学 R77 眼科学 R78 口腔科学 R79 外国民族医学 R8 特种医学 R9 药学
* 一个字母标志一个大类,在字母后用数字表示 大类下各下级类目的划分; * 分类号的位数代表类目的级数;R241
2. 为使类号清晰易辩,数码满3位便用“.”分隔 开,并无特殊含义。 R241.1脉学, R241.24色诊
《人大法》

1954年初版,在我国分类法史上揭开 了新的一页。 是我国第一部力图以马列主义、毛泽 东思想为指导编制的图书分类法。
返回
主题语言
(1) 概念 (2)特点 (3)类型
主题语言
1. 概念: 直接以自然语言中代表事物、问题、现 象的词语作为检索标识系统来表达文献 内容主题。
相关概念:
主题:文献内容特征的表达和反映; 主题词:指表征文献内容主题特征的名词和术 语; 主题词表和主题索引:将一系列的主题词按照
其语义或者字顺编制而成的工具书。

主题词:表达确切的概念,用来标引和检索文献的 规范化的名词术语;

副主题词:是对主题词起定性、修饰、限定的一类 规范化词汇,其作用是增加主题词的专指性,提高 检索效率。

入口词(款目词):指主题词的同义词或近义词, 不能用来标引和检索文献;
以见代参照(See)的方式引导使用者查找相应的 主题词;如:Acetylsalicylic Acid (乙酰水杨酸) see Aspirin(阿斯匹林)。
《中图法》中医临床学类目(四 级)
R241 中医诊断学
R242 中医治疗学 R245 针灸学、针灸疗学 R246 针灸疗法临床应用 R247 其它疗法
R248 中医护理学
R249 医案、医话
《中图法》中医诊断学类目(五级)
R241.1脉学 R241.2四诊 R241.3八纲辨证 R241.4病因辨证

基本部类:

马克思列宁主义与哲学 社会科学


自然科学
综合参考
《人大法》一级类目(17个)
1 马列主义、毛泽东思想 2 哲学、附:宗教、无神 论 3 社会科学证、政治 4 经济、政治经济学与经 济政策 5 国防、军事 6 国家与法、法律 7 文化、教育 8 艺术 9 语言、文字 10 文学 11.历史、革命史 12.地理、经济地理 13.自然科学 14.医药、卫生 15.工程、技术 16.农艺、畜牧、水产 17.综合参考
• • • •
《医学主题词表》(ຫໍສະໝຸດ eSH)概况: 由美国国立医学图书馆编制的一部医学专 业主题词表;是目前世界上最权威、最常用 的生物医学主题词表; 国内使用的是中国医学科学院医学情报研 究所编译的中文版; 目前新新版词表共收主题词22000多个, 副主题词82个;入口词10,000多个。
主要结构:
事物概念的词、词组或短语;是主题语言系统中最早的
一种类型 ;

标题词语言:先组式主题语言,主要用于手工检索;
组配规则:用主标题词和副标题词进行组配;事物—方
面、事物—特征;

特点:表现为一种单线序列逐级查阅的方式,灵活性差。
叙词语言

一种后组式主题法,主要用于计算机文 献检索。

组配规则:选多个主题词形成任意合乎 逻辑的组配;
2.检索语言的分类

按照表达文献的特征划分: (重点)
外表标识检索语言
内容标识检索语言
分类语言 主题语言 代码语言
2.检索语言的分类
内容标识检索语言
分类语言 主题语言 代码语言
返回
分类语言
概念:
以学科分类为基础,按照学科范畴及知识 之间的 关系列出类目,以类目的等级关系来表达概念之间
R241.24色诊 R241.25舌诊 R241.26腹诊 R241.29其它
R241.5六经辨证
R241.6脏腑辨证 R241.7经络辨证 R241.8卫气营血和三焦辨证 R241.9其他诊法
说明
1.《中图法》的每一个类目分别用分类名和分类
号进行标识。

分类号 号码;
采用英文字母和阿拉伯数字相结合的混合制
想、邓小平理论
哲学 社会科学 自然科学 综合性图书
《中图法》一级类目(22个)
A 马列、毛泽东、邓小平理论 B 哲学、宗教 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理 N 自然科学总论 O 数理科学和化学 P 天文学、地球科学 Q 生物科学 R 医药、卫生 S 农业科学 T 工业技术 U 交通运输 V 航空、航天 X 环境科学,安全科学 Z 综合性图书
逻辑结构的一种检索语言。
类目:
类名
类号
R2 中国医学 R22 中医基础理论 R24 中医临床学 R248 中医护理学
上下级类目 同级类目
2.检索语言的分类 常用的分类法:
国内:
1988年,《中国图书馆图书分类法》 1954年, 《中国人民大学图书馆图书分 类法》 古代图书分类法:六分法、四分法等 国外: 美国国会图书馆图书分类法(LC) 杜威十进分类法(DC)

特点:灵活性强。
第三节 文献检索语言
1、检索语言的概念 2、检索语言的分类 3、医学文献检索语言
3、医学文献检索语言(医学主 题词表)

汇集各种主题概念的词汇表,是供文献标引 和检索(确定检索词)的重要工具。 常用主题词表: 国内最大:《汉语主题词表》; 医药学领域:《医学主题词表》(MeSH); 中医药学:《中国中医药学主题词表》。 综合:一体化医学语言系统(UMLS)
关键词----是直接从文献的题名、摘要和正
文中抽选出来的,具有实质意义,并在表 达文献主题上具有关键作用,未经规范或 略经规范的名词术语;
主要用于计算机、网络检索; 特点:选词自由;易导致漏检或误检。
例:“骨折患者的心理状态分析及护理 ”
标题词语言

标题词:指从自然语言中选取并经过规范化处理,表示
医学文献检索
成都中医药大学
周兴兰
E-mail:gytq@
上次课程内容回顾

文献基础:文献的概念;四大构成要素:知识、物质载体、 符号系统、记录方式。 文献的类型:按加工程度划分为四种:一次、二次、三次、 零次文献的概念和特点;出版形式:图书\期刊

2
本次课程内容
第三节 文献检索语言与技术 第四节 医学文献检索工具
《中图法》中国医学类目(三级)
R21 中医预防、卫生学 R22 中医基础理论 R24 中医临床学 R25 中医内科 R26 中医外科 R271 中医妇产科 R272 中医儿科 R273 中医肿瘤科 R274 中医骨伤科
R275 中医皮肤科 R276 中医五官科 R277 中医其他学科 R278 中医急症科 R28 中药学 R289 方剂学 R29 中国少数民族医学
组配性
组配性指:文献主题表达,是通过多个 主题词的组配来完成。
作用:用有限的主题词表达无限的复杂概念 ; 组配形式:主题词—主题词组配;主题词—副主题词 组配;
先组式组配:先组配方式,主要用于手工检索工具
后组式组配:后组配方式,主要用于计算机检索。
3.主题词的类型
关键词
标题词 单元词
叙词
关键词语言
《人大法》医学类目(17个)
14(1) 医学理论和学派 14(2) 新医通论 14(3) 医学卫生状况 14(4) 医学史、保健史 14.1 卫生与保健 14.2 人体解剖学、胚胎 学 14.3 人体生理学 14.4 病理学、细菌学 14.5 药物学、治疗学 14.6 特种医学 14.7 内科、皮科、儿科 14.8 五官科 14.9 外科、骨科 14.10 妇科、产科 14.11.护理学 14.12.中国医学 14.13.卫生医疗器械、 设备的保管与使用
返回
2.检索语言的分类
内容标识检索语言
分类语言 代码语言 主题语言
返回
代码语言
指对事物的某方面特征,用某种代 码系统来表示和排列事物概念,从 而提供检索的检索语言。
相关文档
最新文档