第二节 检索语言
第二章 检索语言
(一)分类检索语言的类型
1.体系分类法 2.组配分类法
(二)分类检索语言的特点
分类检索语言是信息管理领域经典的 检索语言之一,以1876年《杜威十进分类法》 的问世为标志,已走过了一个多世纪的历 程,形成了自成体系的一套信息组织和检 索方法。
二、分类检索语言结构
(一)类目 1.类目的划分 2.引用次序 3.类目的排列 4.类名的确定 5.类目之间相互关系的处理
一、检索语言的概念 传统意义上的检索语言仅指根据信息
检索需要而创制的人工语言,又称情报语 言、情报存储与检索语言、文献语言、文 献工作语言、索引语言、标引语言、标引 符号、标识系统等。
二、检索语言的基础
(一)概念逻辑 概念逻辑,是一种科学思维方法,通
过明确各种概念及其相互关系而揭示事物 的本质属性及各种事物之间的联系与区别。
词为基础,以概念组配为基本原理,对文 献主题进行描述的后组式检索语言。
(二)叙词表的编制
叙词表是叙词法的核心体现。目前, 国内的叙词表已有七八十种之多。常用的 有《汉语主题词表》、《化工汉语主题词 表》、《机械工程主题词表》、《电子技 术汉语主题词表》、《国防科学技术叙词 表》等。
五、主要主题词表介绍
(一)《汉语主题词表》 《汉语主题词表》是我国第一部大型的
综合性的叙词表,由中国科技信息研究所 和北京图书馆负责主持,1975年开始编制, 1980年正式出版。
(二)《中国分类主题词表》
《中国分类主题词表》是在《中图法》 编委会主持下,经全国40个单位160位专家 学者的共同努力,历时8年编制而成的,于 1994年6月正式出版。
(二)单元词法
单元词又称元词,是从自然语言中选 取,经过规范化处理,表达主题最小的、 最基本的、字面上不能再分的名词术语。
文献检索-第二章 文献检索基本知识(100829)(包括第三章)
二、检索语言的种类
1、按表达文献特征划分
描述文献外部特征 检索语言 描述文献内容特征
学科分类—分类索引
描述 文献 内容 特征
研究对象—主题索引
所包含的关键词—关键词索引
分析单元性概念—叙词索引、单元词索引 分子式、结构式—分子式索引、结构 式索引 地理位置等特种内容—经纬度索引等 特种索引
2、按结构划分 分为分类语言、主题语言、代码语 言、引文语言。
第二节 检索语言
一、检索语言的定义:
从上节“检索原理”可以看出, 必须有同样的检索标识系统(即检索 语言)来标引文献特征和检索提问, 这是文献检索成败的关键。这就要求 信息标引人员和信息用户应当具有必 要的检索语言的基本知识。
文献检索时,检索标识和用户提 问都需要用一定的语言来表达,这种 标引人员表达检索标识和信息用户(检 索者)表达检索提问所共同采用、共同 理解的语言,就是信息检索语言。
②叙词语言 它是以叙词作为文献内容标识和检 索依据的一种主题语言。叙词是从文献 的题目,摘要或正文中抽取出来,用以 表达文献基本内容的概念单元。叙词受 词表控制,词表中词与词之间无从属关 系,都是相互独立的概念单元。检索时, 利用这些概念单元组配起来,表达一个 复杂的概念。叙词语言特别适用于计算 机检索。
③关键词语言 它是以关键词作为文献内容标识和检 索依据的一种主题语言。关键词是从文献 的题目、正文或摘要中直接抽取出来,未 经规范化处理的自由词汇。关键词不受词 表控制,标引文献时根据文献内容选择恰 当的词汇进行组配,以表达文献的内容特 征。
第三节
检索工具基础知识
一、什么是检索工具? 检索工具是积累和查找文献线索的 工具。它报导文献的存在,揭示文献 的内容,帮助科技人员鉴定和选择文 献、开发和利用文献资源。检索工具 具有存贮和检索两方面的功能。
第二章 文献信息检索基础
理的名词术语,具有单一性、组配性好的特 点。
(2)分类语言:直接体现知识分类的等
级制概念标识系统;如中图分类号、杜威 十进制分类法等。
《中国图书馆图书分类法》即《中图法》
《中国图书馆图书分类法》
体现学科的系统性,反映事物的从属、 派生关系,并从上至下、从总体到局部 层层划分,展开,是一种等级分明的语 言。分为五大部类,22个大类,分别用 22个大写字母表示(其中除掉L、M、W、 Y)。
1.前方一致
也叫后截断,将截词符置于一个字符串的后面,以表示其后的有限或无 限个字符的检索。
无限截词
如: ? Physic? 可检出physic、physical、physican、physicalism
有限截词
截断两个字符
中间有 空格
如:? physic?? 可检出physic、physical、physican 截断一个字符 如:? cat? ? 可检出cat、cats
2.3 综合法
综合法又称为循环法,它是把上述两种方法
加以综合运用的方法。综合法既要利用检索 工具进行常规检索,又要利用文献后所附参 考文献进行追溯检索,分期分段地交替使用 这两种方法。即先利用检索工具(系统)检 到一批文献,再以这些文献末尾的参考目录 为线索进行查找,如此循环进行,直到满足 要求时为止。 综合法兼有常用法和追溯法的优点,可以查 得较为全面而准确的文献,是实际中采用较 多的方法。
能包含特征B。可以缩小检索范围,有利于提高查 准率。 A – B(逻辑非)
例:自由分配方面的文献(排除海南大学师生的著作) 提问式::(关键词=‘自由分配’) not (单位=‘海南大学')
三、位置算符
也叫邻近检索, 在检索词之间使用, 规定算符两边的检索词出现在记录中
第2章 检索语言
广义上的检索语言,指信息检索过程中涉及的人工语言 和自然语言。
人工语言是根据一定的规则人为编制而成的检索语言,有严格的使用规则,可用 于表述文献主要内容,建立信息检索系统。 自然语言是人类交流时使用的语言,不受任何限制,未经加工和规范。
2.1 2.2 2.3 2.4 2.5 2.6
检索语言概述 检索语言的理论基础 分类检索语言 主题检索语言 分类主题一体化检索语言 网络信息检索语言
2.1 检索语言基本知识
2.1.1 检索语言概述 2.1.2 检索语言的功能 2.1.3 检索语言的类型
2.1.1 检索语言概述
3.代表类事物特征的一套代码;
世界常见的检索语言主要有:
《杜威十进制分类法》 《国际十进制分类法》 《冒号分类法》 《中国图书馆分类法》 《中国人民大学图书馆分类法》 《汉语主题词表》
2.1.2检索语言所具备的功能
(1) 对文献的信息内容及其外表特征加以规范化 的标引; (2) 对内容相同及相关的文献信息加以集中或揭 示其相关性; (3) 可使文献信息的存贮集中化、系统化、组织 化,便于检索者按一定的排列次序进行有序化检 索; (4) 便于将标引用语和检索用语进行相符性比较。
狭义上的检索语言,仅指根据信息检索的需要,按照一 定的规则对自然语言进行规范,并专门用于信息标引和用户 检索的人工语言。
2.1.1 检索语言概述
检索语言又称情报语言、情报存储与检索语 言、文献语言、索引语言、标引语言、标示系 统等。 1.从自然语言中精选出来并加以规范化的词汇;
第二章信息检索语言
D3 小说
D4 散文 ……
C3现代
C4当代 ……
分类语言的标记符号
标记符号:文献分类法中用以表示类目的代号, 又称分类号。 作用:它具有固定类目的位置,明确各个类目的 先后次序,在一定程度上显示类目之间的隶 属、并列关系以及描述某个类目的含义。 标记符号的要求 :
– – – – 容纳性 表达性 简短性 助记性
4.检索语言的类型
• 按规范程度分
– 自然语言 – 规范化语言
• 按组配方式分
– 先组式语言 – 后组式语言
• 按照描述信息特征划分
– 内容特征语言
• 分类语言/主题语言
– 外部特征语言
• 名称语言/著者语言/序号语言
二、分类语言
• 亦称体系分类语言,是以学科范畴和学科体 系为基础来划分事物的一种检索语言。在信 息存储和检索中,它是一种对信息内容的概 念进行逻辑分类和有规律地系统排列而构成 的检索语言,并以分类表(分类法)的形式体现。 • 分类语言最显明的特点是系统性,具有族性 检索的功能,有利于人们从学科专业的角度 进行全面性的检索。
等级列举式分类法
U448各种桥梁 U448.1 桥梁、按用途分 U448.11 人行桥 U448.12 两用桥 U448.13 铁路桥 …… U448.2 桥梁、按结构分
分面组配分类法
地区分面 E1 中国
E2 朝鲜
体裁分面 D1 诗歌
D2 戏剧
时代分面 C1 古代
C2 近代
E3 韩国
E4 日本 ……
• 同一著者的不同作品:
鲁迅:《热风》I210.4 L824 鲁迅:《华盖集》I210.4 L824/2 鲁迅:《两心集》I210.4 L824/3
• 版本不同:
第一节 信息检索及其类型第二节 信息检索语言第三节 信息检...精选版演示课件.ppt
第一节 信息检索及其类型 第二节 信息检索语言 第三节 信息检索技术 第四节 检索工具
gjgj
1
第一节 信息检索及其类型
一、信息检索的概念 二、信息检索的类型 三、信息检索的意义
gjgj
2
一、信息检索
信息检索:是指将信息
(主要指文献信息)按一定 的方式组织和存储起来,并 根据用户的需要找出相关信 息的过程。
2、数据检索
是以数据为检索内容的信息检索,要求从检 索系统存储的大量原始调查数据和其它统计数据中 查出所需的数字资料。
gjgj
5
3、事实检索
是以具体事项为检索内容的信息检索,要求从检索 系统存储的各种原始信息资源中查出专门的事实材料。
4、全文检索
即检索系统存储的是整篇文章或整本图书。
5、图像检索
即以图形、图像或图文信息为检索内容的信息检索。
gjgj
13
标题词语言 是从文献的题目和内容中抽出来,经过规范
化处理的主题语言。
关键词语言 直接从文献信息的标题、摘要或内容本身抽
取出来的用于揭示信息主题内容的自由词。
叙词语言
是以表达文献主题内容的概念单元为基础, 经过规范化处理,可以进行逻辑组配的一种主语
语言。
gjgj
14
第三节 检索技术
一、概念检索 二、布尔逻辑运算符组配检索 三、截词检索 四、字段限制检索 五、位置运算符 六、检索技巧和方法
gjgj
15
一、概念检索
检索标识是具体的检索词或词组,每 个检索词表达一个概念,具体检索时,将 检索词与数据库中的文献特征标识进行类 比,两者相同,则该记录为命中文献。
gjgj
16
信息检索 第二章检索语言
2.3分类检索语言分类检索语言:又称分类法,是将许多类目根据一定的原则组织起来,通过标记符号(分类号)来代表各级类目和固定器先后顺序的分类体系。
体系分类法:基于概念的划分与概括,以学科分类为基础,把概括文献内容与事实的各种类目组成一个层层隶属、详细列举的等级结构体系。
组配分类法:基于概念的可分析性和可综合性,将一个复杂的文献主题概念用若干个表达简单概念的标识组配来表达的一种文献分类法。
一、体系分类法(一)结构分为微观结构和宏观结构。
微观结构指分类法中类目的构成结构。
按照类目之间关系建立起来的类目集合称为类目体系。
类目体系的建立涉及到。
1、类目的划分是把一个类目分成若干小类,从而揭示类目外延的逻辑方法。
类目划分的标准有分类标准、内容标准、形式标准。
类目划分的过程通常是由大到小、由属到种、有整体到部分、由总论到各论、有全面到各方面。
2、引用次序在体系分类法中表现为分类标准的使用次序。
合理的引用次序应满足逻辑性原则、符合检所需要原则、表达性原则。
3、类目的排列直接影响到分类法的质量应体现出系统性、整体性、等级性、逻辑性、连续性、一致性。
4、类名的确定类名的作用是表达类目含义应坚持科学性、确切性、简洁性。
5、类目之间相关关系的处理分类法是依赖于类目之间的相关关系建立起来的。
类目之间的基本关系有从属关系(类目体系中母类与子类的关系,构成分类法类目的纵向排列)、并列关系(在分类法中体现为同位类)、交替关系(使用类目和交替类目之间的关系)、相关关系(在分类法中体现为相关类目)。
宏观结构是按功能分体系分类法的结构。
有以下四部分组成。
1、类目体系按照类目之间关系建立起来的类目集合。
由主表和复分表组成。
主表是由基本部类、基本大类、简表、详表逐级展开而成的类目表。
复分表是供主表有关类目进一步细分用的类目表,有通用复分表和专用复分表两种。
2、标记系统是分类语言所有标记符号的集合。
分类语言的标记符号即分类号,有单纯式号码和混合式号码两种。
第二章 信息检索基本方法与基本技术
2. 主题检索语言
• 标题词:经规范化处理的词或词组,先组式
语言
• 叙 词(单元词):经规范化处理的词或词
组,后组式语言,可自由灵活组配
• 关键词:未经规范化处理,直接从文献题名、
原文或文摘中选取的能反映原文主题内容的自 由词汇
二、检索工具
定义:检索工具是人们用来存储、报道和查找 文献的工具,它具有存储和检索的功能。
点击预约书刊可预约该书 预约图书:选定所需图书,输入证号、密码,执行预约 点击机读格式可查看该书的MARC信息
高级查询
• 在题名、著者、丛书名、主题词、出版社、 ISBN(书)、ISSN(刊)、索取号、起始年 代中填入自己确定的内容,其余的可以不填 写;选定语种(17种)和文献类型,然后进 行检索。 • 结果可检索到所需文献的题名、著者、出版 信息、索取号 • 查看选中图书的相关信息
图书馆信息查询系统
•书目查询 •读信者息 •新书通报:一个月内到馆的新书、馆藏 地,并可查看新书 •订购征询 •信息发布:预约到书列表、超期罚款、 超期催还、委托借阅到书列表
如何利用计算机进行检索
书刊查询
读者信息查询
图书馆主页的功能
信息发布功能:
图书馆最新服务动态、电子 资源试用等均及时在主页上发布。
一、信息检索原理
信息检索的原理(示意图)
存 储
特征化
表示
查 询
特征化
表示
信息 集合
选择与匹配
需求 集合
二、信息检索类型
手工检索 计算机检索 文献信息检索
• 信息检索(内容)
• 信息检索(工具手段)
数据信息检索
事实信息检索
第二节 信息检索语言与工具
一、信息检索语言
信息检索语言
第二节信息检索语言计算机检索的基本原理是将用户的检索提问词与数据库文献记录中的标引词进行对比,当提问词与标引词匹配一致时,即为命中,检索成功。
由此可见,能否准确地检索出用户所需信息,关键在于能否准确地选择检索词。
这里所说的“准确”,是指用户所选的检索词必须与数据库中标引文献记录所用的标引词一致。
然而实际工作中,从事信息存储的人员与从事信息检索的人员绝大多数情况下不可能进行直接的思想交流,因而会造成存储信息与检索信息所依据的规则不一致,导致存入的文献检不出。
为了避免这种情况发生,在信息标引人员与信息检索人员之间必须制定一种共同遵守的规则,即一种约定的相同标识和线路,这就是检索语言。
一检索语言的含义及作用1 检索语言的概念检索语言(information retrieval language),是信息存储与检索过程中用于描述信息特征和表达用户信息提问的一种专门语言。
所谓检索的运算匹配就是通过检索语言的匹配来实现的。
检索语言是人与检索系统对话的基础。
有了这种规则,信息标引人员在进行信息存储的过程中,就会对原始信息进行分析,找出其能代表信息的特征与检索语言(检索标识系统)进行对照标引,然后纳入检索系统;而信息检索人员在进行信息检索的过程中,则先对待查课题进行分析,归纳出各种信息特征,使之形成能代表需要的检索提问,然后把这些提问与检索语言(检索标识系统)进行核对,标引成检索提问标识。
如果没有检索语言作为标引人员和检索人员的共同语言,就很难使得标引人员对文献信息内容的表达和检索人员对相同文献信息内容需求时的表达取得一致,信息检索也就不可能顺利实现。
2 检索语言的工作原理(1)存储:检索系统对文献内容进行分析,概括分析出若干能代表文献内容的语词,并赋予一定的标识,如题名、作者、主题词等,作为存储与检索的依据,然后纳入到数据库中。
(2)检索:检索人员首先要对检索课题进行分析,同样形成若干能代表信息需求的语词,然后通过检索系统在数据库中匹配具有同样语词和标识的文献,找到自己所需的信息。
检索语言
检索语言检索语言(Retrieval Language)就是组织文献与检索文献时所使用的语言。
也就是说,文献存储时,文献的内容特征(如分类、主题)和外表特征(如书名、刊名、篇名、号码、著者等)按照一定的语言来描述,检索文献时的提问也按照一定的语言来加以表达。
这种在文献的存储和检索过程中,共同使用、共同遵循的语言就是检索语言。
实质上它是标引和检索之间的约定语言,是人与检索系统对话的基础,检索的匹配就是通过检索语言的匹配来实现的。
使用检索工具和检索系统必须掌握检索语言,它是掌握和提高检索技能的基础。
检索语言的基本成分是检索词。
按检索词的规范化程度和组配程序,检索语言可分为自然语言(Natural Language)和人工语言(Artificial)两种。
自然语言采用的检索词是未加工整理和规范过的,即平常采用的关键词,这种语言又称作关键词语言(Keyword Language)。
人工语言采用经过规范化的词,规定一个词表示一种事物,例如规定“aircraft”表示飞机,而不用“air plane”、“plane”和“aeroplane”,以做到文献存储和检索的一致性。
信息检索语言是根据检索需要而创制的人工语言,也称检索标识系统,专门用于各种手工和计算机信息检索系统。
从不同角度检索文献,就有不同种类的检索语言,常用的有主题语言和分类语言,下面分别加以论述。
(一)分类语言分类语言是用分类号和相应分类款目来表达各种概念的,它以学科体系为基础将各种概念按学科性质和逻辑层次结构进行分类和系统排序。
分类语言能反映事物的从属派生关系。
便于按学科门类迸行族性检索。
分类语言中最常见的是体系分类语言,它按照学科体系从综合到一般、从复杂到简单、从高级到低级的逻辑次序逐级展开,世界著名的分类法有:《国际专利分类表》(IPC)、《杜威十进分类法》(DDC)、《美国国会图书馆图书分类法》(LC)、《中国图书馆图书分类法》(中图法)和《中国科学院图书馆图书分类法》(科图法)。
002-检索语言
第2章 检索语言
• 它将学科分为五大部类,分别是马克思 主义、列宁主义、毛泽东思想;哲学; 社会科学;自然科学;综合性图书。在 五大部类下,又分为22个大类,这22个 大类的类号分别用22个大写的英文字母 代表。
20
第2章 检索语言
基本部类 基本大类 1.马克思主义、列 A.马克思主义、列宁主义、毛泽东思想、邓小平理 宁主义、毛泽东思想、 论 邓小平理论 2.哲学 3.社会科学 B.哲学 C.社会科学总论 D.政治、法律 E.军事 F.经济 G.文化、科学、教育、体育 H.语 言文字 I.文学 J.艺术 K.地理、历史
●介绍检索语言的概念、功能及 类型 ●重点讲述体系分类检索语言 ●重点讲述关键词主题检索语言
3
第2章 检索语言
2.1 检索语言 概述 2.1.1 检索语言的概念
检索语言又称为索引语 言、存储检索语言、文献工 作语言、标引语言、标识系 统等,是检索系统进行存储 和检索时所使用的语言,是 专门用于各种手工和机器文 献检索系统描述文献的特征 和表达检索提问的一种人工 语言。
32
第2章 检索语言
举例: 如:《供应链管理》 分类:F——经济 F2——经济计划与管理 F25——物资经济 F252——物资流通
33
第2章 检索语言
示例: 书名 分类号 1、《笑傲江湖》 I247.4 2、《国际经济法》 D99 3、《企业管理理论与方法》F270 4、《计算机网络系统结构分析》TP39
N949系统科学在各方面的应用
F252.3物资流通费用、资金和利润
23
第2章 检索语言
《中图法》的类目标记:采用拉丁字母与阿拉伯数字相
结合的混合制标记符号。 • 类目级别 基本大类是类分图书的第一级类目,随着内容的细分,在 一级类目下还有二级类目、三级类目、四级类目…… 如:F 经济 一级类目 F2 经济计划与管理 二级类目 F25 物资经济 三级类目 又例:F252 类目下的图书都是内容为物资流通方面的图书。 (是四级类目) H31 类目下的图书都是内容与英语相关的考试类、语法、 或中英文对照等图书。(是三级类目)
第三章医学文献信息检索基础
一、文献检索方法
• 2. 浏览法 • 通过定期或不定期浏览新近出版的期刊、 专著等文献来了解最新信息的方法。 • 注意选择浏览对象的范围和质量,适合于 平时的学习积累。
一、文献检索方法
• 3. 引文追踪法 • 就是从现有的文献出发,以其后所附参考 文献为线索,去追踪、查找相关文献的方 法。 • 获取的文献越来越旧,获取的信息受论文 作者的影响具有一定的主观性。优势在于 对问题的追根溯源,能够了解经典文献、 追踪科研发展轨迹。
三、文献数据库的检索途径
一、检索语言的概念 二、检索语言的类型 三、常用的医学文献检索语言
第二节 检索语言 一、检索语言的概念
检索语言(retrieval language)又称文献存储与检
索语言、标引语言等,是信息检索系统存储与检索过
程中共同使用的一种专用语言,是在文献检索领域中 用来描述文献特征和表达信息检索提问的一种专用语 言。
第二节 检索语言
二、检索语言的类型
题名 描述文献 外部特征 检 索 语 言 描述文献 内容特征 分类语言 主题语言 单元词 标题词 分类号 关键词 叙词 主题词 受 控 语 言 非 著者 专利号、档案号等 控 语 言
第二节 检索语言 三、常用的医学文献检索语言
(一)中国图书馆分类法
《中国图书馆分类法》简称《中图法》,是目前国内最常
形 目录、索引、文摘等手工检索工具 式 文献数据库、网络等计算机检索工具
信息检索系统
• 信息检索系统,是指根据人类社会对知识 信息的普遍性需要,由一定的硬件设备和 软件条件构成的,具有选择、整理、加工 存储和检索功能的有序化的信息资源集合 体。 • 信息检索系统由硬件设备、计算机软件和 数据库组成。
文 档 1
信息资源检索基础知识
单元词语言
采用单元词通过组配(字面) 来表达文献的主题概念。单元 词是从文献中抽取的,能表达 文献主题的最基本、不能再分 的单元词语。
叙词语言
采用叙词通过概念组配来表达 文献的主题概念。叙词是从文 献内容中抽取的,能表达文献 内容基本概念的并经过规范化 的名词或术语。
关键词语言
以关键词作为文献内容标识 和检索入口的一种主题语言。 关键词是直接从文献中抽取 的,未经规范化处理的自由 词。
领导学 决策学 管理计划和控制 管理组织学 应用管理学
将T类展开
T 工业技术 TB 一般工业技术 4 工业通用技术设备 48 包装工程 482 包装设计 .1纸、纸板 .2林材 .3塑料 …… .其他 485 包装类型 486 包装机械设备 487 包装技术检测 488 包装工厂 489 各类产品包装
TP20 一般性问题 TP21自动化元件、部件 TP23 自动化装置与设备 TP24 机器人技术 TP27 自动化系统 TP29 自动化技术在各方 面的应用
•主题语言
主题语言是采用表达某一事物或概念的名词 术语来标引、存储、检索的一种检索语言。
标题词语言
直接用规范化语词来标引文 献主题,按字顺排列成词表。 主-副搭配
后组式语言
是指在检索前,检索词在词表中没有 被预先组配,检索时用户可根据不同 的检索需求对某些词进行任意组配
第三节 信息资源检索方法
1、布尔检索技术 2、截词检索技术 3、邻近检索技术 4、字段检索技术
3.1布尔逻辑检索技术
布尔逻辑检索是指通过标准的布尔逻辑关 系算符来表达检索词与检索词间的逻辑关 系的检索方法 主要的布尔逻辑关系词有:逻辑与(AND)、 逻辑或(OR)、逻辑非(NOT)
信息检索教程 第二章 检索语言
17
【例题】检索英语会话类辞典,例如《美国语会话百科》、 《英语会话大全》、《现代英汉生活用语图解词典》,请 选择,哪种检索途径才能够同时查出这3本书? 【选项】 A.用关键词“会话”和“词典” B.用中国图书分类号H319.9-61
C.用书名“英语会话”和“大全”
D.用书名“英语会话”和“词典” 【答案】B
2.1.3.3 按信息标识的组合使用方法,可分 为先组式语言、后组式语言和散组 式语言
2.1.3.4 按语言的规范程度,可分为人工语 言和自然语言
3
第2章 检索语言
2.2.1 概念逻辑
2.2 检索语言 的理论基础
2.2.1.1 概念间的关系 不相容 关系
相容关系
同一 属种
整体与 全面与 不相排斥 交叉 部分 某一方面 的并列
10
第2章 检索语言
2.3.2.3 主要体系分类法介绍 国内常见的体系分类法有:
《中国人民大学图书馆图书分类法》,简称《人大法》 《中国图书馆分类法》,简称《中图法》 《中国科学院图书馆图书分类法》,简称《科图法》 《中国档案分类法》
国外常见的体系分类法有:
《杜威十进分类法》(Dewey Decimal Classification)简称DC或DDC 《美国国会图书馆分类法》(Library of Congress Classification)简称LC 《国际十进制分类法》(Universal Decimal Classification)简称UDC
11
《中国图书馆分类法》 第2 章 检索语言
我国目前广泛使用的分类法是《中国图书馆分类法》。它是由国 家图书馆等单位组织全国力量,以学科分类为基础,并结合图书的特 性所编制的分类法。它将学科分五大部类,基本序列是:马克思主义 列宁主义毛泽东思想、哲学、社会科学、自然科学、综合性图书,由 5大部类、22个大类、6个总论复分表、30多个专类复分表、4万余条 类目组成了一个完善的分类体系。 标记制度采用拉丁字母与阿拉伯数字相结合的混合号码制,用一 个字母代表一个大类,以字母的顺序反映大类的序列,在字母后用数 字表示大类下类目的划分,数字的设置尽可能代表类的级位,并基本 上遵从层累制的原则。
检索语言--医学文献检索
实习:图书馆的利用
了解: 图书分类法:《中图法》、《人大法》 图书排架方法:图书馆架上的图书按索 书号从小到大、从左至右排列的。
下一页
作用
使文献存储与文献检索两个过程实现语言表述上 的统一,从而使文献标引者和检索者在文献的特 征描述上达到一致。
┌──┐ ┌──┐ ┌─┐ ┌────┐ ┌─┐ │一次│ 分析 │文献│ 根据 │检│ 标引 │文献特征│ 编排 │ │ 存贮│ ├──→│ ├──→│ ├──→│ ├──→│信│ │文献│ │特征│ │ │ │ 标识 │ │息│ 过程└──┘ └──┘ │索│ └────┘ │检│ │ │ │索│ │ │ │系│ ┌──┐ ┌──┐ │语│ ┌────┐ │统│ 检索│待查│分析 │检索│ 根据 │ │拟定 │ 检索 │ 检索 │或│ │ ├──→│提问├──→│ ├──→│ 提问 │ │工│ 过程│文献│ │词 │ │言│ │ 标识 │ │具│ └──┘ └──┘ │ │ └────┘ │ │ └─┘ └─┘
主题词:表达确切的概念,用来标引和检索文词:是对主题词起定性、修饰、限定的一类 规范化词汇,其作用是增加主题词的专指性,提高 检索效率。
入口词(款目词):指主题词的同义词或近义词, 不能用来标引和检索文献;
以见代参照(See)的方式引导使用者查找相应的 主题词;如:Acetylsalicylic Acid (乙酰水杨酸) see Aspirin(阿斯匹林)。
《中图法》中国医学类目(三级)
R21 中医预防、卫生学 R22 中医基础理论 R24 中医临床学 R25 中医内科 R26 中医外科 R271 中医妇产科 R272 中医儿科 R273 中医肿瘤科 R274 中医骨伤科
文献检索基本知识
读摘要比读原文节省时间,可根据摘要提取关键词,集中概览或略读 大量相关文献。
例4国数据机床的现状及发展趋势/郝安林
(安阳大学).-安阳大学学报:综合版,2004(2);2123
题录部分
在国际贸易中,很多发达国家把数控机床视为具有
高技术附加值、高利润的主要奠基出口产品。世界贸易 强国在进行国内电机产品贸易的同时,把高技术的电机
产品出口打入国际市场,作为发展出口经济的重要战略
措施。
文摘内容
浅谈数据机床选购时应注意的事项/常正军(甘 肃理工大学机械厂).-甘肃科技,2004(5);90 就选购数控机床规格、精度、结构、附件等若干
问题进行了探讨。
重庆维普期刊数据库记录文摘显示格式
4、书目的书目
书目的书目是具体介绍常用工具书及其 使用方法的检索工具书。如《古今中外人 物传记指南录》、《中外专利数据库检索 指南》、《英国政府出版物指南》、《工 具书指南》等。
例 5:索引
• 查到分类号C02F 1/04,就可根据此分类号在《中 国专利索引分类号索引》里查到此专利 所在卷期号 • 根据 C02F 1/04 就可查找到这条信息:
• 国际专利分类号 公开号 申请号 申请人 发明名称 卷期号 • C02F 1/04 CN1183382A 97109169.2 鹿长林 污水雾化蒸馏处理工艺及其装置 14-22
信息需求:论文、书? 学科?主题?
题名、责任者
主题词、分类号、关键词
位置算符、截词符、组配连接符号 检索结果 鉴别分析 查全率(漏检率) 查准率(误检率) 响应性和实效性 权威性和可靠性
检索举例:查找“世界现代农业发展”方面的相关文献
选择检索工具:《中文科技资料目录—农业》
检索语言
一部分类法实质上就是一套概念标识系统。
体系分类法采取对文献论述的事物概念进行层层 划分、层层隶属的办法来形成一系列专指的分类 标识,按照科学体系将分类标识组织成具有隶属、 并列关系的概念等级标识系统。分类法虽然比较 具有学科的系统性,但它所能反映的这种科学系 统性,只是在一定的限度之内。现代科学由于边 缘学科、交叉学科的出现,各门学科互相渗透, 互相结合,日益使直线序列的分类法难以反映多 元性的知识空间,因而不能确切地代表科学体系。
为了使检索的过程,即文献标识和信息提问的对 比进行得顺利,二者都需要用一定的语言来加以表达。 只有借助于这种语言,文献的标引人员与检索人员才 能有一个共同的约定,彼此才能沟通思想。也就是说, 文献存储时,文献的内外特征按照一定的语言来加以 描述,而检索时信息提问也按照一定的语言来加以表 达。这种把文献的存储与检索联系起来、把标引人员 与检索人员联系起来以便取得共同理解、实现交流的 语言,就叫做检索语言。检索语言是用来描述文献特 征和表达检索提问的一种专门语言。检索效率的高低, 在很大程度上取决于所采用的检索语言的质量以及对 它的使用是否正确。下图展示了检索语言在信息存储 和检索过程中的作用。
《中国图书馆分类法》
(五)评价
不足: (1)部分类目体系仍存在进一步完善的 问题。 (2)通用复分表需要完善改进。 (3)分类法系列中不同类表之间的协调 。
例:层层展开
T 工业技术
TP 自动化技术、计算机技术
TP3
计算技术、计算机技术
TP31
计算机软件
TP311
程序设计、软件工程
《美国国会图书馆图书分类法》
(三)标记符号
类号采用字母和数字混合标记, 大类用一个字母,小类用二至三个 字母,然后加序数1—9999,以区 分各级子目。
02检索语言
第2章检索语言【本章要点】●介绍检索语言的概念、功能及类型●总结检索语言的主要理论基础●阐述分类检索语言的结构与性能●分析主题检索语言的原理与性能●论述分类主题语言一体化检索语言的原理、性能及类型●探讨网络环境下检索语言的发展2. 1 检索语言概述2.1.1检索语言的概念(04北师)retrieval language,是为沟通文献标引与文献检索而编制的人工语言。
广义的检索语言泛指信息检索过程中涉及的人工语言和自然语言。
狭义的检索语言指根据信息检索的需要,按照一定的规则对自然语言进行规范,并专门用于信息标引和用户检索的人工语言。
2.1.2检索语言的功能(06华南师范简答)1.标引信息内容特征及某些外表特征,保证不同标引人员表达信息的一致性2.对内容相同及相关的文献信息加以集中或揭示其相关性3.使信息的存储集中化、系统化、组织化,便于检索人员按照一定的排列次序进行有序化检索4.便于将标引用语和检索用语进行相符性比较2.1.3检索语言的分类1.按描述文献的特征:描述文献外表特征(题名、组织、文献编号、引文等)的检索语言和描述文献内容(分类语言、主题语言、代码语言)特征的检索语言2.按结构或原理:分类语言、主题语言、代码语言和引文语言3.按信息标识的组合使用方法:先组式语言、后组式语言和散组式语言4.按语言的规范化程度:人工语言和自然语言2. 2 检索语言的理论基础检索语言以概念逻辑为基础,知识分类是概念逻辑的基础,检索语言的创制以术语学的研究成果为基础。
2.2.1概念逻辑1.概念逻辑的含义:是一种科学思维方法,通过明确各自概念及其相互关系而揭示事物的本质属性及各种事物之间的联系与区别。
2.概念是反映对象本质属性的思维形式,是对事物本质属性的概括。
①概念的内涵是概念所反映的对象的本质属性的总和。
②概念的外延是概念所反映对象的范围。
2.21.1概念间的关系1.相容关系:指两个概念的外延至少一部分是重合的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3、关键词语言:关键词标识是一种用自然语言词来做标识的检索语言。所谓关键词,是指出现在文献中,示和描述文献主题内容是重要的、起着关键作用的语词。是在文献题名、文摘、或正文中直接提取出来的非规范化实意词。与其他主题法标识不同,关键词标识系统不编制关键词表,而是用一种“非关键词表”来控制抽词范围。关键词法的原理是将出现在文献的标题、摘要或正文中具有实质意义的关键词排在检索入口,注明文献地址,从而能满足用户的检索要求。
二 分类检索语言
1、本质:分类检索语言即“文献分类法”,简称“分类法”。公类法是将代表各种概念的类目用号码来标识,以学科属性为主并加以系统排列来组织、检索文献的体系。它是按分类途径排检文献的基本工具和重要依据,就其本质而言,是一种检索信息的索引语言,故称为“分类检索语言”。
2、定义:分类检索语言是将表示各种知识领域(学科及其研究课题)的类目按知识分类原理进行系统排列,以代表类目的数字、字母符号(即分类号)作为文献内容的标引符。
三 主题检索语言
1、 标题词语言:也称作标题词描述语言。是一种完全先组式规范化主题词标识。是从自然语言中先取,经过规范化处理,表示事物概念的完整的事词术语。在标题词标识系统中,主题词表里面已将词语配合成组,作为共同表征文献主题内容的检索词。
2、 叙词语言:所谓叙词,是指从文献题目、正文、摘要中抽取出来的,用以表达文献内容的自然语言,并在这些自然语言中优选出来并经过规范化处理的名词术语。叙词标识就是采用表示单元概念的规范化语词的组配来对信息内容主题进行描述的后组式检索语言,也是目前使用最广泛的主题语言。
第二节 检索语言
一 信息检索语言的概念、种类
1、概念:信息检索语言是人们在加工、存储及检索信息时所使用的标识符号,也就是一组有规则的、能够反映出信息内容及特征的标识符。信息检索语言主要有两大类:体系分类检索语言和主题检索语言。体系分类检索语言是以学科为基础按类分级编排的,是一种直接体现知识分类等级概念的标识系统,一般以符号为标识;主题检索语言则是用能反映信息内容的主题概念的评语作为标识的标识系统。主题检索语言又分为两类,一类是规范主题检索语言,另一类是非规范主题检索语言。可以说体系分类检索语言和规范主题检索语言都是人工检索语言,而非规范主题检索语言则是一种自然语言。