主题检索语言
检索语言的分类
检索语言的分类:按照揭示和反映信息内外部特征的不同,检索语言可划分为:分类语言:以数字、字母(或字母与数字结合)为检索标识,作为有关类目的代号。
主题语言:分为标题词语言、叙词语言和关键词语言;名称语言:以人名、地名、机构名、篇名、书名等为检索标识;代号语言:以文献特有的顺序号(如专利号、标准号、合同号等)为检索标识邻近位置算符(W)W是with的缩写。
(W)算符也可以简写为()算符,A(W)B,表示A紧挨着B,顺序不能颠倒。
A和B之间除允许有一个空格、一个标志符号或一个连接号以外,不得插入任何单位或字母。
邻词位置算符(nw)A(nw)B,表示两个词的次序不变,其间可以插入n个词。
句子位置算符(S)S是sentence的缩写。
A(s)B表A和B必须同时出现在记录的同一个句子或短语中,但次序可能随意改变,A与B之间可以有若干个其他的词。
字段位置符(F)F是field的缩写。
A(F)B,表示A和B 必须同时出现在记录的同一个字段之中,但位置和次序不限,两者之间还可以任意加词。
如Rice(F)Genetics/Ti 要求Rice和Genetics必在同时出现在篇名之中。
记录位置算符(C)C是citation的缩写。
A(C)B 其作用等同于A and B,均表示A和B 同时出现在同一记录内,但词序不限,也不要求在同一字段内。
截词符号常用的有“?”、“$”和“*”等,绝大部分数据库无限截词符用“*”,少数用“?”或者“$”截词类型(1)后截断,前方一致。
如:“comput*”表示computer、computers、computing等。
(2)前截断,后方一致。
如:“*computer”表示minicomputer、microcomputer等。
(3)中截断,中间一致。
如:“*comput*”表示minicomputer、microcomputers等。
1 .括号改变运算顺序。
2 .引号引号内的检索项以整体形式出现。
第二章 检索语言
(一)分类检索语言的类型
1.体系分类法 2.组配分类法
(二)分类检索语言的特点
分类检索语言是信息管理领域经典的 检索语言之一,以1876年《杜威十进分类法》 的问世为标志,已走过了一个多世纪的历 程,形成了自成体系的一套信息组织和检 索方法。
二、分类检索语言结构
(一)类目 1.类目的划分 2.引用次序 3.类目的排列 4.类名的确定 5.类目之间相互关系的处理
一、检索语言的概念 传统意义上的检索语言仅指根据信息
检索需要而创制的人工语言,又称情报语 言、情报存储与检索语言、文献语言、文 献工作语言、索引语言、标引语言、标引 符号、标识系统等。
二、检索语言的基础
(一)概念逻辑 概念逻辑,是一种科学思维方法,通
过明确各种概念及其相互关系而揭示事物 的本质属性及各种事物之间的联系与区别。
词为基础,以概念组配为基本原理,对文 献主题进行描述的后组式检索语言。
(二)叙词表的编制
叙词表是叙词法的核心体现。目前, 国内的叙词表已有七八十种之多。常用的 有《汉语主题词表》、《化工汉语主题词 表》、《机械工程主题词表》、《电子技 术汉语主题词表》、《国防科学技术叙词 表》等。
五、主要主题词表介绍
(一)《汉语主题词表》 《汉语主题词表》是我国第一部大型的
综合性的叙词表,由中国科技信息研究所 和北京图书馆负责主持,1975年开始编制, 1980年正式出版。
(二)《中国分类主题词表》
《中国分类主题词表》是在《中图法》 编委会主持下,经全国40个单位160位专家 学者的共同努力,历时8年编制而成的,于 1994年6月正式出版。
(二)单元词法
单元词又称元词,是从自然语言中选 取,经过规范化处理,表达主题最小的、 最基本的、字面上不能再分的名词术语。
文献检索主题语言
文献检索主题语言
文献检索主题语言是指用于描述文献主题内容的语言。
这种语言主要用于文献检索系统中,帮助用户准确、快速地找到他们所需的文献。
以下是一些常见的文献检索主题语言的类型:
1.关键词语言:这是最简单、最常用的主题语言之一。
在文献检索
系统中,关键词语言通常用于描述文献的主题内容,以便用户可以通过输入关键词来搜索相关文献。
2.主题词语言:主题词语言是指一组经过规范化的词语,用于描述
文献的主题内容。
在文献检索系统中,主题词语言通常用于精确匹配用户查询和文献内容。
3.自然语言:自然语言是指人类日常使用的语言,如中文、英文等。
在文献检索系统中,自然语言通常用于对文献进行全文检索,以便用户可以通过输入自然语言句子或段落来搜索相关文献。
4.元数据语言:元数据语言是指用于描述文献的元数据的语言,如
作者、出版日期、期刊名称等。
在文献检索系统中,元数据语言通常用于对文献进行分类和排序,以便用户可以按照特定标准(如出版时间、重要性等)筛选相关文献。
5.受控词汇表语言:受控词汇表语言是指一组经过规范化的词语,
用于描述文献的主题内容,并具有一定的上下文关系。
在文献检索系统中,受控词汇表语言通常用于精确匹配用户查询和文献内容,并可避免同义词、近义词等问题。
总之,选择合适的文献检索主题语言可以提高文献检索的准确性和效率,帮助用户快速找到所需文献。
主题检索语言的特点
主题检索语言的特点(叙词法的特点):直接性:即直接用自然语言名词术语作为标识符号,最直观、最方便,一目了然。
专指性:是指解释和查找文献主题的深度而言。
集中性:主题检索语言对反映同一主题的各个方面的文献可以达到高度集中的效果。
多元性:是指对文献主题内容采用多个主题词进行组配标引和检索,揭示与查找该文献的途径多,从而提高对文献的揭示能力和利用率。
适应性:通过增补新的主题词或通过组配,主题检索语言在表达新概念的文献和新的研究课题的资料时具有很强的适应能力。
标引就是对文献主题分析的结果赋予检索标识的过程。
主题标引:是一种将文献主题的自然语言形态,转换为主题法语言形态(叙词、标题词、关键词、单元词)的标引,这是建立主题检索系统的依据。
分类标引:是一种将文献主题的自然语言形态,转换为分类语言形态的标引,即转换成分类号码的一种标引,这是建立分类检索系统的依据。
浅标引:是一种标引深度较浅的主题标引,主要用于手工检索系统,即把文献中最重要的概念作为主题标识的标引。
深标引:是一种标引深度较深的主题标引,主要用于计算机检索系统,它反应文献中主要的和次要的概念。
标引深度是指对一片文献所赋予的全部检索标识的数量。
就主题标引而言,则指标引一篇文献平均所给予的主题词的数量。
标引等级是指将文献中的概念根据主次按等级划分,分为三个等级,一级概念标引1.一级概念标引,也称主要标引。
仅仅揭示文献的主要论点。
2.二级概念标引,也称次要标引。
3.三级概念标引,也称不要标引。
2.加权标引:是指一种采用打星号的方式区分主要、次要标引的方法。
既为所标引主题词确定IM和NIM词的过程。
加权标引的目的是突出文献重点,划分标引等级。
主题分析概念:是指根据文献存储与检索的要求,对文献内容进行分析,从中提炼主题概念,确定主题类型、剖析主题结构和确定概念间关系的过程主题分析的意义在于使标引者尽可能的掌握一定的分析方法,遵循共同的分析步骤,客服因分析不一致造成的标引不一致,保证标引的初始环节达到较高的一致性主题标引的原则一、基本原则(一)真实性(二)客观性(三)全面性(四)准确性(五)专指性(六)一致性二、选词原则(一)首选专指词(二)次选组配词(三)选择上位词或靠近义词(四)标引自由词三、选词注意事项(一)随时注意主题词的增删,尽量使用新词表。
主题检索语言
主题检索语言摘要:一、主题检索语言的定义与作用1.定义2.作用二、主题检索语言的分类与特点1.分类2.特点三、主题检索语言的应用领域1.信息检索2.知识管理3.其他应用四、主题检索语言的发展趋势与挑战1.发展趋势2.挑战正文:一、主题检索语言的定义与作用主题检索语言(Subject Language)是一种用于描述和表示信息主题(Subject)的规范化语言,其主要目的是为了提高信息检索的效率和准确性。
通过使用主题检索语言,用户可以更加方便地在大量的信息资源中找到所需要的内容。
主题检索语言在信息检索领域具有重要作用。
首先,它可以提高检索效率,通过使用规范化的词汇和表达方式,避免用户在检索时使用不同的词汇描述同一主题,从而减少检索结果中的无关信息。
其次,主题检索语言有助于提高检索结果的准确性,通过对主题进行精细化描述,可以减少用户检索时对主题的误解和歧义。
最后,主题检索语言可以促进信息资源的组织和管理,使得信息资源的分类和存储更加规范和有序。
二、主题检索语言的分类与特点主题检索语言可以根据其表现形式和应用范围进行分类。
常见的分类包括:1.分类主题词表:这是一种较为传统的主题检索语言,它通过预先编制好的主题词表来描述和表示信息主题。
分类主题词表具有明确的主题分类体系和规范的词汇表,可以很好地支持信息检索。
2.关键词主题词表:与分类主题词表相比,关键词主题词表更加灵活,它允许用户自由地选择关键词来描述信息主题。
关键词主题词表具有较强的适应性,可以应对不断变化的信息需求。
3.叙词主题词表:叙词主题词表是一种较为复杂的主题检索语言,它通过对信息主题进行详细的描述和叙事,来提高检索的准确性。
叙词主题词表适用于对主题描述要求较高的领域。
主题检索语言具有以下特点:1.规范化:主题检索语言采用统一的词汇和表达方式,避免歧义和误解。
2.层次化:主题检索语言通常采用树状结构来组织主题,方便用户进行逐级检索。
3.动态更新:随着信息资源的不断增加和更新,主题检索语言也需要不断完善和更新。
文献检索语言
一、文献信息检索语言及其应用
(一)文献检索语言的含义及种类
1.检索语言的含义
检索语言是用于描述信息系统中文献信息的内容特征
或外部特征和表达用户信息检索提问的一种专用语言。分
为规范化语言和非规范化语言。规范化语言是对文献检索
用语的概念加以人工控制和规范,对同义词、多义词、近
义词等进行规范化处理用同一个词来表达一个概念。非规 范化语言也叫自然语言,如关键词、自由词等。
文章内容主要论述有关“左心室肥大”时,标引时应标专指主题词
“左心室肥大”,而不标其上位主题词“心脏肥大”。 3.标引文献的主题概念要全面。例如:一篇关于“老年糖尿病患 肝的葡萄糖代谢”的文章,就必须考虑到每个概念:按照标引规则 应标:糖尿病/代谢;肝/代谢;葡萄糖/代谢;特征词:老年人;人类; 男性。这样从不同角度都能检索到该篇文献。
• B. 主题词与地理名词组配
例:南京的空气污染:空气污染 + 南京 • C.主题词与文献类型组配 例:婴儿肝癌的一例报告:肝肿瘤 + 婴儿 + 病例报告 • D.主题词与人的年龄组组配
例:老年人的心率:心率 + 老年人
• E. 主题词与动物名称组配 • 例:大鼠的实验性糖尿病:糖尿病,实验性 + 大鼠 + 动物 返回
2.检索语言的种类
(1)文献内容特征检索语言
A.分类检索语言 B.主题检索语言 C.代码检索语言
(2)文献外部特征检索语言
A.题名索引系统
B.著者索引系统 C.文献序号索引 D.引文索引系统
(二)分类检索语言及其应用
1.分类检索语言的含义 是按文献内容所属的学科或专
业,结合文献内容特征根据特定分类体系而编制的检索 系统。通过分类体系的分类号使同学科专业文献集中在 一起,以分类号作为检索标识的一类检索语言。 2.分类检索语言的应用 目前分类检索语言的应用主要 是体系分类语言。从知识分类角度揭示文献在内容上的 区别与联系,提供从学科分类以分类号为检索标识的检 索途径。
信息检索原理
④限定检索技术
使用截词检索,简化了布尔逻辑检索中的逻辑 或功能,并没有改善布尔逻辑检索的性质。使用位 置逻辑检索,只能限制检索词之间的相对位置,不 能完全确定检索词在数据库记录中出现的字段位置, 特别在使用自由词进行全文检索时,需要用字段限 制查找的范围。常用的字段代码有标题( TI )、文 摘(AB)、叙词或受控词(DE或 CT)、标识词或自 由词(ID或 UT)、作者(AU)、语种(LA)、刊名 ( JN )、文献类型( DT )、年代( PY )等。这些限 制符在不同的系统有不同的表达形式和使用规则, 在进行字段限制检索时,应参阅系统及有关数据库 的的使用说明,避免产生检索误差。
②信息检索系统
信息检索系统是根据一定社会 需要和为达到特定的信息交流目的 而建立的一种有序化的信息资源集 合体。信息检索系统通常应是一个 拥有选择、整理、加工、存储、检 索信息的设备与方法,并能向用户 提供信息服务的多功能开放系统。
3、信息检索技术
①布尔逻辑检索技术
②位置逻辑检索技术 ③截词检索技术 ④限定检索技术
对虾 水产
养殖
②位置逻辑检索技术
位置逻辑检索持续术是以数据库原始记录中的检 索词之间的特定位置关系为对象的运算,又称全文检 索。它是一种可以不依赖叙词表而直接使用自由词进 行检索的一种技术。这种检索技术增强了选词的灵活 性,采用具有限定检索词之间位置关系功能的位置逻 辑符进行组配运算,可弥补布尔检索技术只是定性规 定参加运算的检索词在检索中的出现规律满足检索逻 辑即为命中结果,不考虑检索词词间关系是否符合需 求,而易造成误检的不足。在不同的检索系统中,位 置逻辑算符的种类和表达形式不完全相同,使用位置 逻辑检索技术时,注意所利用系统的使用规则。 在位置逻辑符中,常用的位置逻辑算符有(W)与 (nW)、(N)与(nN)、(S)、(F)。
信息检索语言
等级列举式分类法 U448.1 各种桥梁 U448.1 桥梁、按用途分 U448.11 人行桥 U448.12 两用桥 U448.13 铁路桥 …… U448.2 桥梁、按结构分
分面组配分类法
地区分面
E1 中国 E2 朝鲜 E3 韩国 E4 日本 ……
体裁分面
D1 诗歌 D2 戏剧 D3 小说 D4 散文 ……
中国
《中国图书馆图书分类法》 《中国科学院图书馆图书分类法》 《中国人民大学图书馆图书分类法》
印度 《冒号分类法》 《国际专利分类法》
9.《中国图书馆分类法》
五大部类:
22个基本大类: A 马克思主义、列宁主义、毛泽东思想、邓小平理论; B 哲学、宗 教; C 社会科学总论; D 政治、法律; E 军事; F 经济; G 文 化、科学、教育、体育;; H 语言、文字; I 文学; J 艺术; K 历史、地理; N 自然科学总论; O 数理科学和化学; P 天文学、地球科学; Q 生物科学; R 医药、卫生; S 农业科 学; T 工业技术; U 交通运输; V 航空、航天; X 环境科 学、安全科学; Z 综合性图书
标题词语言; 单元词语言; 叙词语言; 关键词语言
三、分类语言
1.基本概念: 亦称体系分类语言,是以学科范畴和学科体系为基础来划分事物的 一种检索语言。在信息存储和检索中,它是一种对信息内容的概念进行 逻辑分类和有规律地系统排列而构成的检索语言,并以分类表(分类法)的 形式体现。 分类语言最显明的特点是系统性,具有族性检索的功能,有利于人 们从学科专业的角度进行全面性的检索。
2.分类语言的局限性: 间接性。使用分类语言进行信息检索,检索者需要两重转换。 分类语言不能按主题集中信息。 从实际需要看,大量的检索课题需 要按主题进行特性检索,体系分类语言不适合这种多维性的专题概念的 特性检索。 3.分类语言的类型: • 按照编制方法分: – 等级列举式分类法 – 分面组配分类法 – 列举-组配分类法
信息检索基础 检索语言及其分类
《中国图书馆图书分类法》
R91下分为R911药物数学、R912药物物理学、R913 药物物理化学、R914药物化学、R915药物生物学。 R914下又分为{R914.1}药物分析、R914.2药物设 计 、 R914.3 无 机 药 学 化 学 、 R914.4 有 机 药 物 化 学 、 R914.5有机合成药物化学。
医学信息检索
检索语言及其分类
教 学
目 标
1
了解检索语言的分类
2
熟悉《中国图书馆图书分类法》
3
熟悉《医学主题词表》(MeSH)
了解检索语言的分类
检索语言是信息检索中用来描述文献特征和表达检索提问内容的一种专门性的人工语言,是一组有规则 的、能够反映出信息内容及特征的标识符,用于联系文献信息与用户需求的“语言括主题词和关键词语言。主题词语言与关键词语言的区别在于规范化程度不同。 ○关键词又名自由词,中选取的具有实质意义的名词,这种词不受主题词表限制,一般是未经规是从文献范
化或略规范化的词,常用于一般检索或精度要求不高的检索。 ○主题词是规范化词汇,最大的优点是概念准确、专指度高。它对文献中出现的同义词、近义词、多义词以
思 考 题
1
简述检索语言的分类及其特点
2
《中国图书馆图书分类法》分类体系是怎样的
3
主题词与关键词的区别是什么
图1主题:氟哌酸*胃肠炎 图2 主题:诺氟沙星*胃肠炎
《医学主题词表》(MeSH)
主题检索语言是信息检索语言中检索效率较高、使用频率较多的一种语言。人们为了更快更 好地检索文献,将概念更准确、专指度更高的反映文献内容的主题词编制成专门的主题词表, 供大家使用。目前国内最常用的主题词表是《医学主题词表》(MeSH)、《中医药学主题 词表》和《汉语主题词表》。 《医学主题词表》(MeSH)是美国国家医学图书馆从1960年起编制,并于1963年正式使 用的一部规范化的可扩充的动态性叙词表,是生物医学领域具有权威性的主题词表。MeSH 主要包括主题词表和树状结构表两个部分。
什么叫主题词、主题词表和检索语言
; 主题词分正式主题词和非正式主题词。
正式主题词用来标引和检索文献,非正式主题词是查找正式主题词的引导词。
(二)主题词表。
主题词表也称叙词表,是指由自然语言中优选出来的语义相关、族性相关的名词术语按字顺排列所组成的一种规范化的动态词典。
(三)《公文主题词表》。
《公文主题词表》是用于公文主题标引与检索的主题词表。
它是适应机关办公自动化,尤其是计算机数据处理的需要,为党政机关公文主题标引与检索而编制的一部术语控制工具。
(四)检索语言。
检索语言是根据人们检索工作的需要而创造的一种人工语言,它是存储、查找文献的共同依据,也叫标引语言。
检索语言又分为分类语言和主题语言。
分类语言的概念。
是指以阿拉伯数字或以拉丁字母和数字混合作为类目标识符号,以基本类目作为词汇,以类目的从属关系表达复杂概念的一类检索语言。
主题语言的概念。
是以直接论述的事物、对象为依据,以自然语言为基本词汇,以概念之间的逻辑关系作为构词法的一类检索语言。
检索语言
检索语言检索语言(Retrieval Language)就是组织文献与检索文献时所使用的语言。
也就是说,文献存储时,文献的内容特征(如分类、主题)和外表特征(如书名、刊名、篇名、号码、著者等)按照一定的语言来描述,检索文献时的提问也按照一定的语言来加以表达。
这种在文献的存储和检索过程中,共同使用、共同遵循的语言就是检索语言。
实质上它是标引和检索之间的约定语言,是人与检索系统对话的基础,检索的匹配就是通过检索语言的匹配来实现的。
使用检索工具和检索系统必须掌握检索语言,它是掌握和提高检索技能的基础。
检索语言的基本成分是检索词。
按检索词的规范化程度和组配程序,检索语言可分为自然语言(Natural Language)和人工语言(Artificial)两种。
自然语言采用的检索词是未加工整理和规范过的,即平常采用的关键词,这种语言又称作关键词语言(Keyword Language)。
人工语言采用经过规范化的词,规定一个词表示一种事物,例如规定“aircraft”表示飞机,而不用“air plane”、“plane”和“aeroplane”,以做到文献存储和检索的一致性。
信息检索语言是根据检索需要而创制的人工语言,也称检索标识系统,专门用于各种手工和计算机信息检索系统。
从不同角度检索文献,就有不同种类的检索语言,常用的有主题语言和分类语言,下面分别加以论述。
(一)分类语言分类语言是用分类号和相应分类款目来表达各种概念的,它以学科体系为基础将各种概念按学科性质和逻辑层次结构进行分类和系统排序。
分类语言能反映事物的从属派生关系。
便于按学科门类迸行族性检索。
分类语言中最常见的是体系分类语言,它按照学科体系从综合到一般、从复杂到简单、从高级到低级的逻辑次序逐级展开,世界著名的分类法有:《国际专利分类表》(IPC)、《杜威十进分类法》(DDC)、《美国国会图书馆图书分类法》(LC)、《中国图书馆图书分类法》(中图法)和《中国科学院图书馆图书分类法》(科图法)。
002-检索语言
第2章 检索语言
• 它将学科分为五大部类,分别是马克思 主义、列宁主义、毛泽东思想;哲学; 社会科学;自然科学;综合性图书。在 五大部类下,又分为22个大类,这22个 大类的类号分别用22个大写的英文字母 代表。
20
第2章 检索语言
基本部类 基本大类 1.马克思主义、列 A.马克思主义、列宁主义、毛泽东思想、邓小平理 宁主义、毛泽东思想、 论 邓小平理论 2.哲学 3.社会科学 B.哲学 C.社会科学总论 D.政治、法律 E.军事 F.经济 G.文化、科学、教育、体育 H.语 言文字 I.文学 J.艺术 K.地理、历史
●介绍检索语言的概念、功能及 类型 ●重点讲述体系分类检索语言 ●重点讲述关键词主题检索语言
3
第2章 检索语言
2.1 检索语言 概述 2.1.1 检索语言的概念
检索语言又称为索引语 言、存储检索语言、文献工 作语言、标引语言、标识系 统等,是检索系统进行存储 和检索时所使用的语言,是 专门用于各种手工和机器文 献检索系统描述文献的特征 和表达检索提问的一种人工 语言。
32
第2章 检索语言
举例: 如:《供应链管理》 分类:F——经济 F2——经济计划与管理 F25——物资经济 F252——物资流通
33
第2章 检索语言
示例: 书名 分类号 1、《笑傲江湖》 I247.4 2、《国际经济法》 D99 3、《企业管理理论与方法》F270 4、《计算机网络系统结构分析》TP39
N949系统科学在各方面的应用
F252.3物资流通费用、资金和利润
23
第2章 检索语言
《中图法》的类目标记:采用拉丁字母与阿拉伯数字相
结合的混合制标记符号。 • 类目级别 基本大类是类分图书的第一级类目,随着内容的细分,在 一级类目下还有二级类目、三级类目、四级类目…… 如:F 经济 一级类目 F2 经济计划与管理 二级类目 F25 物资经济 三级类目 又例:F252 类目下的图书都是内容为物资流通方面的图书。 (是四级类目) H31 类目下的图书都是内容与英语相关的考试类、语法、 或中英文对照等图书。(是三级类目)
3-1检索语言概述
6
2、3 检索语言的谱系
一般地,可以将检索语言类型按亲属关系划分为4个层次,从而构成 检索语言的谱系。
10
9
五、信息检索语言的基本要求
1、保证较高的检全率和检准率。 2、能满足多种检索要求。从学科、专业出发的族性检索,
从事物出发的特性检索,多途径、多因素检索以及检 索范围的自由改变。 3、易于标引,易于检索,减少标引和检索误差。这就需 要语词或符号的明确性,语法的严谨性,标识的直观 性,排序的易理解性,查词查号手段的多样性以及整 个语言包含概念的丰富和完备性等。 4、多方面的适应性。 5、具有与其它检索语言的兼容性和通用性。 6、具有不断进行现代化改造的可能性。
3
二、检索语言的类型与谱系
2、1 依据检索语言的构成原理,把检索语言划分为分类检索语言、 主题检索语言、分类-主题一体化语言、代码语言和引文语言等 类型。
2、2 依据检索语言的受控情况,把检索语言分为Artificial Language 和Natural Language。
此外,可以按检索语言的学科或专业范围、适用范围、检索标识的 组合使用方法以及对信息特征的描述等标准,对检索语言进行划 分。
维方式,它反映概念之间的关系,确定概念的类型、内涵和外延 等。检索语言就是运用概念之间的各种关系,对文献内容和外部 特征进行标引。具体而言,概念的划分与概括,侧重于概念的隶 属关系和并列关系,并据此建立检索语言的概念等级体系。概念 的分析与综合,主要是利用概念的交叉关系,依此建立检索语言 的概念组配体系。 2、基本原理与机制之二:知识分类 知识分类是指以各门科学所研究的运动形态的固有特征及其互相关 联与转变的次序为依据,对整个科学知识领域所做的分类。目的 是考察各门科学之间的区别与联系,确定各门科学的内部结构, 建立相应的分类体系,以反映当代科技水平并指导科学的发展。
3-3主题检索语言
三、《汉语主题词表》与文献标引
Chinese Thesaurus:我国第一部大型的综合性主题词表,1974年 开始编制,近9 000人历经5年时间,于1980年正式问世。词表分3 卷10个分册,11万条叙词。第1卷是社会科学,收录主题词23 500 余条;第2卷是自然科学,收录主题词65 200余条,非正式主题词 12 913条;第3卷是社科与自然科学共用的附表。
索语言以学科专业为线索集中文献。 用参照系统及其他方法间接显示文献概念之间的关系,其系统性
较差;分类检索语言能够直接显示概念关系。 接近自然题检索语言的基本类型 2、1 System of subject heading 2、2 Uniterm indexing 2、3 Descriptor indexing 2、4 Keyword indexing
5
2、3 Descriptor indexing
叙词法的概念与原理 叙词的类型和语义关系 叙词表及叙词索引
6
叙词法的概念与原理
叙词法以自然语言为基础,以规范化的叙词作为检索标识的文献标引 与检索方法。叙词法多种信息检索语言的原理和方法的综合。
⑴ 在语词标识上:吸收了标题法对语词进行严格规范化的基本方法, 对语词进行词类、词形、词义、词间关系等多种规范。
元词法的基本原理:任何一个复合概念都可以分解为若干单元概 念,而每个单元概念通常只用一个元词来表达,通过单元词的组 配来表达复杂的文献主题概念。元词法的基本原理有两个构件, 即单元词表和单元词卡片。
元词法的主要特点:用较少的词量反映较多的主题概念,具有灵 活性和专指性,在各种词表中,单元词表的体积最小。但元词法 缺乏直接性和系统性,由于常常采用字面组配,易产生组配误差, 检索的查准率较低。
分类语言与主题语言
分类语言和主题语言都是从事件中发展起来的。 分类语言是历史悠久,使用普遍的一种情报检 索语言,国内文献检索大多使用这种语言。而 主题语言是一种新兴的检索语言,近年来我国 也逐步得到应用,在文献检索这个学科中,两 者可以结合使用。
主题语言和分类语言各有何特点
一般在什么情况下使用
组内成员:
分类语言
体系分类 组配分类 混合分类 叙词词言
主题语言
关键词语言
流程图示 SmartArt 一、 分类检索语言
分类语言也属于主题语言。分类语言是按学科范畴划分而构成的一种语言体系, 标题
• 单击此处添加文本
它集中反映学科的系统性、反映它们的相关、从属、派生等关系,从总体到局部分层、 • 单击此处添加文本 • 单击此处添加文本 分面展开,形成分类体系。由类目号码及名称作为检索语言,构成分类类目表,如图 • 单击此处添加文本 • 单击此处添加文本 书分类表、专利分类表用的都是分类语言。
特点:系统性、间接性、稳定性
处添加文本 • 单击此处添加文本
• 单击此处添加文本
2015-3-28
3
例:
P631.33和TG502.37的类名都是仪器,但前者的 上位类号 P631 是地球物理勘探,后者的上位类号 TG502 是金属切削加工和机床,因而他们分别代表 地球物理勘探用仪器和金属切削加工机床仪器。
二、 主题检索语言
主题语言 包括:关键词语言、叙词语言等,
它们有不同的主题词表。主题词表达概念本 身,在主题词表中通过参照系统来指示词汇 之间的关系。
特点:
直观性、专指性、灵活性
主题语言分关键词语言和叙词语言两种
叙词语言是以规范化科学名词为基础的一种主题法检索 语言。所谓叙词是从自然语言中优选出来的经过规范化的名 词术语
信息检索教程 第二章 检索语言
17
【例题】检索英语会话类辞典,例如《美国语会话百科》、 《英语会话大全》、《现代英汉生活用语图解词典》,请 选择,哪种检索途径才能够同时查出这3本书? 【选项】 A.用关键词“会话”和“词典” B.用中国图书分类号H319.9-61
C.用书名“英语会话”和“大全”
D.用书名“英语会话”和“词典” 【答案】B
2.1.3.3 按信息标识的组合使用方法,可分 为先组式语言、后组式语言和散组 式语言
2.1.3.4 按语言的规范程度,可分为人工语 言和自然语言
3
第2章 检索语言
2.2.1 概念逻辑
2.2 检索语言 的理论基础
2.2.1.1 概念间的关系 不相容 关系
相容关系
同一 属种
整体与 全面与 不相排斥 交叉 部分 某一方面 的并列
10
第2章 检索语言
2.3.2.3 主要体系分类法介绍 国内常见的体系分类法有:
《中国人民大学图书馆图书分类法》,简称《人大法》 《中国图书馆分类法》,简称《中图法》 《中国科学院图书馆图书分类法》,简称《科图法》 《中国档案分类法》
国外常见的体系分类法有:
《杜威十进分类法》(Dewey Decimal Classification)简称DC或DDC 《美国国会图书馆分类法》(Library of Congress Classification)简称LC 《国际十进制分类法》(Universal Decimal Classification)简称UDC
11
《中国图书馆分类法》 第2 章 检索语言
我国目前广泛使用的分类法是《中国图书馆分类法》。它是由国 家图书馆等单位组织全国力量,以学科分类为基础,并结合图书的特 性所编制的分类法。它将学科分五大部类,基本序列是:马克思主义 列宁主义毛泽东思想、哲学、社会科学、自然科学、综合性图书,由 5大部类、22个大类、6个总论复分表、30多个专类复分表、4万余条 类目组成了一个完善的分类体系。 标记制度采用拉丁字母与阿拉伯数字相结合的混合号码制,用一 个字母代表一个大类,以字母的顺序反映大类的序列,在字母后用数 字表示大类下类目的划分,数字的设置尽可能代表类的级位,并基本 上遵从层累制的原则。
分类语言与主题语言比较
分类语言与主题语言比较1. 表达文献主题概念的方法不同分类检索语言是用分类号来表达文献主题概念,并按学科性质分门别类地将文献系统组织起来的语言。
主题检索语言是用语词来表达文献主题概念,它不管各语词之间相互关系如何,一律按字顺排列成主题词表,故称主题检索语言。
按选词原则,语词型检索语言又分为标题词语言、单元词语言、关键词语言和叙词型语言四种。
2. 主题概念的组织方式不同分类法按学科体系或逻辑体系组织,系统性强,反映事物的派生、隶属与平行关系。
能够直接地满足以学科或专业出发、范围较广泛的检索课题要求,但读者难以掌握新、细小、复杂主题在体系中的准确位置。
主题法是按照词的顺序来组织主题概念,依名检索,解决了分类法中难于归类的主题。
3. 标识符号不同分类法采用纯数字、纯字母或字母数字混合形式的标式符号代表其所属学科门类。
直观性差,在标引与检索过程中均需经过“概念、标识符号”的转换过程。
主题法采用自然语言中的名词术语。
经规范化处理后,作为检索标识,简明直观,易于掌握使用。
4. 标引的方法不同分类法注重于学科属性,标引采用标记系统表达,对文献资料分类基本是对号人座。
主题法则侧重于主题因素之间的关系,标引过程难度较大,它必须从文献的标题与内容中分析出主题,然后根据主题词表收词情况对主题概念进行分析转还,找到较确切表达主题概念的词。
5. 结构体系不同分类法结构体系的主体是按学科性质划分的等级层累结构的逻辑分类系统,它遵循从总到分、从一般到特殊、从低级到高级、从简单到复杂、从上位到下位,层层展开、上下隶属的逻辑序列,便于读者从学科门类进行族性检索。
主题法结构体系的主体是字顺系统,满足了读者对图书进行特性检索的需要。
6. 主要功能不同分类法的主要功能是组织分类目录和分类排列图书,这是管理图书的一种科学方法。
主题法不具有组织藏书和排架的功能,它的主要功能是组织主题目录,这一目录直接用语言文字表达出来,按字顺排列。
7. 对科技发展的适应性不同分类法是一种先组的列举式语言,受学科体系和符号的束缚,不能随学科的发展而增删某些类目。
信息检索之检索语言
布尔逻辑算符:逻辑或
组配方式:A OR B或者A+b,表达检索成果具 有A或具有B,或同步包括A,B两个概念旳文件。 它主要应用于概念之间旳并列关系。
1作用:检索“微量元素铜、铁、锌与小朋 友营养不良”旳文件(铜OP铁OR锌)AND(婴 儿OR幼儿小朋友)AND营养不良
2 例如:aspartame O R saccharine O R swweetener*
检索语言是应文件信息旳加工、存储和 检索旳共同需要而编制旳专门语言,是体 现一系列概括文件信息内容和检索课题内 容旳概念及其相互关系旳一种概念标识系 统。
什么是分类语言?
分类语言也称分类法。用分类号和相应旳分类 款目来体现多种概念,以学科体系为基础将多 种概念按学科性质和逻辑层次构造进行分类和 系统排序,能反应事物旳隶属派生关系,便于 按学科门类进行族性检索。按照分类方式旳不 同,分类语言又分为体系分类语言、组配分类 语言和混合分类语言。
分类语言旳特征
1.体现文件外部特征旳检索语言 2.体现文件内部特征旳检索语言
(一)体现文件外部特征旳检索 语言
体现文件外部特征旳检索语言主要是指文件 旳篇名(题目)、作者姓名、出版者、报告号、 专利号等。将不同旳文件按照篇名、作者名称 旳字序进行排列,或者按照报告号、专利号旳 数序进行排列,所形成旳以篇名、作者及号码 旳检索途径来满足顾客需求旳检索语言。
布尔逻辑运算:逻辑非
1:组配方式:A NOT B, A-- B表达。检索成果 即为再还有概念A旳文件中,排除同步具有B旳 概念。 2:作用:排除无关概念,用来缩小检索范围, 提升查准率。 3:实例:ands NOT hearing 检索具有“aids” 旳数据,排除具有”hearing”旳文件。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
主题检索语言
主题检索语言,顾名思义,是一种用于在文本中查找相关主题的语言。
它通过特定的语法和规则来帮助用户更高效地检索与自己感兴趣的主题相关的信息。
本文将介绍主题检索语言的定义、功能、应用场景以及一些常用的主题检索语言。
一、主题检索语言的定义
主题检索语言是一种用于在文本中查找特定主题的语言。
它通过指定关键词、逻辑运算符和搜索条件来筛选出与所需主题相关的内容。
主题检索语言可以应用于各种文本数据,包括文章、新闻、论文、博客等。
主题检索语言具有以下功能:
1. 关键词搜索:用户可以通过输入关键词来检索与该关键词相关的内容。
2. 逻辑运算符:主题检索语言支持逻辑运算符,如AND、OR、NOT,用户可以通过组合使用这些运算符来精确控制检索结果。
3. 短语搜索:用户可以使用引号将多个关键词括起来,以便检索包含这些关键词连续出现的内容。
4. 通配符搜索:主题检索语言支持通配符,如*和?,用户可以在关键词中使用通配符来模糊匹配一定范围的内容。
5. 范围搜索:用户可以指定搜索结果的范围,如时间范围、地理位置范围等,以便更加精确地获取所需信息。
三、主题检索语言的应用场景
主题检索语言可以应用于各种场景,包括:
1. 学术研究:研究人员可以使用主题检索语言来检索与自己研究方向相关的论文、期刊等文献,以便获取最新的研究成果。
2. 新闻报道:新闻编辑可以使用主题检索语言来检索与某一事件或话题相关的新闻报道,以便及时了解相关信息并撰写报道。
3. 市场调研:市场分析师可以使用主题检索语言来检索与某一产品或服务相关的市场调研报告,以便了解市场需求和竞争情况。
4. 数据分析:数据分析师可以使用主题检索语言来检索与某一指标或变量相关的数据,以便进行数据分析和预测。
四、常用的主题检索语言
以下是一些常用的主题检索语言:
1. 检索关键词:通过在搜索框中输入关键词来检索相关内容。
2. AND运算符:使用AND运算符可以将多个关键词组合起来,要求检索结果同时包含这些关键词。
3. OR运算符:使用OR运算符可以将多个关键词组合起来,要求检索结果包含其中任意一个关键词即可。
4. NOT运算符:使用NOT运算符可以排除某个关键词,要求检索结果不包含该关键词。
5. 引号搜索:使用引号将多个关键词括起来,可以检索包含这些关键词连续出现的内容。
6. 通配符搜索:使用通配符*可以匹配任意字符,使用通配符?可以匹配单个字符,以实现模糊匹配。
主题检索语言是一种用于在文本中查找特定主题的语言,它具有关键词搜索、逻辑运算符、短语搜索、通配符搜索等功能,可以应用于学术研究、新闻报道、市场调研、数据分析等领域。
常用的主题检索语言包括检索关键词、AND运算符、OR运算符、NOT运算符、引号搜索、通配符搜索等。
通过合理使用主题检索语言,用户可以快速准确地获取所需主题相关的信息。