信息检索语言.
信息检索语言名词解释
信息检索语言名词解释在当今信息爆炸的时代,快速准确地获取所需信息成为了一项非常重要的能力。
而信息检索语言作为一种用于检索特定信息的工具,也逐渐引起了人们的关注。
本文将对信息检索语言进行解释,并深入探讨其定义、分类、应用以及未来发展趋势等方面。
一、定义信息检索语言(Information Retrieval Language,简称IRL)是一种用于从大规模的信息资源中获取所需信息的工具。
它通过特定的语法和命令,将用户的查询需求转化为计算机可以理解的形式,并根据用户的要求,精确地匹配和提取相应的信息。
IRL旨在提高信息检索的准确度和效率,帮助用户在海量的信息中迅速找到所需内容。
二、分类基于不同的用途和功能,IRL可以分为几种常见的类型。
1. 布尔检索语言(Boolean Retrieval Language)布尔检索语言是最早应用于信息检索领域的一种语言类型。
它主要依据布尔运算的原理,通过逻辑的组合和排除来实现信息的检索与过滤。
用户可以通过基本的布尔运算符(AND、OR、NOT)和括号组合自己的查询语句,以获取满足特定条件的信息。
2. 自然语言查询语言(Natural Language Query Language)自然语言查询语言是一种使用自然语言描述查询需求的检索语言。
它利用语言理解和处理技术,将用户的自然语言查询转化为计算机可执行的检索语言。
相比于其他IRL类型,自然语言查询语言更加简便易用,能够接受非专业用户的查询。
3. 基于模式的查询语言(Pattern-based Query Language)基于模式的查询语言是一种使用特定模式描述查询需求的检索语言。
它通过定义关键词的组合和排列方式,指导计算机在大数据集中查找与其模式匹配的信息。
基于模式的查询语言常被应用在关键词提取、信息分类和数据挖掘等领域。
三、应用信息检索语言在各个领域具有广泛的应用。
以下是几个常见的应用场景。
1. 互联网搜索引擎互联网搜索引擎通过用户输入的查询语句,利用信息检索语言在大量的网页中进行检索。
常用的检索语言
常用的检索语言检索语言在信息检索领域起着非常重要的作用,它是用户与搜索引擎进行交互的桥梁。
本文将介绍几种常用的检索语言,包括关键词检索、布尔检索、模糊检索和自然语言检索。
一、关键词检索关键词检索是最常见的一种检索方法,用户通过输入与所需信息相关的关键词来进行检索。
搜索引擎会根据关键词在数据库中的索引进行匹配,返回相关的结果。
关键词检索对于用户来说比较简单直观,但也存在一些问题。
比如,如果用户输入的关键词过于模糊,可能会返回大量与用户需求不相关的结果;如果用户输入的关键词过于具体,可能会导致相关结果过少。
二、布尔检索布尔检索是一种基于逻辑运算的检索方法,用户可以通过使用布尔运算符(如AND、OR、NOT)来组合多个关键词进行检索。
布尔检索可以更精确地表达用户的需求,提高检索结果的相关性。
例如,用户可以通过输入“电影AND 喜剧”来检索同时包含电影和喜剧两个关键词的相关内容。
三、模糊检索模糊检索是一种考虑到用户输入的不完整或错误的情况下进行的检索方法。
搜索引擎使用模糊匹配算法,将用户输入的关键词与数据库中的内容进行模糊匹配,返回与用户需求最相近的结果。
模糊检索可以有效地解决用户拼写错误或输入不完整的问题,提高搜索的准确性。
四、自然语言检索自然语言检索是一种使用自然语言进行检索的方法,用户可以用自然语言的形式描述自己的需求,而不需要使用特定的检索语法。
搜索引擎会将用户的自然语言转化为机器可理解的查询语言,然后进行检索并返回相关结果。
自然语言检索可以使用户更加方便地表达需求,但也存在一些挑战,如语义理解和查询解析的问题。
总结:常用的检索语言包括关键词检索、布尔检索、模糊检索和自然语言检索。
不同的检索方法适用于不同的用户需求和场景。
关键词检索简单直观,适用于用户已经清楚知道自己需要什么的情况;布尔检索可以更精确地表达用户需求,提高检索结果的相关性;模糊检索可以解决用户输入不完整或错误的问题,提高搜索的准确性;自然语言检索可以使用户更加方便地表达需求,但也面临语义理解和查询解析的挑战。
信息检索语言
中图法分类简表
(/view.do?id=516)
A B C D E F G H I J K 马克思主义、列宁主义、毛泽东思想、邓小平理论 哲学、宗教 社会科学总论 政治、法律 军事 经济 文化、科学、教育、体育 语言、文字 文学 艺术 历史、地理
中国情报检索语言之近代阶段的特点
①从分类体系来看,冲破了四部分类法的束缚,提出了 新的分类理论,能尽量建立在科学的基础之上,为新 旧书籍、中外图书的统一分类开辟了可行的途径; ②从类目设臵与标记制度来看,比较简单、科学、准确、 便于利用,是中国图书分类法史上的一次重大变革; ③从类分表的结构来看,分类法已经形成为一个完整的 系统,并且有一定的科学理论作为其指导依据及一 定的使用范围作为其实践基础; ④从编制技术上看,既继承了古代分类法的优良传统与 经验,更吸收了国外的先进技术,具有科学性;
信息检索语言的类型
分类语言
分类语言是用分类号和相应分类款目来表达 各种概念的,它以学科体系为基础将各种概 念按学科性质和逻辑层次结构进行分类和系 统排序。分类语言能反映事物的从属派生关 系,便于按学科门类进行族性检索。按照分 类方式的不同,分类语言又分为体系分类语 言、组配分类语言和混合分类语言。
中国情报检索语言之近代阶段的特点(续)
⑤受杜威分类法带来的局限与影响,在类目体系的确立 上表现有机械、呆板、生硬的一面; ⑥对分类法理论中的一些重大问题与实践中出现的情 况未能展开充分的讨论并科学的加以解决,从而在 实际操作中各行其是,影响了图书分类法理论研究 的整体性进展; 在主题法方面:我国近代图书馆的主题编目技术也是于 20世纪初由西方传入的。继而从30年代到50年代, 我国虽然有三、四部中文标题表问世,但是都未能 得到实际的应用。
简述信息检索语言的定义、主要功能和类型
简述信息检索语言的定义、主要功能和类型信息检索语言是指一种特殊的编程语言,它用于在计算机中处理电子文献的检索和管理。
信息检索语言具有如下主要功能:1、查询文献:用户可以使用查询指令根据文献的内容、作者、时间等关键词来搜索文献数据库;2、存储文献:用户可以使用信息检索语言将文献存储到数据库中,以供后续查询和管理;3、管理文献:信息检索语言可以对文献进行增删改查、排序、统计等操作,以方便用户管理文献资源。
根据它们的特点和用途,可以将信息检索语言分为以下几种类型:1、特殊查询语句(Special Query Language,SQL):几乎所有的关系数据库管理系统都支持SQL查询,它是一个用于管理关系数据库和执行各种操作(如插入、更新、删除数据)的语言。
2、标记语言(Markup Language):标记语言用于定义文档内的结构和元素,较早的标记语言包括SGML和HTML,最新的标记语言是XML。
3、程序设计语言(Programming Languages):程序设计语言通常用于从文档集合中检索信息,包括强大的文本分析和模式匹配算法。
常用的程序语言有Python、Perl、Java、C++等。
4、搜索引擎查询语言(Search Engine Query Language,SEQL):SEQL是一种为搜索引擎优化的查询语言,包括Google提供的基本搜索语言和高级搜索语言,用于高效地搜索各种类型的文档和媒体。
除了以上几种类型,还存在许多其他的信息检索语言,如信息检索查询语言(Information Retrieval Query Language,IRQL)、文本检索查询语言(Text Retrieval Query Language,TRQL)等。
这些语言以不同的搜索目的和专业领域为基础,可以满足不同的信息检索需求。
总之,信息检索语言是在计算机中进行文献检索和管理的特殊编程语言,具有查询、存储和管理文献资源等多种功能。
第二章信息检索语言
分面组配分类法
地区分面 E1 中国 E2 朝鲜 E3 韩国 E4 日本 …… 体裁分面 D1 诗歌 D2 戏剧 D3 小说 D4 散文 …… 时代分面 C1 古代 C2 近代 C3现代 C4当代 ……
• 著名的分类表: 著名的分类表:
杜威十进分类法》 国际十进分类法》 《 杜威十进分类法 》 、 《 国际十进分类法 》 、 美国国会图书馆图书分类法》 《美国国会图书馆图书分类法》、《中国图 书馆图书分类法》 书馆图书分类法》、《中国科学院图书馆图 书分类法》 书分类法》、《中国人民大学图书馆图书分 类法》 国际专利分类法》 类法》、 《国际专利分类法》等。
• 优点: 优点:
组配准确,标引能力强;结构完备, 组配准确,标引能力强;结构完备,词汇控制严格 适合多途径检索,检索效率高; 适合多途径检索,检索效率高;对检索系统的适应性高
• 缺点: 缺点:
词表编制和管理的难度大;标引难度大。 词表编制和管理的难度大;标引难度大。
叙词语言的词汇控制
• • • • • • 词量控制 词类控制 词形控制 词义控制 词间关系控制 先组度控制
–
–
表达信息 组织信息
2.检索语言的组成要素 检索语言的组成要素 – 字符 – 基本词汇 – 语法规则 3.检索语言的特点:严密性、可控性、系统性 检索语言的特点: 检索语言的特点 严密性、可控性、
4.检索语言的类型 检索语言的类型
• 内容特征语言
– 分类语言 – 主题语言
• 外部特征语言
– 名称语言 – 著者语言 – 序号语言
关键词语言
• 关键词:是指从文献信息的题名、摘要或正文中抽取出来 关键词:是指从文献信息的题名、
能揭示信息内容特征的词语。 能揭示信息内容特征的词语。
检索语言的名词解释
检索语言的名词解释
检索语言,也称为信息检索语言或信息检索词汇,是一种专门设计的语言,用于描述和表示文献主题和内容特征,以便计算机进行信息检索。
检索语言的主要作用是将自然语言中任意性的文本转化为规范化的、可比较的、可操作的检索工具,从而能够高效地检索出所需要的文献。
常见的检索语言包括关键词语言、分类语言和主题语言等。
其中,关键词语言是基于文献中出现的词汇进行检索的语言;分类语言则是根据文献的内容和主题,将其划分到不同的知识类别中,然后通过类别的关系进行检索;主题语言则是将文献的主题进行规范化的描述,形成一个标准化的主题词表,然后通过主题词进行检索。
检索语言在图书馆、情报中心、档案馆、网络搜索引擎等领域广泛应用,是实现信息高效检索的重要工具之一。
信息检索基础 检索语言及其分类
《中国图书馆图书分类法》
R91下分为R911药物数学、R912药物物理学、R913 药物物理化学、R914药物化学、R915药物生物学。 R914下又分为{R914.1}药物分析、R914.2药物设 计 、 R914.3 无 机 药 学 化 学 、 R914.4 有 机 药 物 化 学 、 R914.5有机合成药物化学。
医学信息检索
检索语言及其分类
教 学
目 标
1
了解检索语言的分类
2
熟悉《中国图书馆图书分类法》
3
熟悉《医学主题词表》(MeSH)
了解检索语言的分类
检索语言是信息检索中用来描述文献特征和表达检索提问内容的一种专门性的人工语言,是一组有规则 的、能够反映出信息内容及特征的标识符,用于联系文献信息与用户需求的“语言括主题词和关键词语言。主题词语言与关键词语言的区别在于规范化程度不同。 ○关键词又名自由词,中选取的具有实质意义的名词,这种词不受主题词表限制,一般是未经规是从文献范
化或略规范化的词,常用于一般检索或精度要求不高的检索。 ○主题词是规范化词汇,最大的优点是概念准确、专指度高。它对文献中出现的同义词、近义词、多义词以
思 考 题
1
简述检索语言的分类及其特点
2
《中国图书馆图书分类法》分类体系是怎样的
3
主题词与关键词的区别是什么
图1主题:氟哌酸*胃肠炎 图2 主题:诺氟沙星*胃肠炎
《医学主题词表》(MeSH)
主题检索语言是信息检索语言中检索效率较高、使用频率较多的一种语言。人们为了更快更 好地检索文献,将概念更准确、专指度更高的反映文献内容的主题词编制成专门的主题词表, 供大家使用。目前国内最常用的主题词表是《医学主题词表》(MeSH)、《中医药学主题 词表》和《汉语主题词表》。 《医学主题词表》(MeSH)是美国国家医学图书馆从1960年起编制,并于1963年正式使 用的一部规范化的可扩充的动态性叙词表,是生物医学领域具有权威性的主题词表。MeSH 主要包括主题词表和树状结构表两个部分。
信息检索语言
第二节信息检索语言计算机检索的基本原理是将用户的检索提问词与数据库文献记录中的标引词进行对比,当提问词与标引词匹配一致时,即为命中,检索成功。
由此可见,能否准确地检索出用户所需信息,关键在于能否准确地选择检索词。
这里所说的“准确”,是指用户所选的检索词必须与数据库中标引文献记录所用的标引词一致。
然而实际工作中,从事信息存储的人员与从事信息检索的人员绝大多数情况下不可能进行直接的思想交流,因而会造成存储信息与检索信息所依据的规则不一致,导致存入的文献检不出。
为了避免这种情况发生,在信息标引人员与信息检索人员之间必须制定一种共同遵守的规则,即一种约定的相同标识和线路,这就是检索语言。
一检索语言的含义及作用1 检索语言的概念检索语言(information retrieval language),是信息存储与检索过程中用于描述信息特征和表达用户信息提问的一种专门语言。
所谓检索的运算匹配就是通过检索语言的匹配来实现的。
检索语言是人与检索系统对话的基础。
有了这种规则,信息标引人员在进行信息存储的过程中,就会对原始信息进行分析,找出其能代表信息的特征与检索语言(检索标识系统)进行对照标引,然后纳入检索系统;而信息检索人员在进行信息检索的过程中,则先对待查课题进行分析,归纳出各种信息特征,使之形成能代表需要的检索提问,然后把这些提问与检索语言(检索标识系统)进行核对,标引成检索提问标识。
如果没有检索语言作为标引人员和检索人员的共同语言,就很难使得标引人员对文献信息内容的表达和检索人员对相同文献信息内容需求时的表达取得一致,信息检索也就不可能顺利实现。
2 检索语言的工作原理(1)存储:检索系统对文献内容进行分析,概括分析出若干能代表文献内容的语词,并赋予一定的标识,如题名、作者、主题词等,作为存储与检索的依据,然后纳入到数据库中。
(2)检索:检索人员首先要对检索课题进行分析,同样形成若干能代表信息需求的语词,然后通过检索系统在数据库中匹配具有同样语词和标识的文献,找到自己所需的信息。
3信息检索语言
• 自然语言处理的基本原理
自然语言理解 自然语 言接口
• 自然语言理解的三个主要问题是:
与思维过程有关——句法知识 与语言输入的表征和意义有关——语义知识 与世界知识有关——语用知识
ห้องสมุดไป่ตู้
3.4 中文分词技术研究
• 中文搜索引擎与西文搜索引擎在实现的机制和原理上大致 雷同,但由于汉语本身的特点,必须引入对于中文语言的 处理技术,而汉语自动分词技术就是其中很关键的部分 • 分词的准确性和速度是衡量分词技术的两个指标
• 情报学的认知观对信息检索语言研究的影响
• 信息检索过程是个非常复杂的认知过程,是一种由已知通 向未知过程。
原始 信息
概念 结构
可传递 的形式
知识的 不足
不足知识 的可交流 结构
两者 比较
3.1 受控检索语言的分析比较
• 受控语言是用于对自然语言进行事先规范的人工 语言 • 优势:
• 文献描述与概念表达的惟一性、专指性,便于提高检准率 • 通过揭示同义词、近义词和相关词等词间关系可以提高检全率
• 二次扫描法
二次扫描法基本思路是:取待处理材料中两个切分标志之间的部 分作为样本串,检查分词词典是否有一个词,它的前两个汉字和该样 本串相同,若有的话,则去样本串的前三个汉字作为匹配串,重新在 分词词典中查找以匹配串位子串的词,若有则重复下去,直到进行到 一个汉字为止,则切分出一个一字词;若没有,则完成一次扫描;把 匹配串的最后一个汉字去掉,作为新的匹配串,进行第二次扫描,第 二次扫描用RMM或MM法进行。
• 主要的自动分词算法
• 基于字符串匹配的分词方法
又叫做机械分词方法,它是按照一定的策略将待分析的汉字串与一个“充 分大的”机器词典中的词条进行配,若在词典中找到某个字符串,则匹配成 功。 按照扫描方向的不同, 串匹配分词方法可以分为正向匹配和逆向匹配; 按照不同长度优先匹配的情况,可以分为最大(最长)匹配和最小(最短) 匹配; 按照是否与词性标注过程相结合,又可以分为单纯分词方法和分词与标注 相结合的一体化方法。 还可以将上述各种方法相互组合 一般说来,逆向匹配的切分精度略高于正向匹配,遇到的歧义现象也较少。 统计结果表明,单纯使用正向最大匹配的错误率为1/169,单纯使用逆向最大 匹配的错误率为1/245 由于分词是一个智能决策过程,机械分词方法无法解决分词阶段的两大基 本问题:歧义切分问题和未登录词识别问题。 因此,机械分词一般作为一种初分手段
简述信息检索语言的功能
信息检索语言的功能1. 引言信息检索是指从大量的文本、图像、音频等数据中,通过某种方式找到用户所需的信息。
信息检索语言是用来描述用户对信息需求的语言,通过使用特定的语法和词汇,将用户对信息的需求转化为计算机能够理解和处理的形式。
本文将详细介绍信息检索语言的功能,包括查询功能、排序功能、过滤功能和聚类功能等。
同时还会讨论一些常见的信息检索语言,如SQL、Lucene和Elasticsearch等。
2. 查询功能查询是信息检索语言最基本也是最重要的功能之一。
用户可以通过输入关键词或短语来描述自己对信息的需求,并由计算机根据这些关键词或短语在文本库中进行搜索,找到与之相关的文档或记录。
查询功能可以支持多种查询类型,如全文搜索、字段搜索和范围搜索等。
全文搜索是指在整个文本库中搜索包含指定关键词或短语的文档;字段搜索是指在指定字段中搜索包含指定关键词或短语的文档;范围搜索是指在指定字段中搜索满足一定条件(如大于某个值、小于某个值等)的文档。
查询功能还可以支持布尔运算符,如AND、OR和NOT等。
用户可以通过使用这些运算符来组合多个关键词或短语,从而更精确地描述自己对信息的需求。
3. 排序功能排序是信息检索语言中的另一个重要功能。
在搜索结果中,往往有大量的文档或记录与用户的需求相关,但它们的相关性可能不同。
排序功能可以根据一定的规则将搜索结果按照相关性进行排序,使得与用户需求最相关的文档或记录排在前面。
常见的排序规则包括按照相关性、按照时间和按照评分等。
按照相关性排序是指将与用户输入关键词或短语最相关的文档排在前面;按照时间排序是指将最新更新或发布的文档排在前面;按照评分排序是指将根据一定规则计算出来的评分高的文档排在前面。
排序功能可以帮助用户快速找到与自己需求最匹配的文档,提高信息检索效率。
4. 过滤功能过滤是信息检索语言中用来筛选搜索结果的功能。
当搜索结果数量较大时,用户可能只对其中某些特定条件下的结果感兴趣,而不关心其他条件下的结果。
信息检索之检索语言
布尔逻辑算符:逻辑或
组配方式:A OR B或者A+b,表达检索成果具 有A或具有B,或同步包括A,B两个概念旳文件。 它主要应用于概念之间旳并列关系。
1作用:检索“微量元素铜、铁、锌与小朋 友营养不良”旳文件(铜OP铁OR锌)AND(婴 儿OR幼儿小朋友)AND营养不良
2 例如:aspartame O R saccharine O R swweetener*
检索语言是应文件信息旳加工、存储和 检索旳共同需要而编制旳专门语言,是体 现一系列概括文件信息内容和检索课题内 容旳概念及其相互关系旳一种概念标识系 统。
什么是分类语言?
分类语言也称分类法。用分类号和相应旳分类 款目来体现多种概念,以学科体系为基础将多 种概念按学科性质和逻辑层次构造进行分类和 系统排序,能反应事物旳隶属派生关系,便于 按学科门类进行族性检索。按照分类方式旳不 同,分类语言又分为体系分类语言、组配分类 语言和混合分类语言。
分类语言旳特征
1.体现文件外部特征旳检索语言 2.体现文件内部特征旳检索语言
(一)体现文件外部特征旳检索 语言
体现文件外部特征旳检索语言主要是指文件 旳篇名(题目)、作者姓名、出版者、报告号、 专利号等。将不同旳文件按照篇名、作者名称 旳字序进行排列,或者按照报告号、专利号旳 数序进行排列,所形成旳以篇名、作者及号码 旳检索途径来满足顾客需求旳检索语言。
布尔逻辑运算:逻辑非
1:组配方式:A NOT B, A-- B表达。检索成果 即为再还有概念A旳文件中,排除同步具有B旳 概念。 2:作用:排除无关概念,用来缩小检索范围, 提升查准率。 3:实例:ands NOT hearing 检索具有“aids” 旳数据,排除具有”hearing”旳文件。
信息检索语言
14
1.3.1 文献信息分类语言
分类语言是一种按学科范畴和体系来划分事物 的检索语言 国内 《中国图书馆分类法》[中图法] 《中国科学院图书馆图书分类法》[科图法] 《中国人民大学图书馆图书分类法》 [人大法] 《中国图书分类法》台湾赖永祥编订
国外 《杜威十进分类法》[DDC]
《国会图书馆分类法》[LCC]
310 总论 320 哲学 330 宗教 340 自然科学 350 应用科学 360 历史、地理 370 历史、地理 380 语文 390 美术
《中国图书分类法》(台湾)
数学 天文 物理 化学 地质 410 生物、博物 420 植物 430 动物 440 人类学 450 460 470 480 490
4
2.4 信息检索类型划分示意图
文献信息检索 依检索结果内容 划分 信 息 检 索 类 型 依信息存储与 检索方式划分 计算机检索
数据信息检索
事实信息检索
手工检索
5
数据信息和事实信息检索是确定性的检索,检 索结果可以直接利用,一般通过三次信息来完 成。
文献信息检索是一种相关性检索,检索结果是 文献信息的线索,一般通过二次信息来实现。 全文数据库:是一次信息和二次信息的综合体。 在检索结果中,有直接的全文链接。
28
1.4.3 叙词(主题)词语言
叙词是指一些以概念为基础的,经过规范 化的,具有组配功能并可以显示词间关系 和动态性的词或词组。
如:《汉语主题词表》、《机械工程主 题词表》 / 有一些英汉对 照
29
主题词语义参照系统
参照项 含义 简称 符号 英文简称 英文全称
简述信息检索语言的功能
简述信息检索语言的功能
信息检索语言(Information Retrieval Language,IRL)是一种用于搜索和获取数据库中信息的语言。
它提供了一种标准化的方式来查询和检索相关的数据,并根据用户的需求返回相应的结果。
IRL的功能主要包括以下几个方面:
1. 查询功能:IRL允许用户以特定的关键词、短语或逻辑表达式来查询数据库中的信息。
用户可以使用诸如AND、OR、NOT等逻辑操作符来组合多个关键词,以便更精确地定位所需的信息。
2. 排序和过滤功能:IRL不仅可以根据关键词匹配程度对搜索结果进行排序,还可以根据用户的设定进行过滤。
例如,用户可以指定只返回特定时间范围的结果,或者只返回与某个特定属性相关的数据。
3. 数据提取功能:IRL还提供了一些用于提取特定信息的功能。
用户可以使用IRL来搜索特定的数据字段或属性,以便快速获取所需的信息。
4. 聚合和分析功能:IRL不仅可以用于简单的搜索和提取数据,还可以用于聚合和分析数据。
用户可以使用IRL来对数据进行统计、计算、分组等操作,以便获取更深入的洞察和分析结果。
5. 扩展性和自定义功能:IRL通常具有很强的扩展性,用户可以根据自己的需求扩展和定制IRL。
他们可以创建自己的查询语句、定义自己的操作符和函数,以便更好地适应特定的搜索和数据分析任务。
总的来说,信息检索语言的功能旨在提供一种方便、高效和灵活的方式来搜索、提取和分析数据库中的信息。
它可以帮助用户以更智能、准确和快速的方式获取他们所需的数据,并支持他们进行更深入的数据分析和洞察。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中国
《中国图书馆图书分类法》 《中国科学院图书馆图书分类法》 《中国人民大学图书馆图书分类法》
印度 《冒号分书馆分类法》
五大部类:
22个基本大类: A 马克思主义、列宁主义、毛泽东思想、邓小平理论; B 哲学、宗 教; C 社会科学总论; D 政治、法律; E 军事; F 经济; G 文 化、科学、教育、体育;; H 语言、文字; I 文学; J 艺术; K 历史、地理; N 自然科学总论; O 数理科学和化学; P 天文学、地球科学; Q 生物科学; R 医药、卫生; S 农业科 学; T 工业技术; U 交通运输; V 航空、航天; X 环境科 学、安全科学; Z 综合性图书
2.分类语言的局限性: 间接性。使用分类语言进行信息检索,检索者需要两重转换。 分类语言不能按主题集中信息。 从实际需要看,大量的检索课题需 要按主题进行特性检索,体系分类语言不适合这种多维性的专题概念的 特性检索。 3.分类语言的类型: • 按照编制方法分: – 等级列举式分类法 – 分面组配分类法 – 列举-组配分类法
信息检索语言
张 行
检索语言概述 主题检索语言 分类检索语言 分类主题一体化检索语言
一、检索语言概述
1.信息检索语言的基本功用
信息检索语言是根据信息检索需求所使用的一种专门的人工语言,这 种人工语言是在自然语言基础上形成的,能够描述和组织信息特征的 一种语言。 表达信息 组织信息
字符 基本词汇 语法规则
时代分面
C1 古代 C2 近代 C3现代 C4当代 ……
4.分类语言的标记符号 标记符号:文献分类法中用以表示类目的代号,又称分类号。 作用:它具有固定类目的位置,明确各个类目的先后次序,在一定程度 上显示类目之间的隶属、并列关系以及描述某个类目的含义。 标记符号的要求 :
容纳性 表达性 简短性 助记性
标题词语言; 单元词语言; 叙词语言; 关键词语言
三、分类语言
1.基本概念: 亦称体系分类语言,是以学科范畴和学科体系为基础来划分事物的 一种检索语言。在信息存储和检索中,它是一种对信息内容的概念进行 逻辑分类和有规律地系统排列而构成的检索语言,并以分类表(分类法)的 形式体现。 分类语言最显明的特点是系统性,具有族性检索的功能,有利于人 们从学科专业的角度进行全面性的检索。
等级列举式分类法 U448.1 各种桥梁 U448.1 桥梁、按用途分 U448.11 人行桥 U448.12 两用桥 U448.13 铁路桥 …… U448.2 桥梁、按结构分
分面组配分类法
地区分面
E1 中国 E2 朝鲜 E3 韩国 E4 日本 ……
体裁分面
D1 诗歌 D2 戏剧 D3 小说 D4 散文 ……
3.主题语言特点: (1)集中性 (2)直观性 主题语言直接用能够表达信息内容的主题词来作为检索 标识,主题词来源于自然语言,比较直观,符合人们的辩识习惯。 (3)灵活性 主题语言的主要特征是通过词与词之间的概念组配来揭 示信息中的各种主题,尤其是后组式的组配原则,便于按照检索需要自由 组配检索概念,具有很大的灵活性。 4.类型:
2.检索语言的组成要素
3.检索语言的特点:严密性、可控性、系统性
4.检索语言的类型
按规范程度分
自然语言 规范化语言
按组配方式分
先组式语言 后组式语言
按照描述信息特征划分
内容特征语言
分类语言/主题语言
外部特征语言
名称语言/著者语言/序号语言
二、主题检索语言
1.相关概念: 主题:指文献论述的对象,包括事物、问题、现象等。 主题词:用来表达文献主题的词语。 主题语言:是以自然语言中语词文字为基础,以反映特定事物为中心, 以主题词字顺为基本结构的一种检索语言。 2. 主题语言原理: 以主题为中心集中文献 以词语作为检索标识 以字顺方式作为主要检索途径 通过参照系统等方式揭示主题词之间的关系
5.标记符号的种类
单纯号码:是指采用某一种符合通行习惯并具有一定固有次序的符号系 统。它又可分为单纯数字号码和单纯字母号码两种,常见的是单纯阿拉 伯数字号码。如《杜威十进分类法》、《科图法》等采用单纯阿拉伯数 字号码。 混合号码:是指同时采用两种或两种以上符合通行习惯并具有固有次序 的符号系统,它一般是字母与阿拉伯数字相结合。如《美国国会图书馆 分类法》、《中图法》均采用混合号码。
6.标记制度
标记制度:是指为文献分类法的类目配置分类号码的方法,也称编号制 度或配号制度。 层累标记制 顺序标记制 混合标记制 分面标记制
7.标记方法
预留空号法 八分法 双位制 借号法 字母标记法 对应编号法
8.著名的分类表
美国
《杜威十进分类法》 《国际十进分类法》 《美国国会图书馆图书分类法》
马克思主义、列宁主义、毛泽东思想 哲学 社会科学 自然科学 综合性图书
四、分类主题一体化检索语言
1. 基本原理 分类主题一体化语言集成了分类语言与主题语言的优点,分类语言 与主题语言虽然有许多不同,但在构成原理上却是相同的。 (1)两者均采用了概念逻辑的原理 (2)两者都是用了分类的方法 (3)两者的基本构件相同
2. 基本类型 分面叙词表与分类号—主题词表对应表是分类主题一体化词表的两 种主要类型。 (1)分面叙词表 分面叙词表是以英国学者艾奇逊等编制的《分面叙词表》的名字所 命名的一个类型,这是世界上第一部分类主题一体化词表。 (2)分类号—主题词对应表 这是一种将现成的分类表和叙词表,通过词汇对应相互结合而成的 一体化语言,从而将分类表和主题词表功能集于一身。由于它是将现成 的分类表和主题词表进行的对应,不对已有的分类表和主题词表进行大 的改动,实现了一部分分类号和主题词的等值对应,一大部分是兼容的 关系,因此这种词表被称为低层次的一体化词表。 以《中图法》与《汉语主题词表》为基础编制的《中国分类主题词表》, 就是这种类型的一体化词表的典型代表。