电子信息检索第一章 信息检索概述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2020/5/21
16
基本部类
基本大类
马克思主义、列宁主义
毛泽东思想、邓小平理论——A马克思主义、列宁主义、毛泽东思想、邓小平理论
体系分类语言采用尽量列举类目的方法,但是受到类 目数量的限制,缺乏专指性,查准率不高。
由于分类表的结构是固定的,不便于随时修订和增设 新的类目。
体系分类语言采用分类号作为检索标识,检索文献时, 需要将检索文献的主题内容转换成分类号,转换过程
中,容易产生误差,造成误检。
2020/5/21
15
体系分类语言广泛应用于图书、资料的分类、
事实检索(Fact Retrieval) 事实检索的对象是已经存在的各种事实的有关资料 。
文献检索是一种相关性检索,数据检索是一种确定性 检索。
2020/5/21
2
按系统中信息的组织方式分为:
全文检索 指检索系统中存储的是整篇文章乃至整本书。
超文本检索 从信息在系统中的组织方式不同而言,提供浏 览式查询。
第一章 信息检索概述
第一节 信息检索的定义
一、信息检索的定义
信息检索(information retrieval)是指将信息按一 定的方式组织和存储起来,并根据信息用户的需要找 出有关的信息的过程和技术。全称叫信息存储与检索 (information storage and retrieval)。狭义的信息检 索则仅指该过程的后半部分,即从信息集合中找出所 需要的信息的过程,相当于人们所说的信息查询 (information search)。
对内容相同及相关的文献信息加以集中或揭 示其相关性,使大量分散的文献存贮系统化、 组织化,便于进行有规律的检索
便于将标引用语与检索用语进行相符性比较
2020/5/21
10
2.检索语言的类型
根据是否规范化,分为规范化的语言(人工 语言,如 主题词语言)和非规范化的语言 (自然语言)。
根据包括的专业范围,分为综合性和专用性 语言。
2020/5/21
1
二、信息检索的类型
按存储和检索的内容分为:
文献检索(Document Retrieval ) 以文献(包括文摘、题录或全文)为检索对象,分为 手工式检索和计算机化的文献检索。
数据检索(Data Retrieval) 数据检索的对象是数值性数据,即具有数量性质并以 数值形式表示的量化信息。
4
四、信息检索的地位和作用
促进信息资源的开发和利用 协助管理者做出正确的决策 便于继承和借鉴前人的成果,避免重复
研究或走弯路 节省研究人员查找文献的时间
2020/5/21
5
第二节 信息检索的原理
一、信息检索的原理
就是检索提问标识与存储在检索工具中 的标引标识进行比较,两者一致或者信 息标引的标识包含着检索提问标识,则 具有该标识的信息就从检索工具输出, 输出的信息就是检索命中的信息。 简单的讲,就是匹配。
各检索系统的检索原理基本相同。
2020/5/21
6
信息检索的全过程包括存储和检索两个过程。
存储过程就是按照主题词表或分类表及使用原则对原始信息进 行处理,形成信息特征标识,为检索提供经过整序的信息集合 的过程。具体来说,信息的存储包括对信息的著录、标引以及 编排正文和所附索引等。
所谓信息的著录是按照一定的规则对信息的外表特征和内容特 征加以简单明确的表述。信息外表特征包括信息的著者、题名、 来源、卷期、页次、年月、号码、文种等。信息内容特征包括 主题词、关键词和文摘。
信息的标引就是就信息的内容按一定的分类表或主题词表给出 分类号或主题词。
检索过程则是按照同样的主题词表或分类表及组配原则分析课 题,形成检索提问标识,根据存储所提供的检索途径,从信息 集合中查获与检索提问标识相符的信息特征标识的过程。
2020/5/21
7
信息存储与检索原理
2020/5/21
8
二、检索语言
定义:
检索语言,又称标引语言、索引语言、信息 检索语言等,是根据检索需要而编制的一种 人工语言。世界上的检索语言很多,如《中 国图书馆分类法》、《杜威十进位分类法》、 《中国科学院图书馆图书分类法》、 《INSPEC叙词表》等。
2020/5/21
9
1.检索语言的功能:
简单明了而又规范化地标引文献的主题内容 及其外表特征
超媒体检索 对超文本检索的补充,存储对象超出了文本范 畴,融入了静、动态图像(形)以及声音等 多媒体信息。
2020/5/21
3
三、信息检索研究的核心问题
检索语言兼容与整合的研究 数据库与文档的研究 有关检索系统的研究 检索策略的研究 网络搜索工具研究 检索服务的研究
2020/5/21
2020/5/21
13
(1)分类语言的特点
体系分类语言是以学科划分类目,符合 人们认识事物的规律和处理事物的习惯
体系分类语言强调知识的系统性,方便 人们按学科、专业系统检索有关文献资 料 ,能够达到族性检索,可以获得较高 的查全率
便于组织图书馆资料排架
2020/5/21
14
不足之处
检索者检索课题时首先必须了解课题的学科体系才能 顺利查找到相应的类目,如果不熟悉学科体系,会带 来一定的困难 。
根据描述文献的特征,分为表达文献外表特 征的检索语言和表达文献内容特征的检索语 言。
2020/5/21
11
2020/5/21
12
3.分类语言百度文库
分类语言以学科体系为基础,将各种概念按 照学科性质进行分类和系统排列,并按分类 编排组织成一个完整的体系。
它按照知识门类的逻辑次序,运用概念划分 和归属的方法,由总到分,由一般到个别, 由抽象到具体,由低级到高级,由简单到复 杂这样层层划分,逐级展开,形成一个严格 有序的等级制体系。
排架和检索,如在我国应用较广的《中国图
书馆图书分类法》(简称中图法)、《中国科学 院图书馆图书分类法》(简称科图法)、《人民 大学图书馆图书分类法》(简称人大法)以及国 外 的 《 杜 威 十 进 分 类 法 》(Dewey Decimal Classification , 简 称 杜 威 法 , DDC 或 DC) 、 《美国国会图书馆图书分类法》(Library Qf Congress Classification,简称国会法或LC分 类法)都属于这一类。