信息检索知识点
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息检索考点整理
1.信息检索的概念
广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程;
而狭义的信息检索仅指有序化信息的检索查找。
2.信息检索的原理
就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。
3.为什么说信息存储和检索是两个不可分割的有机体?
检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。存储过程主要是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。检索过程是存储过程的逆过程。因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。
4.信息检索的方法
(1)顺查法
(2)倒查法
(3)抽查法
(4)追溯法
(5)循环法
5.信息检索的途径
(1)内部特征途径
a)分类途径
b)主题途径
(2)外部特征途径
a)题名途径
b)著者途径
c)文献编号途径
d)目录检索途径
e)机构检索法
f)引文检索途径
6.布尔模型的优缺点
优点:(1)简单,形式简洁,易于理解;
(2)可操作性强,应用广泛;
(3)构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确
的语义概念;
(4)能处理结构化提问。
缺点:(1)表达用户复杂需求效果欠佳
(2)准确匹配无法提供定量比较
(3)匹配标准不尽合理
(4)检索结果不易控制
7.概率排序原则:
如果一个检索系统对用户的每个检索提问的反应是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果是最好的。
8.什么是计算机信息检索?
所谓计算机信息检索,就是在计算机和人的共同作用下,按照一定的方法组织和存储信息,并通过人机对话从计算机存储的大量数据中自动输出用户所需的那部分信息的过程。实质上计算机信息系检索是利用计算机信息检索系统存储和查找信息的技术,是计算机硬件资源、系统软件、检索软件和数据库的综合。
9.计算机信息检索的类型:
(1)根据检索系统的工作方式,可分为:
a).脱机信息检索
脱机信息检索是利用单台计算机的输入装置进行检索的系统,用磁带作为存储介质,并且为连续的顺序检索方式,适合大批量的定题信息检索。
b).联机信息检索
联机信息检索是利用计算机终端设备,通过通信线路或网络,与世界上的信息检索系统相连,从信息检索系统的数据库中进行检索并获取信息的过程。
联机检索模式是主从式,即为所有的工作都在主机上进行,主机负担重,一旦主机瘫痪,整个系统都将处于瘫痪状态,因此对主机的性能要求极高。
c).光盘信息检索
d).网络信息检索
(2)根据信息的服务方式,可分为:
a).定题检索
定题检索是用户根据课题的要求,事先编写出逻辑检索提问式,并将存储在计算机的存储器中,每次系统加入新的信息,系统便会按检索要求,找出用户所需的资料,并把结果分给用户,用户能及时得到最新的文献信息。具有定期性、新颖性和批处理性的特点。
b).回溯检索
回溯检索是追溯查找过去的信息,让用户一次检索一段时间内与某一课题有关的信息。也可以查找最新的信息,可以适应多数用户的查询需要。
c).日常检索
10.计算机信息检索技术初级检索6个
1)布尔逻辑检索
2)位置限制检索
3)短语检索
4)截词检索
5)字段限制检索
6)区分大小写检索
11.计算机信息检索技术高级检索6个
1)加权检索
2)自然语言检索
3)相关信息反馈(相似检索)
4)概念检索
5)模糊检索
6)聚类检索
布尔逻辑检索
(1)逻辑与用AND或*表示检索式写作A AND B或A *B
(2)逻辑或用“OR”或“+”表示
(3)逻辑非用NOT 或—表示 A NOT B (A当中除去B所剩下的)
字段名称及缩写
AB abstract TI title AU author JN journal name
LA language PY publication year SP source publication
分类和聚类的异同
相同点:基于“类”的思想进行检索。
不同点:(1)分类基于分类法,其类目体系主要是先组式,有系统性的。类目与文献之间具有相对独立性。而聚类则先有文献后聚类,类的性质及整体类目体系完全由系统中的文献决定。(2)从类目形成过程看,分类是总到分,聚类由分到总。
会构建检索式(主要是积木型)
12.计算机信息检索策略含义
狭义的计算机信息检索策略是指检索提问式的构建,即运用系统特定的检索技术,确定检索词之间的逻辑关系,形成表达用户信息需求的检索提问式。
广义的计算机信息检索策略是指在分析检索课题的实质内容和明确检索目标的基础上,选择检索工具,确定检索途径与检索用词,以及检索词之间逻辑关系与查找步骤最佳方案的一系列科学安排。
13.计算机信息检索策略类型(即联机检索五原则)
(1)最专指面优先:从最专指的概念入手
(2)最低登录量面优先
(3)积木型(重点掌握,会构建此检索式)
(4)引文珠型增长
(5)逐次分馏