信息检索习题汇总及答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、填空题
1.数据的记载方式主要有数值型_、文字型、_语音型、_图像型。
2.数据与信息的关系可看作是原料_和_成品_的关系。
3.信息分析过程是将数据转换为_信息_的过程。
4.信号分为_信息_信号和_人为_信号。
5.信息一般表现为_数据_、文本_、_声音、_图像_等形态。
6.一般认为,信息由_语义_、_差异_、_传递_、_载体_等要素构成。
7.信息的加工按加工对象的不同可分为对_外表_信息的描述,对_整体_信息的描述,如文摘对_内容_信息的描述。
8.信息管理的过程包括信息_收集_、信息_传输_、信息加工_、信息储存_。
9.信息加工包括_信息形式的变换和_信息内容的处理。
10.信息动机的形成原因有_内在的信息需要_和_外在刺激_。
11.主题语言包括_标题词_、_单元词_、_叙词_、_关键词_。
12.在信息存储的结构中,基本的逻辑结构有_线性结构_、_非线性结构、_树形结构_、网状结构。
13.总体上,信息检索系统可分为_数据预处理_、_索引生成_、_查询处理、_检索_。
二、名词解释
1. 数据:是指记载下来的事实,是客观实体属性的值,它是由原始事实组成的。
2.信息加工:是指对获取的信息进行判别、筛选、分类、排序、分析、计算和研究等一系列过程,使收集到的信息成为对我们有用的信息资源。
3.信息组织:即信息序化或信息整序,也就是利用一定的科学规则和方法,通过对信息外在特征和内容特征的表征和序化,实现无序信息流向有序信息流的转换,从而保证用户对信息的有效获取和利用及信息的有效流通和组合。
4.检索标识:就是为沟通文献标引与文献检索而编制的人工语言,也是连接信息存储和检索两个过程中标引人员与检索人员双方思路的渠道,是用于文献标引和检索提问的约定语言。
5.信息检索:可以从广义和狭义两个角度理解。广义的信息检索是指将信息按一定方式组织和存储起来,并根据用户的需要找出相关信息的过程,其中包括存与取两个方面。狭义的信息检索仅指信息查找过程。
6.信息检索系统:是指按某种方式、方法建立起来的用于检索信息的一种有层次的体系,是表征有序的信息特征的集合体。
7.检索效果:是指利用检索系统(或工具)开展检索服务时所产生的有效结果。
三、简答题
1.简述了解用户信息需求的作用
答:用户信息需求是信息系统发展的动力,也是制定信息政策的出发点和依据。了解用户需求的特点、心理规律、查询行为及需求方式,有助于系统制订合理的信息搜集方针和信息资源的合理布局,从而提高服务效益和质量。
2.简述影响信息动机向信息行为转化的主要因素
答:(1)信息动机强度(2)认知能力(3)抱负水平
3.简述信息需要的特点
答:(1)信息需要的广泛性(2)信息需要的社会性
(3)信息需要的发展性(4)信息需要的多样性
4.简述信息检索系统的构成模式
答:(1)信息数据的选择、处理、录入、维护子系统(2)词表和标引子系统(3)检索子系统(4)系统-用户接口子系统
8.简述信息检索系统的流程
系统可分为数据预处理、索引生成、查询处理和检索四个部分。
四、论述题
1.有人说,信息加工是一个体系,你如何理解,请着重从“体系”这个角度加以说明
答:(1)加工的方式、方法多种多样。
(2)加工的方式、方法相互之间有关联,从不同角度对信息进行加工的。
(3)加工过程有其内在联系,构成一个完整的系统。
(4)整个加工体系会随着时间的变化,信息数量的变化,载体的变化和技术的变化而不断变化和完善。
(5)信息的加工按其加工对象的不同可分为对外表信息的描述与加工,对整体信息的描述与加工,还有对内容信息的描述与加工。
2.请探讨一下信息加工的层次性
根据信息加工特点,信息加工分为6个层次:
①外表信息的加工是描述性的,给用户提供的是信息的线索;
②整体信息的加工是概述性的,给用户提供的是信息的内容特点;
③内容信息的加工要深入信息内部,对有用的信息给予揭示标引,使读者利用信息有据可查;
④精粹信息的加工是通过比较鉴别的方法,选取价值高的整体或局部信息,给用户直接提供信息的精华,满足用户对实质性信息的要求;
⑤深度信息的加工是研究性和评价性的,解决信息的优劣和有关信息的有效组合问题,给用户以启迪和决策依据;
⑥相关信息的加工是信息的外延和扩展,使有关信息根据一定关系进行链接,给用户检索和直接利用的方便。
******************************* 二 ********************************************
一、填空题
1.数据库的定义功能主要是对数据库的结构进行描述,这些定义都保存数据字典中。
2.数据库系统提供了两种机制来支持完整性约束:第一种是完整性定义机制,第二种是完整性_验证约束机制_。
3.数据库的三级模式是指_外模式_、_内模式_、_模式_。
4.对文献数据库而言,加工深度表现为_题录_、_文摘_、_全文三个层次。
5.标引工作可分为_人工标引_、_计算机辅助标引_、_自动标引三种方式。
6.信息检索过程实际上是将检索提问式与文献记录标引词进行_对比匹配_的过程。
7.为提高检索效率,计算机检索系统从_概念相关性_、_位置相关性_等方面对检索提问实行技术处理。
8.用向量模型计算机向量时,一般采用向量的_夹角余弦_来表示。
9.通常,智能信息检索系统由_知识库_、_文本处理_、_智能接口_三部分组成。
二、名词解释
1.数据模型:是描述数据、数据联系、数据操作、数据语义以及一致性约束的概念工具的集合。
2.著录:就是对信息外部特征进行分析、选择与记录的过程。
3.标引:就是指对信息内容特征进行分析,赋予信息以检索标识的过程。
4.词位检索:是以数据库原始记录中的检索词之间的特定位置关系为对象的运算,又称全文检索、邻近检索。
三、简答题
1.什么是倒排文档?为什么要使用倒排文档?
答:倒排文档是将主文档中的可检字段抽出,按某种顺序重新排列起来所形成的一种文档。
按表达文献内容特征的主题词排列的文档称为基本索引文档;按表达文献外部特征排列的文档称为辅助索引文档。在实施检索时,必须和顺排文档配合使用。倒排文档类似于检索工具中的辅助索引。2.简述布尔模型及其优缺点
答:布尔模型是最简单的信息检索模型。这种模型的理论基础是集合论。
布尔模型最大的优点是理论简单、使用方便。