2009年中国人民大学信息检索618考研真题

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2009年

一、简答题

1、信息检索的定义及其原理

从广义的角度讲,信息检索包含信息存储和信息获取两个过程。信息存储指通过对大量无序信息的选择和收集、著录和标引等方法,建成各种各样的信息检索工具或信息检索系统,使之成为有序化信息集合的过程。获取是存储的逆过程,其实质是根据特定的需求,运用已组织好的检索系统,将特定的信息查找出来。存储是获取的前提和基础,没有存储就没有获取,而获取是存储的目的,二者密切联系,互为依存,缺一不可。

狭义的信息检索是指广义的信息检索的后一个过程,即信息获取的过程。具体来说,指通过一定的方法,从已存储的信息中检索出与用户提问相关的文献、数据和事实的过程,即根据用户的特定要求查找所需信息的过程。

实质上,信息检索原理是将特定的信息需求与存储在检索系统中的信息标识进行异同的比较与匹配,选取两者相符或部分相符的信息予以输出。检索系统对所要存储的信息,按照其外部特征和内容特征进行描述并赋予特征标识,然后存入系统;检索时,将所需信息的特征标识与所存信息的特征标识进行比较。凡是两边标识一致的,就将具有这些标识的信息从检索系统中输出。

信息检索的基本原理可以概括为:对信息资源集合与信息需求集合的匹配与选择,如下图所示。 信息检索的基本原理示意图

(1)信息资源集合:信息资源集合是指有关某一领域的、经选择性采集和组织加工的信息集合体。为了保障信息检索的快速与高效,需要对信息资源集合进行某种形式化的加工,形成它们的特征化表示,即对它们进行分析与标引,让原来隐含的、不易识别的特征显性化,并获得相应的标识。将这些被分析、提取出来的特征及其标识进行存储,便构成了索引库,成为阻止和查找信息资源的依据和标准。

(2)信息需求集合:用户的信息需求是在社会实践活动中产生的。当人们为完成某一任务或工作时,时常会觉得缺少某些知识,这就产生了信息需求。众多用户不同形态的信息需求的汇集,形成了信息需求集合。用户信息需求的产生极其满足,是实施信息检索行为的前提与基础,更是实施信息检索行为的目的所在。如同对信息资源集合进行的特征化表示一样,对用户提出的信息需求也需要进行类似的加工处理,即分析需求的内容,提取出主题概念或其他属性,并利用与信息资源集合相同的标识系统(即检索语言)来表示需求中所包含的概念和属性,从而得到用户需求的特征化表示结构——提问式。

(3)匹配与选择:为了从信息资源集合中快速获取用户所需要的信息与知识,要求信息检索提供一种“匹配”机制。其主要功能在于:能够把信息需求集合与信息资源集合依据某种相似性标准进行比较与判断,进而选择出符合用户需要的信息。在信息资源集合与信息需求集合都进行了特征化表示的基础上,它们两者之间的匹配就简化为提问式(代表用户的信息需求集合)与已建立的有序的索引库(代表信息资源集合)之间的匹配,即两组有限的语词符号化特征之间的匹配比较。这种简化对于提高匹配和选择的效率来说是非常必要的,但同时它也带来了一些问题,例如漏检、误检等。如何减少这类问题,成为信息检索领域中一个备受关注的研究课题。

信息需求集合 特征化表示 特征化表示 信息资

源集合

匹配与选择

2、百科全书的定义及特点

百科全书是汇集各学科或某一学科的专门术语、重要名词,以词典的方式进行编排,对每一词目都加以全面系统而又客观简明的阐述,并对新的研究成果加以反映的大型工具书。百科全书涉及各个领域,其内容之丰富、规模之宏大、检索功能之完备是其他工具书所不能及的。在各类工具书中,百科全书堪称“工具书之王”。通常情况下,百科全书按内容范围可以分为综合性百科全书和专科专题性百科全书;按地区范围可以分为国际性百科全书和地域性百科全书;按读者对象可以分为成人学术性百科全书、成人普及性百科全书和青少年通俗性百科全书。

西方百科全书的编纂可以追溯到古希腊、古罗马时期。古希腊哲学家斯珀西波斯和古希腊哲学家、科学家亚里士多德,编纂过概述各种学问的百科全书式的著作,被认为是百科全书的先驱者。亚里士多德还是最早对科学进行分类的人,他的思想和实践对后世百科全书的编纂有较大影响,人们称他为“百科全书之父”。到了中世纪,出现了一批具有代表性的百科著作。英国学者钱伯斯,编纂了《百科全书,或艺术与科学综合大辞典》,概述影响较大,钱伯斯因而被称为“现代百科全书之父”。我国于清朝末年开始编译外国百科全书。

百科全书包罗万象,能为人们提供人类各个知识领域的基本知识,是学习和工作中最常用的、必备的工具书之一。人们往往称之为“没有围墙的大学”、“知识的小宇宙”、“精简的图书馆”。百科全书的主要作用可概括为两个方面:(1)提供各种资料:百科全书收录资料广泛,是人们解疑释难的好工具。无论是解决学习工作中遇到的问题,还是查找各种问题的基本资料等,都可以利用百科全书。(2)帮助系统求知:百科全书对知识领域的覆盖面广,对各学科知识不畸轻畸重,客观、系统、完备、翔实地介绍各门学科的基本概况和基本理论。同时,它介绍的知识是不断更新的。目前,外国百科全书把5年以上的资料都看作过时的资料,因而很重视修订工作。利用百科全书,可以系统学到某一学科的基本知识,了解各学科的发展水平。百科全书一般具有以下特点:

(1)概括性

百科全书取材广泛,是百科知识的总汇,它用准确精练的语言,系统概述了人类各个知识领域或某个知识领域的基本事实、基本概念和基本理论,提供了各种事物的基本知识、历史和现状。

(2)权威性

著名的百科全书通常设立阵容强大的编辑机构,各条目的编纂,都是由各个领域、各门学科的著名专家学者来完成的,以保证其质量。如《中国大百科全书》总编辑委员会及其下设的各学科卷的编辑委员会,都由我国各学术领域的权威人士组成。

(3)易用性

百科全书集中了日臻完善的编排方式、索引和参见系统,重要条目后都附有参考条目,或在文中注明征引资料的出处等,读者能从多种角度,用最短的时间检索到所需的知识。如《中国大百科全书》就设有七种检索渠道,以供检索与查考,是迄今为止我国出版的所有印刷型工具书中最完备的。

相关文档
最新文档