郑州大学现代远程教育《信息检索》

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

郑州大学现代远程教育《信息检索》

真题 [2015版客观题]

一、名词:(每题5分,共5×6分)

1. 检全率与漏检率

2. D-KWIC

3. 文献著录

4. 词族索引

5. 检索表达式

6. 加权检索

二、简答:(每空8分,共8×5分)

1. 什么是索引语言?索引词表的规范化内容包括哪些方面?

2. 图示CA 文摘、索引、附表之间的关系

3. 简述DIALOG 系统的常用指令(至少八个)

4. 简述建立数据库对知识进行组织的三个层次

5. 简述联机检索的主要服务范围

三、论述:(每题15分数,共15×2分)

1. 论述主题词的性质

2. 论述联机检索和网络检索的差异

《信息检索》答案

一、名词: 1.)

()()(b a a P +=检出文献总量检出的相关文献量检准率 )

()()(b a b N +=检出文献总量检出的无关文献量误检率 2.双重上下文关键词索引(D-KWIC )在编排形式上,结合了KWIC 和KWOC 的特点,即先抽出文中的一个关键词(第一关键词)提行,作为索引标目,然后将剩余部分,

按其它关键词(第二关键词)轮排,在轮排条目中,第一关键词用*代替。

3. 按照一定的条例或标准,将一件文献区别于其它文献的外表特征(包括书名或篇名、著者或译者、出版事项,出处、文种等)、物质特征(包括文献类型、装帧形式、图表、页码等)乃至文献摘要一一加以描述并记载下来的工作称为文献著录。

4. 词族索引,也称族系索引或词族表,它是把字顺主题词表和附表中的具有属种关系、整体与部分关系和包含关系等主题词,按其学科本质属性展开全显示的一种词族系统。

5. 检索表达式是计算机检索中用来表达用户检索提问的逻辑表达式,由检索词和各种布尔逻辑算符、位置算符以及系统规定的其他组配连接符号组成。

6. 加权检索,是在检索时,给每个检索词以一个表示其重要度的数值(即所谓“权”),然后对含有这些检索词的文献进行加权计算,其和在规定的数值以上者,作为命中文献输出;权值的大小,表示被检出文献的切题程度。

二、简答:

1. 什么是索引语言?索引词表的规范化内容包括哪些方面?

●文献存贮时, 文献标识按照一定的语言加以描述,而进行检索时,情

报提问也按照相应的语言予以表达.这种把标引与检索联系起来,对概念进行规范化处理.使检索得以有效进行的语言就索引语言.

其规范化的范围主要有以下三种:

●第一,同义规范,是指对自然语言中的同义词.准同义词的规范.

●第二,词义规范,指对自然语言中多义词,同形异义词的规范.这种规

范主要是对主题词的概念作进一步说明, 以确保在标引和检索时正确运用.

词义规范主要有以下三种形式:(1)范围注释.(2)含义注释.(3)观点注释.

●第三,词类规范,是指对主题词选词范围的一种控制.在自然语言中,

词的种类主要有二种:一种是实词,主要包括名词.动词.形容词.代词.数词.

和量词等.一种是虚词,主要包括介词.联词.副词.助词等.作为文献检索用的语言词汇,必须具有实际意义,并能反映事物本质属性.因此,主题词的选词范围,一般应控制在实词之中,即名词或动名词.其它词,如形容词.数词.

量词等应控制使用,而动词,代词和虚词应完全避免.

2. 图示CA文摘、索引、附表之间的关系

3. 简述DIALOG系统的常用指令

●BEGINn(或简写成Bn):开库指令。

●EXPAND(或简写成E):扩词指令。·

●SELECT(或S):基本查找指令。

●SELECT STEPS(或S STEPS;SS):分步骤查找指令(分步选词检索指

令)。

●TYPE(或T)或者PRINT(PR):联机或脱机打印指令。

●SETFILES:选文档指令。

●REMOVE DUPLICATES(RD):去除重复记录指令。

●COMBINE(或C):逻辑组配指令。

●DISPLAY SETS(或DS):回溯检索步骤指令。

●SAVE:保存检索策略指令。·

●EXECUTE STEPS(或EXS):执行存储检索策略指令。

●SORT:排序指令。

●LOGOFFHOLD:暂时关机指令。

●LOGOFF:关机指令。

●EXPLAIN:解释指令。

4. 简述建立数据库对知识进行组织的三个层次。

●对知识进行第一个层次的组织,是单篇文献。一篇文献往往不止记

载一个知识项,并且还记载知识得以取得的环境,条件和方法。有的既然有图表的说明,又有文字的叙述。在一篇文献中,这些都有机地结合在一起,并以逻辑次序加以组织。因此情报用户有时只要获得一篇对口径的文献,就能从中查找,筛选出自己所需要的情报。

●对知识进行第二个层次的组织,是百科全书,大全,年鉴,手册,

表之类的三次文献。这类文献对于知识的组织,所包含的知识项更多,可检性更强。

●对知识进行第三个层次的组织,是书目,索引,文摘之类的二次文

献。它所包含的知识领域更宽,能使成千上万的文献通过题录,简介,摘要置于检索者的控制之下。

●上述对知识进行三个层次的组织,从而产生了检索系统的全文数据

库,事实数据库与数值数据库,书目数据库。

5. 简述联机检索的主要服务范围

●追溯检索 (RS) 这种检索不仅能够查找最新信息资料,而且可以追

溯查找数据库存储年限范围内的某一段时间之内的有关文献资料。

●定题服务 (SDI) 这是针对相对固定的用户课题提问要求,对新到

的数据库文档进行检索并定期向用户提供所需信息资料的服务。

●联机订购原始文献联机检索到的情报信息,大多数是二次文献。

用户如果需要原始文献而在国内馆藏中又查不到时,可以通过联机终端向联机服务系统订购文献原文

●光盘检索服务光盘检索也是一种联机检索。它不仅可以单独使用,

还可以与远程联机检索系统连用。为了便于用户使用和推销产品,把光盘数据库结构、指令语言做成与远程联机检索系统一样

相关文档
最新文档