郑州大学现代远程教育《信息检索》
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
郑州大学现代远程教育《信息检索》
真题 [2015版客观题]
一、名词:(每题5分,共5×6分)
1. 检全率与漏检率
2. D-KWIC
3. 文献著录
4. 词族索引
5. 检索表达式
6. 加权检索
二、简答:(每空8分,共8×5分)
1. 什么是索引语言?索引词表的规范化内容包括哪些方面?
2. 图示CA 文摘、索引、附表之间的关系
3. 简述DIALOG 系统的常用指令(至少八个)
4. 简述建立数据库对知识进行组织的三个层次
5. 简述联机检索的主要服务范围
三、论述:(每题15分数,共15×2分)
1. 论述主题词的性质
2. 论述联机检索和网络检索的差异
《信息检索》答案
一、名词: 1.)
()()(b a a P +=检出文献总量检出的相关文献量检准率 )
()()(b a b N +=检出文献总量检出的无关文献量误检率 2.双重上下文关键词索引(D-KWIC )在编排形式上,结合了KWIC 和KWOC 的特点,即先抽出文中的一个关键词(第一关键词)提行,作为索引标目,然后将剩余部分,
按其它关键词(第二关键词)轮排,在轮排条目中,第一关键词用*代替。
3. 按照一定的条例或标准,将一件文献区别于其它文献的外表特征(包括书名或篇名、著者或译者、出版事项,出处、文种等)、物质特征(包括文献类型、装帧形式、图表、页码等)乃至文献摘要一一加以描述并记载下来的工作称为文献著录。
4. 词族索引,也称族系索引或词族表,它是把字顺主题词表和附表中的具有属种关系、整体与部分关系和包含关系等主题词,按其学科本质属性展开全显示的一种词族系统。
5. 检索表达式是计算机检索中用来表达用户检索提问的逻辑表达式,由检索词和各种布尔逻辑算符、位置算符以及系统规定的其他组配连接符号组成。
6. 加权检索,是在检索时,给每个检索词以一个表示其重要度的数值(即所谓“权”),然后对含有这些检索词的文献进行加权计算,其和在规定的数值以上者,作为命中文献输出;权值的大小,表示被检出文献的切题程度。
二、简答:
1. 什么是索引语言?索引词表的规范化内容包括哪些方面?
●文献存贮时, 文献标识按照一定的语言加以描述,而进行检索时,情
报提问也按照相应的语言予以表达.这种把标引与检索联系起来,对概念进行规范化处理.使检索得以有效进行的语言就索引语言.
其规范化的范围主要有以下三种:
●第一,同义规范,是指对自然语言中的同义词.准同义词的规范.
●第二,词义规范,指对自然语言中多义词,同形异义词的规范.这种规
范主要是对主题词的概念作进一步说明, 以确保在标引和检索时正确运用.
词义规范主要有以下三种形式:(1)范围注释.(2)含义注释.(3)观点注释.
●第三,词类规范,是指对主题词选词范围的一种控制.在自然语言中,
词的种类主要有二种:一种是实词,主要包括名词.动词.形容词.代词.数词.
和量词等.一种是虚词,主要包括介词.联词.副词.助词等.作为文献检索用的语言词汇,必须具有实际意义,并能反映事物本质属性.因此,主题词的选词范围,一般应控制在实词之中,即名词或动名词.其它词,如形容词.数词.
量词等应控制使用,而动词,代词和虚词应完全避免.
2. 图示CA文摘、索引、附表之间的关系
3. 简述DIALOG系统的常用指令
●BEGINn(或简写成Bn):开库指令。
●EXPAND(或简写成E):扩词指令。·
●SELECT(或S):基本查找指令。
●SELECT STEPS(或S STEPS;SS):分步骤查找指令(分步选词检索指
令)。
●TYPE(或T)或者PRINT(PR):联机或脱机打印指令。
●SETFILES:选文档指令。
●REMOVE DUPLICATES(RD):去除重复记录指令。
●COMBINE(或C):逻辑组配指令。
●DISPLAY SETS(或DS):回溯检索步骤指令。
●SAVE:保存检索策略指令。·
●EXECUTE STEPS(或EXS):执行存储检索策略指令。
●SORT:排序指令。
●LOGOFFHOLD:暂时关机指令。
●LOGOFF:关机指令。
●EXPLAIN:解释指令。
4. 简述建立数据库对知识进行组织的三个层次。
●对知识进行第一个层次的组织,是单篇文献。一篇文献往往不止记
载一个知识项,并且还记载知识得以取得的环境,条件和方法。有的既然有图表的说明,又有文字的叙述。在一篇文献中,这些都有机地结合在一起,并以逻辑次序加以组织。因此情报用户有时只要获得一篇对口径的文献,就能从中查找,筛选出自己所需要的情报。
●对知识进行第二个层次的组织,是百科全书,大全,年鉴,手册,
表之类的三次文献。这类文献对于知识的组织,所包含的知识项更多,可检性更强。
●对知识进行第三个层次的组织,是书目,索引,文摘之类的二次文
献。它所包含的知识领域更宽,能使成千上万的文献通过题录,简介,摘要置于检索者的控制之下。
●上述对知识进行三个层次的组织,从而产生了检索系统的全文数据
库,事实数据库与数值数据库,书目数据库。
5. 简述联机检索的主要服务范围
●追溯检索 (RS) 这种检索不仅能够查找最新信息资料,而且可以追
溯查找数据库存储年限范围内的某一段时间之内的有关文献资料。
●定题服务 (SDI) 这是针对相对固定的用户课题提问要求,对新到
的数据库文档进行检索并定期向用户提供所需信息资料的服务。
●联机订购原始文献联机检索到的情报信息,大多数是二次文献。
用户如果需要原始文献而在国内馆藏中又查不到时,可以通过联机终端向联机服务系统订购文献原文
●光盘检索服务光盘检索也是一种联机检索。它不仅可以单独使用,
还可以与远程联机检索系统连用。为了便于用户使用和推销产品,把光盘数据库结构、指令语言做成与远程联机检索系统一样