山西大学《信息检索》考研复习重点题库
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
考试复习重点资料(最新版)
资料见第二页
封
面
复习题一
一、名词:
1.①信息检索:是指将信息按一定的方式和存储起来,并根据信息用户的需要找出有
关信息的过程。广义的信息检索包括信息的存储和检索。
2.①文献标引:是对文献的内容特征进行分析、描述、并按照所采用的分类法和主题
法给该文献一标识符号的工作。
3.①检全率与漏检率:检索工具检索效率的评价指标。检全率=检出的相关文献/相
关文献总量。漏检率=未检出的相关文献/相关文献总量。
4.①检准率与误检率:检索工具检索效率的评价指标。检准率=检出的相关文献/检
出文献总量。误检率=检出的无关文献/检出文献总量。
5.①检索策略:是在分析情报需求实质,明确检索提问的基础上,选择检索工具,检
索途径和检索用词,并明确各词之间的逻辑关系与查找步骤的科学安排。
6.①书目之书目:或称检索工具的检索工具,是检索工具的目录,是将目录、题录、
文摘等检索工具,按照类型或取材的学科范围,或按文种等方式排列起来,并附上
简介,指出所收录检索工具的内容、特点和使用方法。
7.①文献著录:按照一定的条例或标准,将一件文献区别与其他文献的外表特征、物
质特征乃至文献摘要一一加以描述并记载下来的工作称为文献著录。
8.①文献指南:它的内容主要是介绍某一学科的期刊和其他类型的一次文献。有关这
些文献的各种检索工具和重要的参考书,信息检索的方法,以及利用图书馆的一般
方法。
9.①引得深度:是衡量检索工具编制过程中分析文献内容所达到的深度的具体质量指
标。是指一篇文献所标引的索引词数目,即指定给每篇文献的“文献标识”数目。
10.①报道时差:是指从被摘文献发表道收录尽检索工具时所经历的时间间隔,检索工
具只有尽可能的缩短报道时差,才能适应科学技术的发展和科技文献增长的需要,
使科研工作者尽快获得最新的文献资料,促进科研工作的开展;否则,报道时差过
长,检索工具本身就失去了现实意义。
11.②主题词:主题词是主题词表中表达一定概念的最小词汇单元,是自然语言中优选
出的规范化词汇,这种词汇不仅反映着一定事物的概念,而且作为事物概念的表达
形式而存在。
12.②倒排档系统:比号法和比孔法有一个共同的特点,就是这种系统是按照每类一卡、
或每词一卡的原理操作的,因此被称为“词款目录系统“或“资料从属于词之下系
统”,即作为资料的文献是编到词卡上的。这样,作为存在于标引员工作单中标引
词于文献之间的关系,在索引文档组织中已被倒排,因此这种系统又被称为倒排档
系统。
13.②ASI:查阅主题索引时,必须将索引标题和修饰语联系起来,按修饰语所带介词
的句法规则,以及学科内容的内在联系来理解,才能得到一个准确的完整的文献主
题。具体的方法是,把索引标题和用逗号分开的各部分修饰语,按照学科内容的内
在联系和修饰语所带介词的句法规则,一个个挂接起来,从而得到一个准确完整的
文献主题的自然语序,因此这种索引又称为挂接主题索引(ASI)。
14.②概念组配:
15.②概念组配索引
16.②词族索引:也称为族系索引或词族表,它是把字顺主题词表和附表中的具有属种
关系、整体与部分关系和包含关系等主题词,按其学科本质属性展开全显示的一种
词族系统。
17.②范畴索引:也称为范畴表,它是将字顺主题词表和附表中的全部主题词,按照主
题词的学科属性和词义范畴,划分为若干个大小类目,以便从分类途径查词和查字顺主题词表的一种手段。
18.②主题词的参照系统:主题词的语义性是指主题词之间存在的含义上的相互关系。
这种关系主要有同义关系、属分关系和相关关系。在词表中通过这种语义关系的表达,即对主题词进行控制和规范化,又对主题词的含义进行科学的具体限定,使其形成一种暗含的网络结构,从而达到扩大检索途径和满足族性检索的要求。主题词的这种语义关系,称为参照系统。
19.②文献-词矩阵:从概念上说,索引(书目数据库)可以看作是一个文献-词矩阵,
在这个矩阵中,数字1-10表示该数据库标引的文献,字母A-H表示文献标引词的一个词表,第I行第H列的元素按照第H列文献是否包括第I行索引词分别定义为1和0。这样,纵行就是文献的描述,即它指明了该文献用那几个索引词来标引;而横行则是文献标识的描述,即在该标识下标引了哪几篇文献。
20.②索引语言:文献存储时,文献标识按照一定的语言加以描述,而进行检索时,信
息提问也按照,相应的语言予以表达,规范化这种把标识于检索联系起来,对概念进行处理,使检索得以有效进行的语言就是索引语言。
21.②KWIC:题内关键词索引(KWIC).题内关键词索引又称为上下文关键词索引,
其形式是:关键词居中,上下文排其两侧,关键词后的词排不下时,可往前栏的空白处排;关键词前的词排不下时,可往中排的空白处排,后栏未文献号。
22.②D-KWIC:双重上下文关键词索引(D-KWIC)。双重上下文关键词索引,该索
引在编排形式上,结合了KWIC和KWOC的特点,即先抽出文中的一个关键词提按行。作为索引标目,然后将剩余部分,按其它关键词轮排,在轮排条目中,在轮排中第一关键词用*代替。
23.⑤布尔逻辑检索:所谓布尔逻辑检索是通过标准的布尔逻辑关系词来表达检索词与
检索词间的逻辑关系的检索方法。主要的布尔逻辑关系词有:AND,OR,NOT. 24.⑤加权检索:是每一个检索词给定一个数值表示其重要程度,称为权值。对在检索
中,先查找这些检索词在在数据库中是否存在。对存在的检索词计算他们的权值总和。只有当数据库记录的权值之和达到或超过预先给定的值时,该记录才算命中。
25.⑤截词检索:是指在检索式中用专门的符号(截词符号)表示检索词的某一部分允
许有一定的词形变化,因此,检索词的不便部分加上由截词符号所代表的任何变化形式所构成的词汇都是合法的检索词,结果中只要包含其中任何一个就满足检索要求。
26.⑤SDI:定题服务。这是针对相对固定的用户课题提问要求,对新到的数据库文档
进行检索,并定期向用户提供所需信息资料的服务。
27.⑤检索表达式:是计算机检索中用来表达用户检索提问的逻辑表达式,由检索词和
各种布尔逻辑算符、位置算符以及系统规定的其他组配连接符号组成。
28.⑥RS:追溯检索。这种检索不仅能够查找最新的信息资料,而且可以追溯查找数
据库存储年限范围内的某一段时间之内的有关文献资料。
29.⑦URL:中文直译为“统一资源定位器”。URL一般包括协议部分、主机部分、目
录部分、文件部分,通过URL,就可以在因特网茫茫的信息海洋中定位出具体的某个资源。URL等于通常所说的网址。
30.⑦远程登录:远程登陆是提供较早的一种服务,它引用了UNIX多用户系统的用户
帐号概念。用户帐号规定了用户对系统的使用权,用户登陆后就可以访问系统的全