信息检索文字题复习提纲(名词解释、举例、简答、论述)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息检索复习题
1、信息检索的原理是什么?
(1)广义信息检索原理:
在存储过程中,专门负责信息检索系统和数据库建立的人从各种各样的信息资源中,收集有用的信息,对有用的信息进行主题内容的分析,找出能够全面、准确表达主题内容的概念,借助于检索语言(通常是检索词表)把分析出来的概念转换成检索系统所采用的词语,或者直接使用自然语言,再按照一定的规则和方式将这些有用的信息组织成可供件所用的数据库,并存储在一定的介质上。
(2)狭义信息检索原理:
狭义信息检索的原理就是广义信息检索中信息检索过程的那部分原理。信息检索基本原理中的核心部分就是用户所使用的检索词或者由检索词和运算符所组成的检索式与数据库中的检索词及其逻辑关
系之间的比较和匹配机理。两者相匹配的信息被检索出来(命中),不相匹配的信息被拒绝。*
2、信息检索有哪些工具?
按处理信息手段分:手工检索工具、计算机检索工具。
按著录方式分:目录型(国家书目、馆藏书目、联合书目、专题书目)、题录型、文摘型(指示性、报道性、评论性)、索引型(主题索引、分类索引、著者索引)。
3、信息检索的途径和方法有哪些?
(1)信息检索途径
分类途径:按学科分类体系来检索文献信息。从分类途径检索文献信息,主要是利用分类目录和分类索引。它以知识体系为中心,比较能体现学科系统性,反映学科与事物的隶属、派生与平行关系,便于从学科所属的范围来查找文献资料,并可起到“触类旁通”的作用。
题名途径:是根据文献名称包括书名、刊名、篇名等来检索文献的途径。一些检索系统中提供题名字顺检索途径,如书名目录、刊名目录、篇名索引等。
(2)信息检索方法
追溯法:也称引文法,是利用综述或已经掌握文献所附的引文注
释和参考文献目录作为线索逐一追查原文,再利用这些原文所附的参考文献目录逐一扩检,产生滚雪球效果。
直接法:又称常用法,是直接利用检索工具检索文献的方法。它
又分为顺查法(由远及近)、倒查法(由近及远)和抽查法(重点时间段进行)。
综合法:又称循环法。即利用检索工具查到某些文献,又利用这
些文献所附的参考文献追溯查找,如此循环下去,直到满足检索要求为止。是直接法和追溯法的结合。
4、什么是信息检索语言?有哪些类型?
(1)概念:
检索语言是根据信息检索的需要而创制的,能够唯一地表达各种
概括文献信息内容的概念,能够显示概念之间的相互关系,并便于进行系统排列,便于将标引语言和检索用语进行相符性比较的人工语言。它是一种受控语言,依据一定的规则对自然语言进行规范,将其编制成表,供信息标引以及检索时使用。*
(2)类型:
分类检索语言:依据分类法,以学科体系为基础,按类目编排的
检索语言。
主题检索语言:主题语言是以语词作为概念标识,按字顺编排的
检索语言。它又包括叙词语言和关键词语言,以及较早使用的标题词语言和单元词语言。
另外,按检索词的规范化程度分为人工语言和自然语言;按组配
方式分为先组式语言和后组式语言。
5、信息检索的过程是什么?
(1)课题分析,明确查找目的与要求。包括学科范围、年代范围、出版类型、语种、数量,分析检索信息的特点及检索信息内容的主题概念。
(2)选择检索工具。手工检索要确定具体的工具书;计算机检索则要确定检索数据库。
(3)确定检索途径和方法。以数据库检索为例:
A.选择字段(题名、文摘、著者、机构等)。
B.填写检索词。
C选择逻辑算符。
D.执行检索。
E.结果显示。有题录、题录+文摘、全文等由检索者选择。
(4)调整检索策略。重复(3),再次检索。
(5)根据文献线索,找到原文。全文数据库可进行存盘、打印或发电子邮件等。
6、信息检索的有关概念有哪些?
①加权检索:在每个提问词后给定一个数值表示其重要程度,这个数值称为权,在检索时,先查找这些检索词在数据库记录中是否存在,然后计算存在的检索词的权值总和,权值之和达到或超过预先给定的阈值,该记录即为命中记录。
②异构检索:也称跨库检索,是一个集成的、可同时对多个数据库进行一站式检索的综合检索平台。用户可以只通过一个检索窗口,就能对该图书馆拥有的多个数据库同时进行检索。*
③字段检索:是一种用于限定提问关键词在数据库记录中出现的区域,控制检索结果的相关性,提高检索效果的检索方法,它多以字段限定的方式实现,即指定检索词出现的字段,被指定的字段也称检索入口,检索时系统只对指定字段进行匹配运算,提高了效率和查准率。
④原文检索:”原文“是指数据库中的原始记录,原文检索可以说是一种不依赖词表而直接使用自由词的检索方法。检索时,使用位置算符连接检索词,并规定运算符的级别——记录级、字段级、子字段级和位置检索。
⑤查全率:检索结果中计算机输出的相关文献数与计算机数据库中相关文献的总数之比。
⑥查准率:检索结果中,输出的相关文献数与输出的文献总数之比。
⑦误检率:是与查准率相对应的概念,也是评价检索效果的指标。
⑧漏检率:是与查全率相对应的一个概念,,是评价检索效果的指标。
7、什么是信息资源?
(1)广义信息资源
广义的信息资源是指信息活动中各种要素的总称,既包括信息本身,也包括与信息相关的人员、设备、技术和资金等各种因素。(2)狭义信息资源
狭义信息资源只限于信息本身不包括其他因素。
(3)图书馆学:
以图书馆学的角度,信息资源的内涵和外延主要包括以下4各方面:
①信息资源应当是信息的集合。
②信息资源应当是有用信息的集合。
③信息资源应是经过人类组织的、有序的、可存取的信息集合。
④信息资源应包括各种文献载体形式。如文字、声像、数字信息(4)定义
因此,信息资源应定义为:信息资源是经过人类筛选、组织、加工,并可存取和能够满足人类需求的各种信息的集合。
8、信息资源的类型及特点有哪些?
(1)类型
①按信息的载体和传输形式分:体载信息资源;实物信息资源;文献信息资源;网络信息资源。
②按载体形式分:印刷型;缩微型;电子型;声像型。
③按出版形式分:图书、期刊、报纸、会议文献、科技报告、学位论文、专利文献、标准文献、技术档案、产品样本。即通常所说的“十大信息情报源”。
(2)特点
①稀缺性
②不可独占性
③不可分性
④不同一性
⑤驾驭性