信息检索复习题(综合最终)

合集下载

(完整版)信息检索期末复习题及答案

(完整版)信息检索期末复习题及答案

《信息检索》期末复习题及答案(仅供参考)一、判断题1.综述和百科全书属于二次文献。

(× )2.从文献检索的角度来看,一次文献是检索对象,二次文献是检索手段。

(× )3.题录、目录属于一次文献;期刊论文属于二次文献。

(× )4.主题词规范化的目的是扩大检索范围。

(√)5.在众多的信息源中,期刊是最重要的信息源。

(√ )6.核心期刊是指经常使用的期刊。

(× )7.关键词和主题词都是表征文献实质性内容的词汇,前者是经过词表规范的,后者是未经词表规范的自由词。

(×)8.《中国图书分类法》(简称《中图法》)是由分类号(代码)和类名来揭示信息的主题概念。

(×)9.题录型的检索工具,其著录项目包括题目、作者、文献出处、文摘。

()10.一项发明创造要获得专利权必须具备新颖性、创造性和实用性。

()二、选择题1、广义的信息检索包含两个过程( B )A、检索与利用B、存储与检索C、存储与利用D、检索与报道2、文献是记录有知识的()。

A、载体B、纸张C、光盘D、磁盘3、下列哪种文献属于一次文献( A )。

A、期刊论文B、百科全书C、综述D、文摘4、下列哪种文献属于二次文献( D )。

A、专利文献B、学位论文C、会议文献D、目录5、下列哪种文献属于三次文献( C )。

A、标准文献B、学位论文C、综述D、文摘6、下列选项中属于连续出版物类型的选项有(C )。

A、人民日报B、学位论文C、科技期刊D、会议文献7、下列选项中属于特种文献类型的有( D )。

A、学位论文B、图书C、科技期刊D、标准文献8、纸质信息源的载体是()A、光盘B、缩微平片C、感光材料D、纸张9、《中国图书分类法》(简称《中图法》)将图书分成( A )A、5大部分22个大类B、5大部分26个大类C、6大部分22个大类D、6大部分26个大类10、《中国图书分类法》(简称《中图法》)是我国常用的分类法,要检索农业方面的图书,需要在( A )类目下查找。

信息检索复习题--附答案-绝对正确

信息检索复习题--附答案-绝对正确

《信息检索》复习题--附答案-绝对正确!!(总9页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--《信息检索》课理论考试复习题一、选择题:A1、从对文献的生产加工与组织层次来看,文献可以分成一次文献、二次文献和三次文献。

一次文献主要有(A )A、专著、报纸、期刊B、书目、索引、文摘C、百科全书、年鉴、手册2、《中图法》共分为五个基本部类,( B )个大类。

A、二十五B、二十二C、二十八3、按照《中图法》的分类原则,文学类和哲学、宗教类分别用汉语拼音字母( C )表示。

A、G、HB、E、DC、I、B4、根据主题词表所规定的以反映文献内容的主题词为标志,从主题的角度检索文献资料的途径是( C)A、著者途径B、文献名途径C、主题途径5、著录一批相关的图书或报刊文献的基本特征,按照一定次序编排而成的揭示和报道文献的工具书是( B )A、文摘B、书目C、索引6、按照文献的知识内容及所属学科性质而分类和检索文献信息的途径是( A )A、分类途径B、主题途径C、著者途径7、信息检索中,以课题起始年代为起点,按时间顺序由远而近逐期查找文献的方法是( C )A、倒查法B、追溯法C、顺查法8、在各种大型电子全文图书系统中,国内影响较大的主要有( B)A、人大复印资料数据库B、超星数字图书馆C、学位论文数据库9、美国《科学引文索引》是最具权威的国际性检索系统之一,简称是(A )A、SCIB、SSCIC、EI10、目前世界上最大的连续动态更新的中国期全文数据库是( B)A、维普中文期刊数据库B、CNKI中国学术期刊数据库C、万方数字化期刊数据库11、集各种类型工具书之大成,被称为“工具书之王”的工具书是( C )A、类书B、年鉴C、百科全书12、汇集某一学科或多学科的文献信息资料,按照特定的体例和排检方法编排,专供人们查阅、征引或解决疑难问题的一种专门文献是( A )A、工具书B、标准文献C、专利文献13、联机检索分为( B )联机检索和检索结果与反馈3个阶段。

信息检索复习题

信息检索复习题

信息检索复习题信息检索复习题信息检索是一门研究如何有效地从大量信息中找到所需信息的学科。

在现代社会,信息爆炸的时代,我们每天都要面对大量的信息,如何高效地检索到我们需要的信息成为了一个重要的技能。

下面是一些关于信息检索的复习题,希望能够帮助大家回顾和巩固相关知识。

一、选择题1. 下面哪个不属于信息检索的基本环节?A. 信息需求分析B. 信息获取C. 信息存储D. 信息销毁2. 在信息检索中,下面哪个不是常见的信息检索模型?A. 布尔模型B. 向量空间模型C. PageRank模型D. 概率模型3. 下面哪个不是信息检索中常见的评价指标?A. 准确率B. 召回率C. F1值D. 置信度4. 在信息检索中,下面哪个不是常见的查询扩展方法?A. 同义词扩展B. 相关词扩展C. 反义词扩展D. 词干扩展5. 下面哪个不是信息检索中常见的搜索引擎?A. 谷歌B. 百度C. 必应D. 微信二、填空题1. 信息检索的目标是根据用户的信息需求,从大量的____________中找出与之相关的信息。

2. 在布尔模型中,使用____________运算符来表示查询中的关键词之间的逻辑关系。

3. 在向量空间模型中,使用____________来表示文档和查询之间的相似度。

4. 在信息检索中,____________是指检索到的与用户信息需求相关的文档。

5. 在信息检索中,____________是指用户实际需要的与信息需求相关的文档。

三、简答题1. 请简要介绍信息检索的基本过程。

信息检索的基本过程包括信息需求分析、信息获取、信息处理和信息呈现。

首先,需要对用户的信息需求进行分析,明确需要检索的内容和目标。

然后,通过各种途径获取相关的信息,如使用搜索引擎、访问数据库等。

获取到信息后,需要对信息进行处理,包括对文本进行分词、索引构建等。

最后,将处理后的信息呈现给用户,如搜索结果列表、文本摘要等。

2. 请简要介绍布尔模型和向量空间模型。

《信息检索》总复习题库及答案

《信息检索》总复习题库及答案

2011-2012经济学院《文献检索与利用》总复习题库备注:红色为不确定答案,紫色是为了个人强化记忆。

单选题题库1.下列属于布尔逻辑算符的是(D )。

A、与B、或C、非D、以上都是2、信息素养的核心是(C ).A、信息意识;B、信息知识;C、信息能力;D、信息道德3、20世纪70年代,联合国教科文组织提出:人类要向着( B )发展.A、终身学习;B、学习型社会;C、创新发展;D、信息素质4.参考文献的标准著录格式是( A )。

A、著者篇名来源出处;B、篇名著者来源出处5.请标出文献:马品仲. 大型天文望远镜研究. 中国的空间科学技术,1993,13(5)P6-14,ISSN1000-758X 属于哪种文献类型( C )。

A、图书;B、科技报告;C、期刊;D、报纸6.常用的检索系统有( D )。

A、目录检索系统B、文摘检索系统C、全文检索系统D、以上都是7、哪一种布尔逻辑运算符用于交叉概念或限定关系的组配?( A )。

A.逻辑与()B.逻辑或(OR)C.逻辑非(NOT)D.逻辑与和逻辑非8、根据国家相关标准,文献的定义是指“记录有关( C )的一切载体。

”A.情报B.信息. C.知识D.数据9、( D )是指通过文献信息资料的主题内容进行检索的途径。

A.题名检索途径B.作者检索途径C.分类检索途径D.主题检索途径10、搜索含有“data bank”的PDF文件,正确的检索式为:( A )A."data bank" filetype:pdf B.data and bank and pdf11、从文献的( B )角度区分,可将文献分为印刷型、电子型文献。

A.内容公开次数B.载体类型. C.出版类型D.公开程度12、按照出版时间的先后,应将各个级别的文献排列成( C )A.三次文献、二次文献、一次文献B.一次文献、三次文献、二次文献C.一次文献、二次文献、三次文献D.二次文献、三次文献、一次文献13、利用文献后面所附的参考文献进行检索的方法称为( A )。

信息检索复习题

信息检索复习题

信息检索复习题第一部分各章思考题第一章思考题1.信息、知识、文献的概念及相互关系是什么?2.信息环境问题主要体现在哪些方面?3.信息素质的内涵包括哪些内容?4.按文献的载体形式、出版形式可分别将文献分为哪几种类型?5.按文献的加工程度可将文献分为哪几种类型?它们之间的关系是什么?第二章思考题1.文献的外部特征和内容特征分别有哪些?2.检索方法及各自的优缺点有哪些?3.常用的检索技术有哪些?4.简述布尔逻辑算符AND、OR和NOT在编制检索提问式中的作用。

5.请为检索课题“航空或航天发动机的设计和制造”编制检索式。

6.在一个具有1000篇文献的检索系统中检索某课题,用一特定检索策略查该课题时输出文献60篇。

经分析评估,发现该系统中共有该课题相关文献50篇,检出的文献中实际相关文献只有30篇,求查全率、查准率。

第三章思考题1. 你是如何认识数字图书馆时代的馆藏资源的?2. 请做排序:TP3/2;I247.5/123;I247.5/55;TP316/4;O13/5;TM925/44;G252.7/178;TP39/3。

3. 谈谈你对数字图书馆的认识。

4. 请检索你在图书馆近一年的借阅历史。

5. 请检索丁元霖主编的《商品流通企业会计》在中国国家图书馆是否有收藏,收藏在哪些书库?第四章思考题1.试比较分析中国知网(CNKI)、万方数据知识服务平台、维普资讯网中“中文期刊数据库”的异同点。

2.查找你所在单位人员撰写的你所学学科专业的硕士论文或博士论文3篇。

3.用检索实例说明中国知网(CNKI)标准检索、高级检索、专业检索、引文检索、学者检索的检索方法。

4.查找洗衣机方面的中国专利2项。

简述检索方法和步骤。

5.查找参考文献写作规范的国家标准。

第五章思考题1.结合你所学专业列出你所熟悉的外文电子图书数据库,并简述其检索方法。

2.简述你所学专业的常用外文电子期刊数据库有哪几种,并以其中一个数据库说明其检索方法。

3.简述ProQuest学位论文数据库检索方法。

信息检索考试题及答案

信息检索考试题及答案

信息检索考试题及答案第一篇:信息检索考试题及答案一、名词解释0、文献及其要素“文献”是泛指“有历史价值或参考价值的图书资料。

”要素:1、构成文献内核的信息、知识、数据、事实2、载体信息、知识、数据、事实的物质载体。

3、记录信息、知识、数据、事实的符号系统。

1、专利文献专利文献是实行专利的国家、地区及国际专利组织在批审专利过程中产生的官方文件及出版物,包括专利说明书、专利权利要求书、专利公报、专利分类表、专利检索工具等。

2、三大检索系统三大检索系统是:SCI(《科学引文索引》,英文全称为Science Citation Index)是美国科学情报研究所(Institute for Scientific Information,简称ISI)出版的一部世界著名的期刊文献检索工具,其出版形式包括印刷版期刊和光盘版及联机数据库,现在还发行了互联网上Web版数据库。

EI是美国《工程索引》(TheEngineeringIndex)的简称。

EI创刊于1884年,由美国工程情报公司(EngineeringInformationCo.)出版发行。

EI是工程技术领域内的一部综合性检索工具,报道内容包括:电类、自动控制类、动力、机械、仪表、材料科学、农业、生物工程、数理、医学、化工、食品、计算机、能源、地质、环境等学科。

ISTP是IndextoScientific&TechnicalProceedings的缩写,是美国科学情报研究所的网络数据库WebofScienceProceedings中两个数据库(ISTP和ISSHP)之一。

专门收录世界各种重要的自然科学及技术方面的会议,包括一般性会议、座谈会、研究会、讨论会、发表会等的会议文献,涉及学科基本与SCI相同。

3、二次文献二次文献又称二级次文献,它是文献检索工具,能比较全面、系统地反映某个学科、专业或专题在一定时空范围内的文献线索,是积累、报道和检索文献资料的有效手段.4、受控语言受控语言是一种规范化的人工语言,包括具有较强族性检索功能的分类语言和具有较强特性检索功能的主题语言。

信息检索考试题

信息检索考试题

信息检索考试题一、选择题1.以下电子数据库中,属于专业数据库的是:A. 北大法宝B. CNKIC. 豆瓣读书D. 百度百科2.信息检索是指:A. 查询图书馆的藏书B. 在互联网上进行搜索C. 分析和组织信息D. 对信息进行筛选和评估3.以下哪个不是信息检索的基本环节?A. 信息需求B. 信息获取C. 信息评估D. 信息广告4.以下哪个是信息检索系统的组成部分?A. 搜索引擎B. 网络浏览器C. 操作系统D. 打印机5.以下哪个是有效关键词的特征?A. 词频高B. 指代范围广C. 相关性强D. 排序靠前二、判断题1.信息检索只能通过关键词搜索,不能使用其他搜索策略。

( )2.在进行信息检索时,使用布尔运算可以更精确地筛选所需信息。

( )3.在信息检索过程中,对信息进行评估可以判断信息的可靠性和适用性。

( )4.特定领域的专业数据库比综合性搜索引擎提供的信息更有针对性。

( )5.通过信息检索,我们可以获取到所有网络上的信息,无论是否公开。

( )三、简答题1.请简要介绍一下常用的信息检索工具和平台。

2.什么是关键词,并举例说明如何选择关键词。

3.请列举几个常用的信息检索策略,并简要介绍其使用方法。

4.什么是信息评估,为什么在信息检索中需要进行信息评估?5.请简要介绍一下信息检索系统的基本原理。

四、论述题信息检索在当今社会中扮演着重要的角色,请你谈谈在哪些领域中信息检索的作用,并说明其作用的重要性。

注意事项:1. 回答问题时可以使用自己的语言表达,但需确保表达准确清晰。

2. 如有需要,可以适当扩充回答内容,但需保持内容的相关性和合理性。

3. 文章排版整洁美观,语句通顺,准确表达,不影响阅读体验。

信息检索考试题汇总(附答案)

信息检索考试题汇总(附答案)

一、单项选择题(从下列各题四个备选答案中选出一个正确答案,并将其代号写在答题纸相应位置处。

每题2分,共30分)1. _C_ 是题录型检索工具A. CABI B。

中国学术期刊文摘 C。

全国报刊索引(自然版) D。

经济纵横2。

浏览超星数字图书馆,应首先安装__D_____。

A. Apabi ReaderB. Adobe ReaderC. CAJ ViewerD. SSReader3. 世界上第一大联机检索系统是_A_。

A。

DIALOG系统 B.OBRIT系统 C.OCLC系统 D。

STN 系统4。

利用baidu搜索信息时,要将检索范围限制在网页标题中,应该使用的语法是___B_______。

A。

site: B.intitle: C. inurl: :5.国际农业和生物科学中心英文名称的简称为_A 。

A.CABI B。

AGRINDEX C. BA D.B of A6.信息检索根据检索对象不同,一般分为___C___________。

A。

二次检索、高级检索 B。

分类检索、主题检索C。

数据检索、事实检索、文献检索 D.计算机检索、手工检索7. 国际上评价期刊最有影响力的一个指标是 ___A_____。

A. 影响因子B.读者统计数据C.引文量 D。

价格8。

二次检索指的是:___C__________。

A.第二次检索 B.检索了一次之后,结果不满意,再检索一次C.在检索结果中运用“与、或、非”进行再限制检索 D.以上都不是9.国际连续出版物编号___A__________.A。

ISSN B。

OCLC C.ISBN D. CSSCI10.下列搜索引擎具有书名号检索功能的有______B________。

A.Google B.百度 C。

中搜 D。

AltaVista11.《中文核心期刊要目总览》2004 版的“农业经济”类核心期刊有_B__ 种。

A.20 B.19 C.17 D.1512.通过追溯检索获得的相关文献与原文献相比在发表时间上__B__。

信息检索复习题(综合最终)

信息检索复习题(综合最终)

信息检索复习题(综合最终)1、信息存储与检索:⼴义地说是“信息存储与检索”(Information Storage and Retrieval),它是指将信息按照⼀定的⽅式组织和存储起来,并能根据信息⽤户的需要找出其中相关信息的过程。

从本质上讲信息检索是⼀种有⽬的和组织化的信息存取活动,其中包括了“存”和“取”两个基本环节。

对于“存”来说,主要指⾯向来⾃各种渠道的⼤量或海量信息⽽进⾏的⾼度组织化的存储;对于“取”来说,则要求⾯向随机出现的各种⽤户信息需求所进⾏的⾼度选择性的查找。

2、⽂本检索:指以各种⾃然语⾔符号系统所表⽰的信息作为主要检索对象的信息检索活动。

3、数值(据)检索:主要是针对数值型数据的查询⽽发展起来的⼀类较有特⾊的信息检索。

4、⾳\视频检索:主要针对各种数字化⾳频与视频信息⽽进⾏查询的⼀类新兴的信息检索操作。

5、电⼦信息源:指以数字化形式(即⼆进制码)将⽂字、图像、声⾳、动画等存储在光、磁等存储介质(如CD-ROM、磁盘)上,并能通过计算机、通信设备再现出来的信息资源。

6、书⽬数据库:⼀种专门存储⼆次⽂献信息的数据集合,亦称⼆次⽂献数据库,通常收录有关主题领域的各种书⽬信息,包括⽂摘、题录、⽬录等,以向⽤户提供⽂献信息,指引⽤户查找、使⽤原始⽂献。

7、⽂献索引数据库:主要是简要地通报有关领域某⼀时期发表的⽂献,供⼈们查阅与检索。

它提供确切的⽂献来源信息,即能准确鉴别相对应的原始⽂献8、全⽂数据库:⼀种源数据库,主要存储⽂献全⽂或其中的主要部分,可以将包括题名、著者、摘要、关键词、正⽂、参考⽂献和著作⽇期在内的数据全部收⼊数据库,供⽤户查询利⽤。

9、⽹络信息资源:指以电⼦数据的形式将⽂本、图像、声⾳、动画等多种形式的信息存放在光磁等⾮印刷型载体的介质中,并通过⽹络通信、计算机或终端等⽅式再现出来的电⼦信息源。

10、集中式系统:是资源有空间上集中配置的系统,单机检索系统是典型的集中式系统,它将软件、数据和主要外部设备集中在⼀套计算机系统之中。

信息检索复习题答案

信息检索复习题答案

信息检索复习题答案一、选择题1. 信息检索系统的核心功能是什么?A. 数据存储B. 数据索引C. 数据检索D. 数据传输答案:C2. 布尔检索中,“AND”操作表示什么?A. 逻辑或B. 逻辑与C. 逻辑非D. 逻辑异或答案:B3. 以下哪个不是全文检索的特点?A. 快速检索B. 支持模糊查询C. 支持关键词搜索D. 只支持精确匹配答案:D4. 元数据在信息检索中的作用是什么?A. 提供检索结果B. 描述资源特征C. 存储原始数据D. 进行数据加密答案:B5. 信息检索中的“召回率”指的是什么?A. 检索到的相关文档数量B. 检索到的所有文档数量C. 检索到的相关文档与实际相关文档的比例D. 检索到的非相关文档与实际非相关文档的比例答案:C二、简答题1. 简述信息检索的基本流程。

答案:信息检索的基本流程包括用户需求分析、检索策略制定、检索执行、结果评估和反馈调整。

2. 什么是倒排索引,它在信息检索中的作用是什么?答案:倒排索引是一种索引方法,它将文档中出现的每个词与包含该词的文档列表相关联。

在信息检索中,倒排索引可以快速定位到包含特定关键词的文档,提高检索效率。

3. 描述信息检索中的相关性评价标准。

答案:信息检索中的相关性评价标准主要包括:相关性(文档与用户查询的匹配程度)、新颖性(文档内容的新颖程度)、权威性(文档来源的可信度)、及时性(文档的时效性)等。

三、论述题1. 论述信息检索技术在现代信息社会中的重要性。

答案:信息检索技术在现代信息社会中的重要性体现在以下几个方面:首先,它帮助用户快速准确地找到所需信息,提高工作效率;其次,它支持知识管理和学习,促进知识的传播和创新;再次,它为商业决策提供数据支持,增强企业的竞争力;最后,它促进了信息技术的发展,推动了社会的进步。

四、案例分析题1. 假设你是一名图书馆信息检索系统的管理员,如何优化检索系统以提高用户满意度?答案:作为图书馆信息检索系统的管理员,优化检索系统的方法包括:(1)定期更新索引,确保信息的时效性;(2)提供个性化推荐,根据用户的历史检索行为推荐相关资源;(3)优化用户界面,使其更加友好和易于使用;(4)增强系统的稳定性和安全性,保证用户数据的安全;(5)收集用户反馈,不断调整和改进检索算法。

信息检索考试复习题

信息检索考试复习题

信息检索1. 图书馆馆藏书籍是按中图法归到各库的。

2. 漏检率是指未检出的相关信息量与检索系统中实际与课题相关的信息总量的比率。

3. 信息检索根据检索对象不同,一般分为数据检索、事实检索、文献检索。

4. WebofScience是获取全球学术信息的重要数据库,其中包含SCIE、SSCI、A&HCI等子库。

5. 布尔逻辑检索中检索符号“OR”的主要作用是提高查全率。

6. 文献是记录有知识的一切载体。

7.广义的信息检索包含存储与检索两个过程。

8. 查找某一年的新闻、事件、数据和统计资料应该使用年鉴。

9.在参考文献格式中,[M]代表的是著作。

10. Internet起源于ARPAnet。

11. 使用分类语言对信息进行描述和标引,主要是可以把同一学科的信息集中在一起。

12. 正确检索“唐宋诗歌”的有关信息的检索式为:(TI=唐orTI=宋)andTI=诗歌13. 在中国期刊全文数据库(CNKI)中,不可以进行截词检索。

14. 超星数字图书馆可以检索数字图书,无法检索纸质的馆藏图书。

15.如果想查找“对用后均法进行数据处理的讨论”这个课题相关的文献,较好的检索词应该是:后均法,数据处理16. "信息能力"是指人类对信息需求的自我意识,是人类在信息活动中产生的认识、观念和需求的总和。

17.当一台计算机向另一台计算机发送文件时,按“数据、数据段、数据包、数据帧、比特”的过程描述数据包的转换步骤。

18.计算机资源共享主要是指计算机的硬件、软件和数据的共享。

19.错看了报纸的日期导致的错误判断是由于没有利用好信息的时效性。

20. EBSCO数据库中,输入检索词“Chin*”表示要求查出含有Chin词干后允许有任意多个字母变化的单词的文献。

21. 利用CNKI全文数据库检索张维迎的作品,应该选择的检索途径为:作者。

22.根据中图分类法,计算技术、计算机技术属于T 大类。

23. 按照顺序表述文献检索常用的五个步骤是:明确要求和分析课题,选择检索系统,确定检索途径和检索策略,实施检索以及调整检索策略,获取原文24. PQDD是学位论文数据库。

信息检索复习题目

信息检索复习题目

信息检索复习题目1、名词解释题数据(data):范指所有描述事物的形貌、特征、状态或任何其他属性的数字、文字或符号。

信息:物质存在的一种方式。

一般指数据、消息中包含的意义。

可以使消息中所描述的时间不定性减少。

二次文献:是将大量分散、零乱、无序的一次文献进行整理、浓缩、提炼,著录其吗,特征(著者、篇名、分类号、出处、文摘等),并按照一定的逻辑顺序和科学体系加以编排存储,使之系统化,以便于检索利用。

三次文献:是选用大量有关的文献信息,经过综合、分析、研究而编写出来的文献信息。

它通常是围绕某个专题,利用二次文献信息检索搜集大量相关文献,对其内容进行深度加工而成。

会议文献:是在学术或专业会议上交流的论文和会议资料编辑出版的信息。

信息检索:从信息集合中识别和获取所需信息的过程及其所采取的一系列方法和策略。

著录:就是把文献信息的各种内部、外部特征记录下来的过程,其结果就是形成一条目录信息。

科技报告:指国家政府部门或科研生产单位关于某项研究成果的总结报告,或是研究过程中的阶段进展报告网络信息资源:是指信息资源以电子数据的形式存放在非印刷型的介质中,并通过网络通信手段,在计算机等终端上再现的信息的总和。

搜索引擎:搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。

2、说出下列检索式的含义(1) 计算机AND制图:AND 代表与含义:检索包含计算机与制图的文档(2) Wom?n and liberation代表匹配任意字符含义:检索包含匹配wom?n 与 liberation 任意字符的文档(3) Comput** 代表通配符含义:检索包含comput后面为任意字符的文档(4) Orgarni?ation代表匹配任意字符含义:检索包含匹配Orgarni?ation任意字符的文档(5) (计算机NOT美国)AND出版发行NOT代表非 AND代表与含义:检索包含出版发行与计算机但不包含美国的文档(6) edit?代表匹配任意字符含义:检索包含匹配edit 任意字符的文档(6) (计算机OR电脑) AND土地管理OR代表或 AND代表与含义:检索包含土地管理与计算机或电脑的文档(7) Product?代表匹配任意字符含义:检索包含匹配Product任意字符的文档2、简答题1、检索文献及文献的三要素?答:信息的一种人工编码,通过人工、机械以及声、光、电、磁等各种技术段生成多种包含知识信息内容的符号,以一定的形态出现,形成各种媒体的文献类型。

信息检索各章节习题及总复习题

信息检索各章节习题及总复习题

一、单选题1、ISBN 978-7-302-20062-8是(D )。

A.强制标准文献的编号B.国际连续出版物标准刊号C.图书分类号D.国际标准书号2、一篇论文列出的参考文献如下:郑义.房屋建组外墙渗水成因与防治[J].科技资讯,2005(35):184—185.其中的(35):184—185应该是(A)。

A.35期184—185页B.35卷184—185期C.35卷184—185页D.35期184页185行3、下列选项中不属于特种文献类型的有(B )。

A.学位论文B.图书C.科技报告D.标准文献4、1、文献是记录有知识的(A)。

A. 载体B. 纸张C. 光盘D. 磁盘5、中国国家标准的代码是(A)A. GBB. CBC. ZGD. CG二、填空题1、情报的三个属性(知识性)、(传递性)、(效益性)。

2、填空题:文献按起加工深度不同,可以划分为(零次信息)、(一次信息)、(二次信息)、(三次信息)。

3、(核心期刊)是指少数刊载某一学科大量高质量专业论文的期刊。

三、判断题1、从文献检索的角度来看,一次文献是检索对象,二次文献是检索手段。

(1)2、在众多的信息源中,期刊是最重要的信息源。

(1)3、连续出版物主要包括期刊、报纸、年度出版物等。

(1)四、简答题1、常用的特种文献有哪些?答:科技报告、会议文献、政府出版物、专利文献、标准文献、公司产品资料、学位论文、档案资料等2、我国信息系统结构。

答:图书馆系统(高校图书馆、公共图书馆、科学研究系统图书馆)、科技信息服务系统、档案系统、专利系统、标准系统3、信息道德主要内容。

答:信息道德是指在信息领域中用以规范人们相互关系的思想观念与行为准则。

信息道德主要包括:1)遵守信息法律、法规,尊重知识产权,保护个人隐私;2)保守商业秘密,维护信息安全;3)不制作、传播和消费不良信息;4)不制作和传播病毒等有害的东西;5)不窃取和盗用非法的信息;6)不非法进入他人的系统;7)不利用信息能力进行计算机犯罪等。

信息检索考试题汇总附答案(供参考).docx

信息检索考试题汇总附答案(供参考).docx

文档来源为 :从网络收集整理.word 版本可编辑 .欢迎下载支持 .1. 专利文献根据发明创造的性质可以分为发明、实用新型和外 一、单项选择题 (从下列各题四个备选答案中选出一个正确答案, 观设计专利。

(√)并将其代号写在答题纸相应位置处。

每题 2 分,共 30 分)2. CNKI 检索系统可以检索博硕士论文。

( √ )C 1 . _ 是题录型检索工具3. Google 不具有学术搜索功能。

( × )A. CABIB. 中国学术期刊文摘C. 全国报刊索引(自然版)D. 经 ISBN ,新版国际标准书号 2007 年济纵横4. 国际标准书号的英文简称正式实施,国际标准书号由10位升至 13位。

( √ )D 2.浏览超星数字图书馆,应首先安装______.5. 检索效果的评价指标主要有查全率和漏检率。

( × )A. Apabi ReaderB. Adobe ReaderC. CAJ ViewerD. SSReaderA 3.世界上第一大联机检索系统是__。

1.NSTL 是(国家科技图书文献中心)的简称。

2. (信息检索系统)是指由一定的设备和信息集合构成,具有一 A.DIALOG 系统 B.OBRIT 系统 C.OCLC 系统 D.STN 系统B 4.定存储、检索与传送技术设备,提供一定的存贮与检索方法及检 利用 baidu 搜索信息时,要将检索范围限制在网页标题中,应该使用的语法是 _________。

索服务功能的工作系统。

3. 体系分类表通常由(类目表、标记符号、说明和注释、类目索A.site:B.intitle:C. inurl::引) 4 个部分组成。

A 5 .国际农业和生物科学中心英文名称的简称为_ 。

A.CABIB. AGRINDEXC. BAD.B of A4. 正式出版的中文期刊在检索工具和数据库中一般著录有国际标准刊号( ISSN )和国内统一刊号(CN )。

信息检索试题(有答案)

信息检索试题(有答案)

信息检索试题(有答案)第一篇:信息检索试题(有答案)1.检索系统:由大量的数据库集合生成的数据库。

2.自然语言:未经加工和规范化处理的非受控于言。

3.二次文献:对一次文献进行加工整理后的产物,即对无序的一次文献的外部特征如题名、作者、出处等进行著录,或将其内容压缩成简介、提要或文摘,并按照一定的学科或专业加以有序化而形成的文献形式,如目录、文摘杂志(包括简介式检索刊物)等4.主题词:是用于表述、存储、查找文献主题的受控词汇,是主题表中能表达一定意义的最基本的词汇单元。

5.科技报告:科技报告是研究单位向主管机构和资助单位提交的关于某项科技成果的正式报告或其进展阶段的实际记录。

一般依托于国家的军事和高科技科研项目,是科研工作成果的体现,需要经过专家评审鉴定,技术上可靠性较高。

6.体系分类语言:体系语言是以科学分类为基础,运用概念的划分与概括的逻辑方法,形成一个概念等级体系,按知识门类的逻辑次序,按照从总到分,从一般到具体,从低级到高级,从简单到复杂的原则进行概念的综分,层层划分,累累隶属,逐步展开而形成的一个等级体系。

1.当关键词具有多个含义的时容易造成误检,使得查准率较低。

2.信息素质的内涵包括信息意识、信息能力和信息道德。

3.主题词的体现形式是叙词表。

4.文献按其加工深度不同可分为零次文献,一次文献,二次文献和三次文献。

5.中国图书馆图书分类法简称为:中图法。

6.连续出版物的主要类型有期刊、报纸、年底出版物。

7.标准文献的主体是技术标准。

8.当计算机访问范围受到限制时,可通过代理服务器访问外部网络。

9.构成文献的三要素是载体、知识和记录手段。

10.布尔逻辑运算符包括: 逻辑“或”、逻辑“与”和逻辑“非”三种。

11.专利有三层含义:专利权、专利技术和专利文献。

12.文献的内容特征用于找出相关文献,外部特征用于获得特定文献。

13.信息检索常用的方法有:工具法、引文法和循环法。

KI的中文全称是 China National Knowledge Infrastructure。

信息检索总复习题参考答案

信息检索总复习题参考答案

信息检索总复习题参考答案一、单选题(共60题选30题,每题1分共30分)1.下列属于布尔逻辑算符的是(D)。

A、与B、或C、非D、以上都是2、信息素养的核心是(C).A、信息意识;B、信息知识;C、信息能力;D、信息道德3、20世纪70年代,联合国教科文组织提出:人类要向着( B )发展.A、终身学习;B、学习型社会;C、创新发展;D、信息素质4.参考文献的标准著录格式是( A )。

A、著者篇名来源出处;B、篇名著者来源出处5.请标出文献:马品仲. 大型天文望远镜研究. 中国的空间科学技术,1993,13(5)P6-14,ISSN1000-758X 属于哪种文献类型( C )。

A、图书;B、科技报告;C、期刊;D、报纸6.常用的检索系统有( D )。

A、目录检索系统B、文摘检索系统C、全文检索系统D、以上都是7、哪一种布尔逻辑运算符用于交叉概念或限定关系的组配?( A )。

A.逻辑与()B.逻辑或(OR)C.逻辑非(NOT)D.逻辑与和逻辑非8、根据国家相关标准,文献的定义是指“记录有关( C )的一切载体。

”A.情报B.信息. C.知识D.数据9、( D )是指通过文献信息资料的主题内容进行检索的途径。

A.题名检索途径B.作者检索途径C.分类检索途径D.主题检索途径10、搜索含有“data bank”的PDF文件,正确的检索式为:( A)A."data bank" filetype:pdf B.data and bank and pdf11、从文献的( B )角度区分,可将文献分为印刷型、电子型文献。

A.内容公开次数B.载体类型. C.出版类型D.公开程度12、按照出版时间的先后,应将各个级别的文献排列成( C)A.三次文献、二次文献、一次文献B.一次文献、三次文献、二次文献C.一次文献、二次文献、三次文献D.二次文献、三次文献、一次文献13、利用文献后面所附的参考文献进行检索的方法称为( A )。

信息检索考试题及答案知网

信息检索考试题及答案知网

信息检索考试题及答案知网一、单项选择题(每题2分,共20分)1. 信息检索中,以下哪个选项不是信息检索的基本类型?A. 倒排检索B. 正排检索C. 布尔检索D. 线性检索答案:D2. 信息检索系统中,以下哪个选项不是信息检索的基本原理?A. 相关性原理B. 概率性原理C. 一致性原理D. 模糊性原理答案:C3. 在信息检索中,以下哪个选项不是信息检索的常用技术?A. 关键词检索B. 短语检索C. 同义扩展检索D. 线性检索答案:D4. 信息检索中,以下哪个选项不是信息检索的常用策略?A. 扩展检索B. 限定检索C. 截词检索D. 随机检索答案:D5. 信息检索中,以下哪个选项不是信息检索的常用工具?A. 搜索引擎B. 数据库C. 书目索引D. 线性索引答案:D6. 在信息检索中,以下哪个选项不是信息检索的常用评价指标?A. 查全率B. 查准率C. 响应时间D. 线性指标答案:D7. 信息检索中,以下哪个选项不是信息检索的常用数据库?A. CNKIB. Web of ScienceC. PubMedD. 线性数据库答案:D8. 在信息检索中,以下哪个选项不是信息检索的常用搜索引擎?A. 百度B. 谷歌C. 必应D. 线性搜索引擎答案:D9. 信息检索中,以下哪个选项不是信息检索的常用方法?A. 布尔逻辑检索B. 模糊逻辑检索C. 语义检索D. 线性检索答案:D10. 在信息检索中,以下哪个选项不是信息检索的常用步骤?A. 需求分析B. 检索策略制定C. 检索结果评估D. 线性步骤答案:D二、多项选择题(每题3分,共15分)1. 信息检索中,以下哪些选项是信息检索的基本类型?A. 倒排检索B. 正排检索C. 布尔检索D. 线性检索答案:A、B、C2. 信息检索系统中,以下哪些选项是信息检索的基本原理?A. 相关性原理B. 概率性原理C. 一致性原理D. 模糊性原理答案:A、B、D3. 在信息检索中,以下哪些选项是信息检索的常用技术?A. 关键词检索B. 短语检索C. 同义扩展检索D. 线性检索答案:A、B、C4. 信息检索中,以下哪些选项是信息检索的常用策略?A. 扩展检索B. 限定检索C. 截词检索D. 随机检索答案:A、B、C5. 信息检索中,以下哪些选项是信息检索的常用工具?A. 搜索引擎B. 数据库C. 书目索引D. 线性索引答案:A、B、C三、判断题(每题1分,共10分)1. 信息检索中,倒排检索是一种基于关键词的检索方式。

信息检索试题

信息检索试题

信息检索试题第一篇:信息检索试题信息检索试题单项选择题:1、以下各项属于二次信息的是(A)A、索引B、期刊C、学位论文D、百科全书2、下列文献中属于一次信息的是(A)A、专利说明书B、百科全书C、目录D、综述3、年鉴属于下列哪一类别(D)A、零次信息B、一次信息C、二次信息D、三次信息4、(C)是出版周期最短的定期连续出版物。

A、图书B、期刊C、报纸D、学位论文5、为了有效地存储和传播知识,人类利用各种(C)来记录信息。

A、知识B、文献C、载体D、视听资料6、报道范围主要为能源方面的科技报告为(D)。

A、ADB、PBC、NASAD、DOE7、了解各个国家政治、经济、科技发展政策的重要信息源是(B)A、科技报告B、政府出版物C、标准文献D、档案文献8、利用截词技术检索“?英语考试”,以下检索结果正确的是(D)A、英语四级考试B、英语考试成绩C、英语考试报名D、六级英语考试9、我国最早的分类法是(B)A、《中经新簿》B、《七略》C、《四库全书总目》D、《隋书经籍志》10、《四级英语阅读与完型填空》这本图书的分类号是(D)。

A、G636.33B、G216.2C、I247.4D、H31911、按照《中国图书馆分类法》,《新编六级英语阅读解析》这本书应属于哪个类目(A)。

A、H大类B、I大类C、T大类D、O大类12、《信息检索》这本书的分类号为G252.7,这是按照(B)分类。

A、科图法B、中图法C、杜威分类法D、刘国钧分类法13、布尔逻辑表达式:在职人员NOT(中年AND教师)的检索结果是(A)A、检索出除了中年教师以外的在职人员的数据B、中年教师的数据C、中年和教师的数据D、在职人员的数据14、布尔逻辑检索中检索符号“OR”的主要作用在于()。

A、提高查准率B、提高查全率C、排除不必要信息D、减少文献输出量15、利用百度搜索引擎检索,逻辑算符“或”的关系用(A)来表示A、+B、-C、|D、*16、在Google中检索短语或词组,可以使用(D)进行检索A、+B、-C、ORD、“”17、根据国家相关标准,文献的定义是指“记录有(C)的一切载体”。

信息检索复习题

信息检索复习题

信息检索复习题1.检索技术布尔逻辑检索三种运算符:逻辑“与”(用AND或“*”表示),可以缩小检索范围;逻辑“或”(用OR或“+”表示),可以扩大检索范围;逻辑“非”(用NOT或“—”表示),可以缩小检索范围。

(1)布尔逻辑表达式:在职人员NOT(青年AND教师)的检索结果是( A )。

A.检索出除了青年教师以外的在职人员的数据B.青年教师的数据C.青年教师和在职人员的数据D.在职人员的数据(2)检索“唐宋诗歌”的有关信息,正确的检索表达式是( A )。

A.(唐OR宋)AND诗歌 B.唐AND宋AND诗歌C. 唐OR宋OR诗歌D. 唐AND宋OR诗歌(3)为了提高查全率,往往通过采用( B )。

A.提高检索词的专指度 B.多用截词符 C.增加使用逻辑“与” D.减少逻辑“或”写出检索表达式:(1)检索钱伟长在清华大学时发表的文章;作者=钱伟长and单位=清华大学;(2)检索钱伟长在清华大学时发表的题名或摘要中包含"物理"的文章。

作者=钱伟长and单位=清华大学and(题名=物理or摘要=物理)。

⏹位置检索掌握DIALOG检索系统的位置算符的用法意义。

(1)对end(w)laster哪个执行结果是正确的( B )。

A.end AND laster B.end laster ster end ster AND end(2)美国DIALOG检索系统的位置算符中,( C )表示其两侧的检索词必须是在文献记录的同一个字段中,而它们在该字段中的相对次序和相对位置的距离不限。

A.(S) B.(W) C.(F) D.(N)⏹截词检索:掌握几种截词方式。

截词符具有“OR”运算符的功能,能够扩大检索范围。

⏹字段检索基本索引字段:篇名、文摘、叙词、自由标引词四个字段。

辅助索引字段:除基本索引字段以外的所有字段。

(1)下列字段属于基本索引字段的是( C )。

A.著者字段 B.文献类型字段 C.文摘字段 D.语种字段⏹常用的检索方法有:工具法、追溯法和循环法。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1、信息存储与检索:广义地说是“信息存储与检索”(Information Storage and Retrieval),它是指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要找出其中相关信息的过程。

从本质上讲信息检索是一种有目的和组织化的信息存取活动,其中包括了“存”和“取”两个基本环节。

对于“存”来说,主要指面向来自各种渠道的大量或海量信息而进行的高度组织化的存储;对于“取”来说,则要求面向随机出现的各种用户信息需求所进行的高度选择性的查找。

2、文本检索:指以各种自然语言符号系统所表示的信息作为主要检索对象的信息检索活动。

3、数值(据)检索:主要是针对数值型数据的查询而发展起来的一类较有特色的信息检索。

4、音\视频检索:主要针对各种数字化音频与视频信息而进行查询的一类新兴的信息检索操作。

5、电子信息源:指以数字化形式(即二进制码)将文字、图像、声音、动画等存储在光、磁等存储介质(如CD-ROM、磁盘)上,并能通过计算机、通信设备再现出来的信息资源。

6、书目数据库:一种专门存储二次文献信息的数据集合,亦称二次文献数据库,通常收录有关主题领域的各种书目信息,包括文摘、题录、目录等,以向用户提供文献信息,指引用户查找、使用原始文献。

7、文献索引数据库:主要是简要地通报有关领域某一时期发表的文献,供人们查阅与检索。

它提供确切的文献来源信息,即能准确鉴别相对应的原始文献8、全文数据库:一种源数据库,主要存储文献全文或其中的主要部分,可以将包括题名、著者、摘要、关键词、正文、参考文献和著作日期在内的数据全部收入数据库,供用户查询利用。

9、网络信息资源:指以电子数据的形式将文本、图像、声音、动画等多种形式的信息存放在光磁等非印刷型载体的介质中,并通过网络通信、计算机或终端等方式再现出来的电子信息源。

10、集中式系统:是资源有空间上集中配置的系统,单机检索系统是典型的集中式系统,它将软件、数据和主要外部设备集中在一套计算机系统之中。

11、分布式检索系统:是指通过计算机网络把分布在不同地点的计算机硬件、软件、数据库等设备和资源联系在一起,以服务于一个共同的系统目标而是实现的相互通信、相互操作和资源共享的系统。

12、用户界面:是用户与计算机之间的通信媒体或手段,是人机双向信息交换的软件和硬件。

13、搜索引擎:广义的搜索引擎泛指网络(尤其是万维网)上提供信息检索服务的工具或系统。

狭义的搜索引擎主要指利用网络自动搜索软件或人工方式,对万维网信息资源进行采集分析与标引,并将索引信息组织成数据库,以网站形式为网络用户提供检索服务的一类信息服务系统。

14、收录范围:是指检索系统的数据库所覆盖的学科面、所收录的文献类型和数量,它现在已经演化成网站或搜索引擎的规模。

15、响应时间:是指从提问接收到检索结果提供所消耗的时间。

16、用户负担:是指用户在检索过程中花费的精力的总和。

17、输出形式:是检索系统提供的检索结果的形式,可能是书目信息,也可能是全文信息等。

18、相关性(评价核心):主要是指检索系统针对用户的信息需求从文档集合中检出的文档与用户需求之间的一种匹配关系。

问答题目:1、什么是信息检索?它有哪些主要类型?所谓“信息检索”,广义地说是“信息存储与检索”,它是指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要找出其中相关信息的过程。

从本质上讲信息检索是一种有目的和组织化的信息存取活动,其中包括了“存”和“取”两个基本环节。

对于“存”来说,主要指面向来自各种渠道的大量或海量信息而进行的高度组织化的存储;对于“取”来说,则要求面向随机出现的各种用户信息需求所进行的高度选择性的查找。

狭义理解是主要关注如何从存储的信息集合中快速获取各种需要的信息。

信息检索的主要类型早期分类方法:文献检索、事实检索、数据检索三种类型文献检索是指以文献(包括文摘、题录或全文)为检索对象的一类信息查询活动。

事实检索主要针对从文献中提取出来的各种事实(或知识项)所进行的检索活动。

数据检索主要以经过选择、整理、鉴定的各种数据信息,例如人口、国民生产总值、建筑材料的各种性能参数等作为检索对象的一类检索操作。

新分类方法:文本检索、数值检索以及音/视频检索文本检索:是指以各种自然语言符号系统所表示的信息作为主要检索对象的信息检索活动。

数值检索:主要是针对数值型数据的查询而发展起来的一类较有特色的信息检索。

音/视频检索:是主要针对各种数字化音频与视频信息而进行查询的一类新兴的信息检索操作。

2、试分析阐述信息检索的基本原理。

信息检索的基本原理抽象概括为一句话,即对信息集合与需求集合的匹配与选择。

●信息集合是指有关某一领域的,经采集、加工的信息集合体。

信息集合是一种公共知识结构,有可能弥补某个特定用户的知识结构缺陷,即可以向用户提供所需要的知识或信息,或是获取知识的线索,或是提供某种信息去激活人脑中存储的知识。

●用户的信息需求是在社会实践活动中产生的。

众多用户不同形态的信息需求的汇集,就形成了需求集合的存在,信息需求的产生与满足,是实施信息检索行为的前提与基础,也是实施信息检索行为的目的所在。

●信息检索提供一种“匹配”机制,主要功能在于能够把需求集合与信息集合依据某种相似性标准进行比较与判断,进而选择出符合用户需要的信息。

要求匹配机制至少包裹两个要素:第一是匹配标准,即相似性标准;第二是执行匹配的动因。

3、如何鉴别高质量期刊?国内外公认的鉴别方式有二:核心期刊和同行评审期刊。

●核心期刊是指刊载某一学科或专业有关的信息较多,且学术水平较高,能够反映该学科最新成果和前沿动态,受到该专业读者特别关注并成为检索与阅读首选的那些期刊。

核心期刊的确定一般运用文献计量学的方法,通过对期刊和刊载论文的一些计量指标的统计和分析来确定。

●同行评审期刊是国外高水平期刊对来稿评审普遍采取的方式。

具体做法是:作者将文稿寄交编辑部并经初审合格后,为了审查论文的学术质量需将论文稿送交有关专家(即同行)进行审阅。

所选专家来自不同的机构,他们一般对该刊物比较了解,而且有相当高的专业背景和造诣,大多都有投稿的经历或本身就是高产作者。

同行评审的主要目的是对稿件的质量进行控制,确保提交的论文是可读的、可信的和有意义的。

因此,人们普遍认为同行评审期刊的学术水平高于一般期刊。

4、我国出版的专利文献有哪些?目前我国出版的专利文献主要包括专利说明书、专利公报以及专利索引等,既有一次文献,也有二次文献。

它们是:(1)《发明专利公报》、《实用新型专利公报》和《外观设计专利公报》;(2)《发明专利申请公开说明书》、《发明专利说明书》、《实用新型专利说明书》;(3)专利年度索引5、书目数据库的特征。

(1)书目数据库中的数据来源于期刊论文、会议论文、研究报告、专利文献、学位论文、图书、政府出版物等各种不同的一次文献,是经过加工、提炼过的数据,因此其信息密度高,文献报道范围广,数据量大,连续性和积累性强。

(2)书目数据库的数据结构比较简单,记录格式较为固定。

(3)书目数据库的生产者多为学术机构、政府机构、图书馆信息服务机构等非赢利性组织,书目数据库的开放性比较好,使用上没有太多限制。

(4)相对于手工检索工具来说,书目数据库还具有检索途径多、速度快的特点。

但相对于网络信息资源而言,书目数据库的更新周期比较长。

6、全文数据库的特点?与其他数据库或信息源(尤其是书目数据库)相经,全文数据库有许多优点,主要表现在以下几方面:(1)可直接利用。

用户检索全文数据库得到的结果是原始文献的全文信息,而不像书目数据库那样得到的是文摘或书目之类的二次文献,从而省去了通过二次文献去查找一次文献的环节。

因而,全文数据库又称为自足性数据库。

(2)简化数据标引和建库工作。

绝大多数全文数据库采取自然语言的计算机自动标引技术,节省了大量的人力、物力和财力。

此外,全文库的建立还可以省去许多用户并不产心的著录项目,比如出版介质、出版单位、印刷单位、价格等等,这些信息对用户的检索意义不大,但是却在书目数据库的创建中占用了信息加工人员的大量精力。

(3)避免了文献二次加工中人为的差错。

由于全文数据库包括了二次文献和参考文献在内的几乎所有数据,而这些数据均出自原文,从而避免了文献二次加工可能出现的差错。

(4)后处理能力强。

由于全文数据库收录的是全文信息,且数据库的容量都比较大,容易产生检索结果中包含一些不相关的信息,因此,全文检索系统一般会对实施检索所得到的检索结果进行各种优化,诸如检索结果的聚类、图形图像的处理、信息过滤、反馈机制的使用等。

通过增强检索系统的后处理能力,可以进一步满足用衣个性化检索需求。

(5)信息量非常大,对检索技术的要求很高7、一个通用信息检索系统的基本结构如何?它主要有哪些功能模块构成?✓信息检索系统的物理层面以及逻辑层面✓物理构成角度看,计算机化信息检索系统是指由系统的硬件、软件、数据资源等构成的一个实体系统。

分为硬件部分、软件部分以及数据资源。

物理空间的分布情况看,又可分为集中式和分布式检索系统。

✓信息检索系统的逻辑结构主要是指它所包括的功能模块(或子系统)及其相互关系。

一个通用的计算机化信息检索系统,通常应该具有“信息存储”和“信息查询”两大基本功能。

✓功能模块:✓(1)信息采集子系统;✓(2)信息标引处理子系统;✓(3)创建/更新数据库及索引文档子系统;✓(4)用户界面子系统;✓(5)检索匹配子系统;✓(6)知识组织工具子系统。

8、什么是标引深度和标引的专指度?●标引深度又称“网罗度”,是衡量标引详尽性的指标,其含义是标引词对数据库每条记录各方面内容表达和识别的详尽程度。

●专指度用于衡量标引词对信息记录特定内容描述的精细程度。

网罗度越高,越有利于提高检索的查全率;专指度越高,则越有利于提高检索的查准率。

9、什么是自动标引?自动标引处理的基本流程如何?自动标引中自动抽词标引和自动赋词标引自动标引:通过利用计算机对标引特征的出现频率、出现位置、提问频率等进行统计,进而采用一定的加权策略来实现。

在自动标引的处理过程中,标引词的来源和选取方式各有不同,据此可以把自动标引区分为自动抽词标引和自动赋词标引两种类型。

自动抽词标引是指利用计算机直接从文献的题名、文献或正文中抽取关键词来标识文献内容,并自动生成关键词索引文档(或倒排档);而自动赋词标引则是让计算机模仿标引员的赋词标引方式,通过分析文献内容,从词表中选取与文献主题相符或密切相关的词语符号做索引词。

基本流程如下:从“待标引机读文本”开始到“索引文档生成”结束的,描述了自动抽词标引的基本处理过程,而涉及到“概念转换”和“规范词汇”环节,表达了实现自动赋词标引需要额外增加的两项重要处理要求。

见P44图10、何谓文档?在数据库中,文档结构有哪些类型?文档是按一定结构组织的若干逻辑记录构成的信息集合。

相关文档
最新文档