信息检索期末复习
信息检索期末复习材料

信息检索第一章信息检索基础1、信息的含义:广义的信息指自然界和一切人类活动所传达出来的信号和消息,是事物表现得一种普遍形式。
狭义的信息指经过搜集、记录、处理和存储的可供检索的文献、数据和事实2、一次文献:指作者以本人的研究成果为基本素材而创作或撰写的文献。
(著作、报纸、期刊、会议资料、研究报告、政府出版物、专利说明书、产品样本、标准文献、学位论文等)二次文献:指对一次文献进行加工、提炼和压缩后所得到的报道性产物。
检索工具书和网上引擎是典型的二次文献。
(目录、题录、索引、文摘)三次文献:是指对有关的一次文献和二次文献进行广泛深入的分析研究综合概括而成的具体知识、数据。
如综述、百科全书、辞典等。
3、信息检索的含义:从大量的信息集合中找出所需信息的过程与方法。
广义:包含信息储存和检索两部分狭义:信息检索4、信息检索的原理:将特定的信息需求与存储在检索系统中的信息标识进行异同的比较与匹配5、信息检索的意义:①信息检索是有效利用信息资源、实现其最大价值的科学方法②信息检索是再学习的工具、是获取知识的有效途径③信息检索能有效地提高科研工作的效率、节省人力物力及时间6、信息检索的历程:手工检索、计算机检索7、信息检索的方法:直接浏览法、常用法(顺查法、倒查法、抽查法)、追溯法、综合法查全率和查准率的关系、局限性1)查全率=[检出的相关文献信息量/检索系统中相关文献信息总量]×100%=[a/(a+c)]×100%2)查准率=[检出的相关文献信息量/检出文献信息总量]×100%=[a/(a+b)]×100%3)查全率与查准率的局限性:①对文献相关性的判断不可避免的带有主观性和模糊性②全部相关文献的总量很难确定③“相关文献”总是被同等对待,实际上其相关程度是有区别的9、影响检索效果的因素:①标引上网质量②检索语言的性能③检索途径的数量④检索策略的优劣⑤检索人员的素质第二章检索语言1、检索语言的定义:广义的检索语言泛指信息检索过程中涉及的人工语言和自然语言。
信息检索与利用期末复习题

《信息检索与利用》期末复习题一.名词解释1.二次文献2.信息检索3.馆藏书目数据库4.文献传递5.检索策略6. CALIS二.填空1. 知识以()、()、()的形式加以传播。
2. 按照检索对象不同,信息检索一般包括()、()、()三种类型。
3. 你认为比较重要的三个搜索引擎是()、()、()。
4. 检索性工具书属于()次文献,参考性工具书属于()次文献。
5.图书馆OPAC检索系统除了能满足馆藏书刊查询,还具有()、()、()和()等一系列功能。
三.选择题1.逻辑“与”算符是用来组配()。
A 不同检索概念,用于扩大检索范围B 相近检索概念,扩大检索范围C 不同检索概念,用于缩小检索范围D 相近检索概念,缩小检索范围2.如果检索结果过少,查全率很低,需要调整检索范围,此时调整检索策略的方法有( )等。
A.用逻辑“与”或者逻辑“非”增加限制概念B.用逻辑“或”或截词增加同族概念C.用字段算符或年份增加辅助限制D.用“在结果中检索”增加限制条件3.欲系统了解某一学科的基本情况,除了专著及教科书以外,还可利用()。
A.年鉴B.期刊论文C.科技报告D.百科全书4.图书馆的OPA C数据库是()型检索系统‘A.文摘B.题录C.目录D.全文5.《中国学术期刊全文数据库》的原文格式有( )。
A.pdf B.txtC.jPg D.caJ四.判断题1.查全率是指检索出的符合课题需要的文献与检索出的相关文献量之比。
( )2.疾病的诊断和治疗方法可以申请专利。
( )3.构成检索策略就是运用计算机情报检索系统可以接受的方法,选择适当的检索词,并将它们通过布尔逻辑算符、位置算符等算符组织起来,表达课题检索要求的过程。
( )4.事实与数据检索是指从有关参考型工具或者数据库中查找事实和数据问题答案的过程。
()5.已知文献的书目信息获取原文的首要步骤是判断文献的出版类型。
( )五.简答题1.常用的检索中外文期刊论文的数据库有哪些?常用的检索中文图书的数据库有哪些?2.如何制定检索策略?3.信息检索的意义和作用是什么?4.文献检索途径中,根据内容特征检索的途径有哪些?六.论述题1.文献检索的程序有哪些?2.请联系自己的实际,谈谈学习《信息检索与利用》课的体会。
《信息检索》期末考试试题库

提示:期末考试题库内容一、填空1.在许多数据库中,都有“二次检索”功能,“二次检索”指:在前一次检索基础上再检索。
2.在google搜索引擎检索关键词为短语DA TA OUTPUT,将检索短语写成“DA TAOUTPUT”。
3.清华同方数据库默认的检索方式是多库检索。
4.数据库的类型:网络数据库、联机数据库和光盘数据库。
5.描述信息内容特征的检索语言包括分类语言和主题语言,主题语言又可分为关键词语言、单元词语言、标题词语言和叙词语言。
6.检索工具有多种索引,可以提供多种检索途径,一般来讲,检索途径可以分为以下四种:分类途径、主题途径、著者途径和其他途径。
7.按信息的存储媒体和技术手段来分,检索的手段有两种:手工检索和计算机检索。
8.信息检索常用的方法有:工具法、引文追溯法和循环法。
9.专利有三层含义新颖性、创造性和实用性。
10.标准文献的主体是标准。
11.期刊论文的文献出处包括期刊名称、年卷期和起止页码。
12.文件ABC.001.TXT的后缀名是TXT 。
文件类型是文本文件。
13.多数网页采用HTML编写,这里的HTML指的是:超文本标识语言。
14.按文献的相对利用率来划分,可以把文献分为核心文献、相关文献、边缘文献。
15.检索工具具有两个方面的职能:存储职能、检索职能。
16.将文献作者的姓名按字顺排列编制而成的索引称为:作者索引。
17.利用原始文献所附的参考文献,追踪查找参考文献的原文的检索方法称为追溯法,又称为引文法。
18.当检索关键词具有多个同义词和近义词时,容易造成漏检,使得查全率较低。
19.手稿、私人笔记等属于零次文献,辞典、手册等属于三次_文献。
20.狭义的信息检索就是指信息的_检索____过程。
21.按照检索对象的不同,信息检索可分为数据检索、事实检索和文献检索。
22.按信息检索的技术划分,信息检索有(全文本检索)、(多媒体检索)、超文本信息检索、(超媒体信息检索)。
按信息检索的手段划分,可分为(手工信息检索)、(计算机信息检索)。
(完整版)信息检索期末复习题及答案

《信息检索》期末复习题及答案(仅供参考)一、判断题1.综述和百科全书属于二次文献。
(× )2.从文献检索的角度来看,一次文献是检索对象,二次文献是检索手段。
(× )3.题录、目录属于一次文献;期刊论文属于二次文献。
(× )4.主题词规范化的目的是扩大检索范围。
(√)5.在众多的信息源中,期刊是最重要的信息源。
(√ )6.核心期刊是指经常使用的期刊。
(× )7.关键词和主题词都是表征文献实质性内容的词汇,前者是经过词表规范的,后者是未经词表规范的自由词。
(×)8.《中国图书分类法》(简称《中图法》)是由分类号(代码)和类名来揭示信息的主题概念。
(×)9.题录型的检索工具,其著录项目包括题目、作者、文献出处、文摘。
()10.一项发明创造要获得专利权必须具备新颖性、创造性和实用性。
()二、选择题1、广义的信息检索包含两个过程( B )A、检索与利用B、存储与检索C、存储与利用D、检索与报道2、文献是记录有知识的()。
A、载体B、纸张C、光盘D、磁盘3、下列哪种文献属于一次文献( A )。
A、期刊论文B、百科全书C、综述D、文摘4、下列哪种文献属于二次文献( D )。
A、专利文献B、学位论文C、会议文献D、目录5、下列哪种文献属于三次文献( C )。
A、标准文献B、学位论文C、综述D、文摘6、下列选项中属于连续出版物类型的选项有(C )。
A、人民日报B、学位论文C、科技期刊D、会议文献7、下列选项中属于特种文献类型的有( D )。
A、学位论文B、图书C、科技期刊D、标准文献8、纸质信息源的载体是()A、光盘B、缩微平片C、感光材料D、纸张9、《中国图书分类法》(简称《中图法》)将图书分成( A )A、5大部分22个大类B、5大部分26个大类C、6大部分22个大类D、6大部分26个大类10、《中国图书分类法》(简称《中图法》)是我国常用的分类法,要检索农业方面的图书,需要在( A )类目下查找。
信息检索复习资料(有答案版)

1.请说明一次文献、二次文献和三次文献的特点和功用。
(1)一次文献(Primary Document):通常是指原始制作,即作者以本人的研究成果为基本素材而创作(或撰写)的文献。
如期刊论文、科技报告、会议论文、专利说明书(2)二次文献(Secondary Document):是指文献情报工作者对一次文献进行加工整理后所得到的产物,也是为了便于管理和利用一次文献,由文献情报工作人员编辑、出版和积累起来的工具性的文献。
二次文献的重要性在于可以帮助人们查找一次文献。
如目录、题录、文摘、索引、各种书目数据库(3)三次文献(Tertiary Document):是指利用二次文献,选用一次文献内容,经综合,分析和评述后形成的指南性文献。
包括综述研究和参考工具两类。
如综述、述评、词典、百科全书、年鉴、指南数据库、书目之书目2.请说明题录目录文摘的特点以及区别(1)题录是揭示和报导单篇文献外表特征的工具。
特点:以单篇文献为著录对象(2)目录是系统积累和提供图书、期刊和其它单行本的名称、收藏单位和索取号等外表特征的揭示和报导的工具。
特点:以单位出版物为著录对象,反映馆藏情况,主要揭示文献外部特征(3)文摘是以精练的语言把文献信息的重要内容、学术观点、数据及结构准确地摘录下来,并按一定的著录规则与排列方式编排起来,供读者查阅使用的一种检索工具。
特点:带摘要的题录3. 布拉德伏特文献文献分散定律和期刊影响因子的概念(1)布拉德福文献分散定律:本专业文献的1/3刊登在本专业核心期刊上,另外的2/3则分散在其他的相关期刊和边缘期刊上。
如果将科技期刊按其刊载某专业论文数量多寡,以递减顺序排列,则可分出一个核心区和相继的几个领域,每区刊载的论文量相等,此时核心期刊和相继区域期刊数量成1:n:n2......的关系。
(2)期刊影响因子的概念是:某一种期刊在第三年得到的前两年的引文数与该刊前两年的总论文数之比。
4. 请阐述信息、知识、情报的概念,并分析它们三者之间的关系。
信息技术检索期末重点复习

信息技术检索期末重点复习第一章导论1. 了解信息检索的相关研究领域,以及信息检索的应用;答:领域:数据管理,图书馆和信息科学,人工智能,自然语言处理,机器学习,软件工程计算机系统。
应用:自然语言处理,分布式计算,数据库,数据挖掘,情报学,社会学。
2. 了解相关性的定义、相关性判定的特点;答:定义:信息检索系统针对用户的查询(query)从文档集中检出的文档与查询之间的一种匹配关系。
判定特点:(1)客观性(2)及时性(3)可靠性(4)能否满足客户要求。
3. 理解齐普夫定律的内容,以及齐普夫定律在信息检索中的应用。
了解齐普夫定律在网络现象中的验证。
(结合第七章)答:定律:如果有一个包含n个词的文章,将这些词按其出现的频次递减地排序,那么序号r和其出现的频次f之积fr,将近似地为一个常数。
(齐普夫定律的理论基础是最省力法则)在信息管理中的应用:(1)最佳地理位置选择,使得使用者能以最省力的途径方便到达。
(2)设计图书馆、信息中心资料库的排架。
齐普夫定律应用:(1)文献自动标引(2)主题词频分析适用性:对于出现频率特别高特别低的词不能表现其分布规律。
在网络现象中的应用:(1)对网页中入度/出度数量的影响(2)对网页的长度有影响(3)对网页的点击率4. 掌握倒排文档的原理,以及在信息检索中的应用。
答:原理:将文档打散,然后找出关键词,经过还原、去重等词处理建立索引,存储这些单词在一个文档或者一组文档中的存储位置。
应用:当文章数目很大时,通过倒排文档方式建立索引可以大大节省检索时间。
5. 掌握IR系统的基本结构,了解各个关键部分的作用。
答:第一章PPT136. 理解关键词检索存在的问题及原因。
答:问题:(1)不能检索有同义词的相关文档(2)可能会检索出有歧义词的不相关文档。
原因:(1)检索出了基本的内容,但我们想要知道的更多更全(2)我们想要知道更多关于近期发展的信息(3)我们想要获得一个有效的基本的信息系统,而关键词检索做不到(4)我们更关注基本能力和算法比较系统的结果,而不是像工业模型那样允许缩放的系统数据。
《信息检索与应用》总复习题

《信息检索》期末复习一、单项选择题1、文摘、题录、目录等属于(B )。
A、一次文献B、二次文献C、零次文献D、三次文献2、从文献的(B )角度区分,可将文献分为印刷型、电子型文献。
A、内容公开次数 B 载体类型 C 出版类型 D 公开程度3、按照出版时间的先后,应将各个级别的文献排列成(C )。
A、三次文献、二次文献、一次文献B、一次文献、三次文献、二次文献C、一次文献、二次文献、三次文献D、二次文献、三次文献、一次文献4、手稿、私人笔记等属于(C )文献,辞典、手册等属于(C )文献。
A、一次,三次 B 零次、二次C、零次、三次 D 一次、二次5、逻辑“与”算符是用来组配(C)。
A、不同检索概念,用于扩大检索范围。
B、相近检索概念,扩大检索范围。
C、不同检索概念,用于缩小检索范围。
D.相近检索概念,缩小检索范围。
6、利用文献后面所附的参考文献进行检索的方法称为(A)A、追溯法B、直接法C、抽查法D 综合法7、如果检索结果过少,查全率很低,需要调整检索范围,此时调整检索策略的方法有(B )等。
A、用逻辑“与”或者逻辑“非”增加限制概念。
B.用逻辑”或“或截词增加同族概念。
C、用字段算符或年份增加辅助限制。
D、用”在结果中检索“增加限制条件。
8、根据国家相关标准,文献的定义是指“记录有关(C)的一切载体。
A、情报 B 、信息C、知识D、数据9、以作者本人取得的成果为依据而创作的论文、报告等,并经公开发表或出版的各种文献,称为(B )A、零次文献B、一次文献C、二次文献D、三次文献10、哪一种布尔逻辑运算符用于交叉概念或限定关系的组配?(A )A、逻辑与(AND)B、逻辑或(OR)C、逻辑非(NOT)D、逻辑与和逻辑非11、逻辑算符包括(D)算符。
A、逻辑“与”B、逻辑“或”C、逻辑“非”D、A、B和C12、事实检索包含检索课题(A )等内容。
A、背景知识、事件过程、人物机构B、相关文献、人物机构、统治数据C、事件过程、国外文献、国内文献D、国内文献、国外文献、统计数据13、区别于一般期刊论文或者教科书,参考工具书的突出特点是(C )。
信息检索课期末复习题

信息检索课期末复习题第一篇:信息检索课期末复习题信息检索课期末复习题第1章绪论1.信息素质的概念。
(P2)2.信息素质的四要素分别是什么?(P3)第3章信息与信息资源1.信息的含义。
(P33)2.信息的特征。
(P3-34)3.文献的概念。
(P35)4.文献信息资源的分类方法:按载体形式划分、按出版类型划分、按加工层次划分。
其中重点理解一次文献、二次文献、三次文献是什么。
第4章信息检索基础1.印刷型信息检索系统的类型及格式(P47)2.计算机信息检索系统的构成。
(P48)3.检索效果的评价指标中查全率和查准率是如何计算的?它们之间是什么关系?(P52)如何提高查全率(P60)?如何提高查准率?(P60)4.认真学习4.2信息检索的基本步骤这一节的内容,能够知道面对一个具体的检索课题需要设计经过怎样的检索流程?(P53-P61)5.检索点是什么?反应文献信息内容特征的检索点有哪些?反应文献外表特征的检索点有哪些?分类和主题检索点又有什么特点?6.看图表了解中图法是如何具体分类的?7.在计算机检索系统中的基本检索算符有哪些?(P71)重点掌握逻辑算符、字段限制算符、短语检索的表示方法,能够根据检索意图编制相应的检索式。
第5章国内学术信息资源检索结合实习作业复习本部分的内容1.广工图书馆网站上查找电子图书的数据库有哪些?KI、万方和维普分别可以查询哪些类型的文献?(期刊论文、会议论文、学位论文、专利文献、标准文献等)3.专利这个词有哪三层含义?(P109)4.中国专利有哪几种类型?保护时间分别多长?怎样从专利号中辨别不同类型的专利?5.授予专利权的条件是什么?6.专利有哪三种审查制度?我国的专利分别采用哪种审查制度?7.知道检索全世界专利文献的共同方法是利用国家专利分类表,了解国际专利分类号的组成。
(P113)8.结合实习,了解可通过哪些数据库或网站获取专利文献或标准文献?9.我国标准化法把标准分为哪四级?认识国家标准编号的组成。
信息检索课期末考试试题库(复习题)

信息检索课期末考试试题库(复习题)一、单项选择题在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。
错选、多选或未选均无分。
知识是指人类对客观世界的认识。
知识可分为(C)A.有用知识和无用知识B.基础知识和高级知识C.感性知识和理性知识D.理论知识和实践知识文献按载体形式可分为:印刷型、缩微型、声像型和(D)A.甲骨型B金石型C.电脑型D.机读型信息检索系统的功能为:报道文献信息、存储文献信息和(B)A.揭示文献信息B.检索文献信息C.宣传文献信息D.介绍文献信息检索系统的结构由几个部分组成:编辑使用说明、索引、附录、词表和(D)A.目次B.题录C.附图D.正文(主文档)为便于计算机识别记录的各个字段,每个字段都设有字段标识符,下列哪个字段的标识叙述是正确的(A)A.TI是题名的标识符B.AB是关键词的标识符C.AU是摘要的标识符D.AF是著者的标识符以下不是布尔逻辑算符的是(B)A.ANDB.NearC.ORD.NOT布尔逻辑算符通常的运算顺序是(A)A.有括号时,括号内的先执行;无括号时 NOT > AND > ORB.有括号时,括号内的先执行;无括号时 NOT > OR >ANDC.有括号时,括号内的先执行;无括号时 AND >NOT > ORD.有括号时,括号内的先执行;无括号时 AND > OR > NOT限定词“in”是为了缩小检索范围,提高检索速度和命中率的。
下列检索表述式正确的是(B)A.“信息in OCLC”B.信息in AB”C. 信息in CNKI”D.信息in Calis”我国高校与公共图书馆的文献资料,一般采用的分类法分类的是(A)A.《中国图书馆图书分类法》B.《国际十进分类法》C.《人大法》E.《科图法》信息检索的方法有追溯法、综合法和(C)A.须查法B.倒查法C.工具法D.抽查法CNKI数据库的全文数据输出文件的格式为(D)A.VIP和TXTB.CAJ和VIPC.PPT和PDFD.CAJ和PDF超星电子图书提供快速检索和高级检索两种检索方式,利用快速检索可以按图书的单项模糊查询,这些单项包括(A)A.书名、作者、索书号和出版日期B.书名、作者、索书号和出版社C.书名、作者、分类号和出版社D.书名、版本、索书号和出版社读秀知识库是由海量全文数据及元数据组成的超大型数据库。
计算机信息检索期末复习资料

计算机信息检索期末复习资料汇总A1卷第一部分:单选题(每小题1分,共30小题,共30分)1.将计算机的内存储器与外存储器相比,内存储器的主要特点之一是()。
A.价格更便宜B.存取速度快C.存储容量大D.价格虽贵但容量大2.二进制数整数1111101转换成十六进制数是()。
A.FBB.ACC. 7DD.9D3.1945年6月,()提出了在数字计算机内部的存储器中存放程序的概念。
A.乔治•布尔B.莫奇莱C.艾仑•图灵D.冯·诺依曼4.当一个文档窗口被保存并关闭后,该文档将()。
A.保存在外存中B.保存在内存中C.保存在剪贴板中D.既保存在外存也保存在内存中5.打开“资源管理器”所使用的快捷键是()。
A.Ctrl+AB.Alt+EscC.Win+ED.Ctrl+S6.计算机存储器中的一个汉字占用()个字节。
A.一B.二C.三D.四7.Word在正常启动之后会自动创建一个名为()的文档。
A.新文档1.DOCB.1.TXTC.DOC1.DOCD.文档18.在WINDOWS7中,对话框是一种特殊的窗口,但一般的窗口可以移动和改变大小,而对话框()。
A.仅可以移动,不能改变大小B.仅可以改变大小,不能移动C.既不能移动,也不能改变大小D.既能移动,也能改变大小9.在Windows7下,以下文件夹名正确的是()。
A.d/bB.11*2!C.2b&4d%D.<book>10.在windows7中,多应用程序窗口的切换可以通过()。
A.在任务栏上用鼠标单击右键B.Alt+TabC.按Alt+Shift键D.按键关闭当前活动窗口11.在Word中,有关表格的操作,以下说法()是不正确的。
A.文本能转换成表格B.表格能转换成文本C.文本与表格可以相互转换D.文本与表格不能相互转换12.在文件操作中,经常使用的通配符是()。
A./与%B.?与*C.*与%D.?与&13.在Word中,剪切的键盘快捷键是()。
信息检索期末考试题

信息检索期末考试题一、单项选择题(每题2分,共20分)1. 信息检索的目的是()。
A. 存储信息B. 检索信息C. 传递信息D. 创造信息2. 以下哪个不是信息检索的类型()。
A. 布尔检索B. 模糊检索C. 精确检索D. 随机检索3. 在信息检索中,“AND”操作符的作用是()。
A. 逻辑或B. 逻辑与C. 逻辑非D. 逻辑异或4. 信息检索中的“关键词”是指()。
A. 与主题无关的词汇B. 与主题相关的词汇C. 任意词汇D. 专有名词5. 以下哪个数据库不是全文数据库()。
A. PubMedB. Web of ScienceC. Google ScholarD. JSTOR6. 在信息检索中,使用“*”符号的作用是()。
A. 表示精确匹配B. 表示任意字符的零次或多次出现C. 表示任意字符的一次出现D. 表示词组的开始或结束7. 信息检索中的“截词检索”是指()。
A. 检索词的精确匹配B. 检索词的前缀匹配C. 检索词的后缀匹配D. 检索词的中间匹配8. 以下哪个不是信息检索的步骤()。
A. 需求分析B. 选择检索工具C. 制定检索策略D. 撰写检索报告9. 在信息检索中,“OR”操作符的作用是()。
A. 逻辑与B. 逻辑或C. 逻辑非D. 逻辑异或10. 以下哪个不是信息检索的效果评价指标()。
A. 召回率B. 准确率C. 相关性D. 速度二、多项选择题(每题3分,共15分)1. 信息检索的基本原则包括()。
A. 相关性原则B. 经济性原则C. 系统性原则D. 可扩展性原则2. 信息检索中的“布尔逻辑”包括()。
A. ANDB. ORC. NOTD. NEAR3. 信息检索中的“字段检索”可能包括()。
A. 标题字段B. 作者字段C. 关键词字段D. 摘要字段4. 信息检索中的“高级检索”功能通常包括()。
A. 精确检索B. 模糊检索C. 截词检索D. 限定检索5. 信息检索中,提高检索效果的方法可能包括()。
信息检索期末复习资料.doc

信息检索一. 名词解释1.索引(P150):索引是将书籍、期刊等文献所刊载的论文题目、作者,以及所讨论的或设计的学科主题、名词术语、所引用的参考文献等,根据一定的需要,经过分析分别摘录出來,注明其所在书刊的页码,按一定的原则和方法排列起来的一种检索工具。
2.回溯检查法:又称追溯法、引文法、引证法,是一种跟踪杳找的方式。
即以文献后面所附的参考文献为线索,逐一追溯查找相关文献的方法。
通过回溯法所获得的文献有助于对课题的主题背景和立论依据等内容有更深的理解。
该方法获得文献针对性强、数量较多,在没有检索工具或检索工具不齐备的情况F,利用此法能够获得一些所需要的文献资料。
3.可视化:将数据库中不可见的语义关系以图像的形式可视化显示,并表达用户检索过程。
一个可视化的环境为用户展示更丰富、更直观的信息,一个透明的检索过程使检索更容易、更有效。
它包括检索过程的可视化和检索结果的可视化。
可视化信息检索技术缩短了用户理解信息的时间,提供了感觉和思考Z间的有效反馈机制,它代表着信息检索的未来,将会取代以布尔逻辑为基础的、传统的信息检索系统。
4.自动标引:是指直接通过计算机的操作处理,自动实现赋予检索标志的活动。
分为自动主题标引和H动分类标引,即根据计算机内信息(标题、摘要或全文),借助算法自动给出反应主题内容的标引词和自动分配分类号。
5.全文扫描:是以从文本文档中找出与查询表示的字符串完全一致的部分为目的,检索结果返回包含查询字符串的文本及其位置的检索技术。
6.查全率:查全率是指从检索系统检出的与某课题相关的文献信息数最与检索系统屮实际与该课题相关的文献信息总量Z比。
对于数据库检索系统,杳全率为检索出的款目数与数据库屮满足用户检索式需求的款目数Z比;而对于互联网信息检索系统来说,文献总量是很难计算的,甚至连估算都困难。
在这里人为因素的影响比较大。
相对査全率二(专业人员检出文献的数量数/全部实际检出文献集合并集中文献数量)*100%7.图像信息抽取:是指从数字图像中抽取包括基于文本的特征(说明,注释等关键词)和视觉特征或底层特征(颜色,文理,形状等),作为图像的特征描述,支持信息检索。
信息检索与利用期末复习

信息检索与利用期末复习 Revised by BETTY on December 25,2020《信息检索与利用》考试题型说明:一、判断题(1×10)二、单选题(1×20)客观题要涂答题卡。
三、填空题(2×5)四、简答题(12×3)五、实践题(12×2)信息检索与利用客观复习题一、判断题1.在构建关键词时,我们尽量不要用自然语言,而要从自然语言中提炼关键词。
(对)2.在信息检索时查询词表述准确是获得良好搜索结果的必要前提。
(对)3.目前的搜索引擎能很好的处理自然语言。
(错)4.用户可以通过Google图书搜索在线阅读任何一本搜索到的图书。
(错)5.二次检索是指在第一次检索结果不符合要求时,重新选择检索条件再次进行检索。
(错)6.解决读者需求的无限性和馆藏的有限性的矛盾,唯一有效的方法就是在图书馆间建立合作机制,实现资源共享。
(对)7.关键词语言的最大优点是能用计算机进行自动抽词标引,它适合于计算机自动编制各种类型的词索引。
(对)8.信息素养由信息意识、信息能力、信息道德三个方面内容构成,其中,信息道德是前提,信息能力是保证,信息意识是准则。
(错)9.搜索引擎与普通网站不同的是提供一个包含搜索框的页面,它不是一个WWW网站。
(错)10.用搜索引擎google检索专利和期刊的全文比用中国国家知识产权局专利数据库、《维普中文科技期刊数据库》等数据库的查全率和查准率都要高。
(错)11.GB/T 16159-1996,汉语拼音正词法基本规则[S].北京:中国标准出版社,1996.该文献类型为标准文献。
(对)12.在搜索引擎中输入“项目管理”和输入““项目管理””检索结果是不一样的。
(对)13.在搜索引擎中常用的截词符是星号“*”,通常使用右截断。
如输入comput*,将检索出computer、computing、computerized等词汇。
(对)14.通用搜索引擎,如google、baidu、bing、yahoo,并不能囊括所有的网页。
信息检索期末考试复习

图书的使用寿命平均在10~20年。
图书封底或版权页均有国际标准书号
ISBN 7 —
81076 — 367 — 9/ TP.46
国际标准书号 组号(国家、地区或语种) 出版者号 书序号
政府出版物
:是各国政府及其所属机构 根据国家命令发表和出版的文件。我国出版的 《国务院公报》、《人大常委会公报》
政府出版物分两类:行政性文献(包括立 法、司法文献)和科学技术文献(主要包括政 府出版的科技报告、标准、专利文献等)
特点:数量巨大,内容广泛;具有政策性、 指导性和可靠性。
特种文献:指出版发行方式和获取途径
会议文献
:在专业学术会议上宣读
或交流的论文、报告、及其它有关资料。
特点:主题突出、内容新颖、专业性强。
主要收藏在:中国科技信息研究所、中 国国家图书馆、中国科学院图书馆和中国 国防科技信息研究所。
专利文献
记录有关发明创造信息的文献。
广义的专利文献包括:专利申请文件、专利 检索工具、专利说明书。
校验码 中图大类号
2005年6月1日国际标准化组织(ISO)颁布第4版国际 标准书号 :将ISBN由10位升至13位 ,使用了国际编码协 会为ISBN分配的专用编码978、979,增加为前缀码新版 《国际标准书号》将于2007年1月1日全面实施。
新国际标准书号:
ISBN 978 - 7 - 5064 - 2595 - 7 前缀号 组号 出版者号 书序号 校验码
共有五大部,22大类。它是由政府部 门编制的一部大型综合性图书分类法,是中 国当代具有代表性的,被推荐为标准的图书 分类法。类号采用“字母数字混合制”标记, 由汉语拼音字母和阿拉伯数字来代表一个具 体的类目。如:F0——经济学、TB9——计 量学
信息检索课期末考试试卷库(复习题)1500字

信息检索课期末考试试卷库(复习题)1500字第一部分:选择题(每题2分,共30分)1. 下列哪个是信息检索系统的典型应用领域?A. 社交网络B. 电子商务C. 物理实验设计D. 机器学习2. 以下哪个不是信息检索领域常用的评价指标?A. 准确率B. 召回率C. F1得分D. 平均绝对误差3. 在布尔模型中,下列哪个是检索的基本单位?A. 文档B. 词项C. 布尔运算符D. 语句4. 在向量空间模型中,文档和查询都可以表示为向量,其向量的维数是什么?A. 词项的数量B. 文档的数量C. 查询的数量D. 与词项、文档和查询的数量无关5. TF-IDF是一种常用的权重计算方法,下列哪个公式描述了词项t在文档d中的TF-IDF值计算方法?A. tf(t,d) * idf(t)B. tf(t,d) + idf(t)C. tf(t,d) - idf(t)D. tf(t,d) / idf(t)6. 下列哪种算法常用于信息检索领域中的排名问题?A. 决策树算法B. 朴素贝叶斯算法C. 随机森林算法D. PageRank算法7. 下列哪个是信息检索系统的典型组成部分?A. 数据处理模块B. 用户界面模块C. 压缩算法模块D. 编译器模块8. 在信息检索系统中,如何度量搜索引擎的覆盖率?A. 计算搜索引擎的并发查询数B. 计算搜索引擎的响应时间C. 计算搜索引擎的索引覆盖率D. 计算搜索引擎的点击率9. 我们常用的搜索引擎谷歌使用的是什么排名算法?A. PageRank算法B. BM25算法C. TF-IDF算法D. Okapi BM25算法10. 在信息检索领域中,下列哪个不是评价模型性能的常用方法?A. 平均准确率B. P@kC. 排序误差D. 均方根误差11. 下列哪个不是用来评估信息检索系统性能的常用数据集?A. CQU1000B. TRECC. NTCIRD. CLUE12. 在机器学习中,下列哪种方法常用于文本分类任务?A. SVMB. K-meansC. PCAD. Decision Tree13. 下列哪种算法常用于解决词项消歧问题?A. TextRank算法B. HITS算法C. LDA算法D. Word2Vec算法14. 在信息检索系统中,下列哪个不是用户交互过程的重要环节?A. 查询解析B. 文档检索C. 相似性计算D. 反馈调整15. 下列哪个不是信息检索系统中常用的查询扩展方式?A. 同义词扩展B. 相关术语扩展C. 关键词增加D. 词项删除第二部分:填空题(每题3分,共30分)16. 信息检索系统的基本流程包括数据采集、全文索引、______和搜索反馈等阶段。
信息检索期末复习资料

信息检索一.名词解释1.索引(P150):索引是将书籍、期刊等文献所刊载的论文题目、作者,以及所讨论的或设计的学科主题、名词术语、所引用的参考文献等,根据一定的需要,经过分析分别摘录出来,注明其所在书刊的页码,按一定的原则和方法排列起来的一种检索工具。
2.回溯检查法:又称追溯法、引文法、引证法,是一种跟踪查找的方式。
即以文献后面所附的参考文献为线索,逐一追溯查找相关文献的方法。
通过回溯法所获得的文献有助于对课题的主题背景和立论依据等内容有更深的理解。
该方法获得文献针对性强、数量较多,在没有检索工具或检索工具不齐备的情况下,利用此法能够获得一些所需要的文献资料。
3.可视化:将数据库中不可见的语义关系以图像的形式可视化显示,并表达用户检索过程。
一个可视化的环境为用户展示更丰富、更直观的信息,一个透明的检索过程使检索更容易、更有效。
它包括检索过程的可视化和检索结果的可视化。
可视化信息检索技术缩短了用户理解信息的时间,提供了感觉和思考之间的有效反馈机制,它代表着信息检索的未来,将会取代以布尔逻辑为基础的、传统的信息检索系统。
4.自动标引:是指直接通过计算机的操作处理,自动实现赋予检索标志的活动。
分为自动主题标引和自动分类标引,即根据计算机内信息(标题、摘要或全文),借助算法自动给出反应主题内容的标引词和自动分配分类号。
5.全文扫描:是以从文本文档中找出与查询表示的字符串完全一致的部分为目的,检索结果返回包含查询字符串的文本及其位置的检索技术。
6.查全率:查全率是指从检索系统检出的与某课题相关的文献信息数量与检索系统中实际与该课题相关的文献信息总量之比。
对于数据库检索系统,查全率为检索出的款目数与数据库中满足用户检索式需求的款目数之比;而对于互联网信息检索系统来说,文献总量是很难计算的,甚至连估算都困难。
在这里人为因素的影响比较大。
相对查全率=(专业人员检出文献的数量数/全部实际检出文献集合并集中文献数量) *100%7.图像信息抽取:是指从数字图像中抽取包括基于文本的特征(说明,注释等关键词)和视觉特征或底层特征(颜色,文理,形状等),作为图像的特征描述,支持信息检索。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息检索期末复习1.请利用“期刊导航”功能,找出“文学理论”类核心期刊有几种?其中排名第一的期刊是什么?19种;《文学评论》(中国知网--期刊--期刊导航--核心期刊导航--选中--文学理论类--检索)2.维普数据库中,查找2007年《情报科学》期刊中,有关“信息检索”的文章维普数据库--期刊文献检索--基本检索--选中--时间:2007,刊名:情报科学,关键词:信息检索--检索3.在维普数据库中通过“高级检索”途径查找2003-2006年刊登在核心期刊上有关“信息检索”方面的论文。
维普数据库--期刊文献检索--高级检索--选中--关键词:信息检索,时间:2003--2006,期刊范围:核心期刊--检索4.请利用“基金导航”功能,查出我校图书馆购买的CNKI数据库中收录的“河北省地方基金”有几种?中国知网数据库--首页浏览--特色导航--基金导航--5.查找到《计算机科学》2007年第8期的目录。
中国知网数据库--期刊导航--选中--刊名:计算机科学,时间:2007年第8期--检索6.查找曾登载在《人民日报》上的一篇文章----长江水域生态渐呈“荒漠化”中国知网数据库--资源总库--源数据库--报纸--选中--报纸名称:人民日报,题名:长江水域生态渐呈“荒漠化”--检索7.有关材料方面的2007年举办的学术会议上发表的论文中国知网数据库--资源总库--源数据库--会议--选中--时间:2007,关键词:材料--检索8.找出南京财经大学的老师写的文章中哪些参考了徐从才校长的文章维普数据库--文献引证追踪--作者索引--选中作者:徐从才--检索--被引量87--选中机构:南京财经大学--在结果中搜索9.请检索出我校老师所发表的文章被引用4次以上的有哪些?维普数据库--文献引证追踪--机构索引--选中机构:南京财经大学--检索10.查找与大连理工大学-唐益萍同学同一导师的所有人的论文。
中国知网数据库--学位论文--硕士论文--选中--机构:大连理工大学,作者:唐益萍--检索11.请检索2000-2008年期间中国所发布的有关“碳酸饮料”的国家标准。
中国知网数据库--首页浏览--标准--国家标准全文--高级检索--选中时间:2000--2008,关键词:碳酸饮料--检索12.查找CAD有关机械方面,但不包含模具的信息,用布尔逻辑关系表示其检索式并在GOOGLE中进行查找。
谷歌搜索:(CAD or 机械)not 模具13.如何利用搜索引擎查找与有相似内容的其他网页,演示操作。
百度搜索--related: 14.请检索出哪些文章引用了,我校食品工程学院周建新老师的这篇文章“食品安全的微生物学检验的质量控制”。
中国知网--期刊论文数据库--被引文献XXX15.利用搜索引擎的排行功能,去查找网民关注的化妆品品牌TOP10百度首页--分类浏览--站长与开发者服务--风云榜--分类浏览--生活--化妆品--搜索16.用baidu查找我校网站上关于招生的报道。
百度搜索--招生site:--检索17.查找最近一周网上有关节日的flash谷歌搜索--filetype: swf 节日,搜索设置时间一周以内--检索18.高考即将来临,请为你的亲戚寻找一些高考招生方面的信息,要求信息准确(提示:在教育类网站中搜索)高考招生site:19.查找哪些网页链接了我们学校的网站。
link:20.查邵未秋主编的一本书,书名含有“古典舞”和“教程”检索。
南财图书馆--江苏高等教育文献保障系统--读者服务--书刊联合目录--选中作者:邵未秋,书名:古典舞,教程--检索21.在数据库检索中,如何增大文献信息的检出量?降低约束条件,AND改为OR, 扩大检索系统,利用引文网络,分类检索22.利用一段文字找到这段文字的来源文献CNKI----句子检索23.想考研,找本专业的学校CNKI---学位论文数据库---学位授予单位导航---学科单位导航(还有地域导航,但不符合本题的情况)注:CNKI中的三二一三类论文两种导航一种知网节24.找本专业的图书或论文OPAC联机公共访问目录或者三大论文数据库都可中图分类号(按学科H31是英语)25.根据网页检索,图书检索和论文检索思考什么是检索?有序集合中进行信息查找(检索的实质是匹配)KI 的知网节一般由哪几个部分组成?节点文献,引证文献,参考文献,二级参考文献,二级引证文献,同被引文献,同引证文献KI 收录的双月刊有多少种期刊?CNKI---期刊论文数据库----期刊导航---出版周期导航---双月刊KI作者发文检索的作用可以通过作者的姓名及单位等信息查找到此作者发表的全部文献以及这些文献的被引情况,从而反映出此作者的学术造诣多寡29.被称为是全世界最大的中文数字资源库中的中文数字图书馆是CNKI30.利用文献末尾所附参考文献进行检索的方法是引文追溯法31.SCI 是——的简称,文献主要来源于——科学引文索引期刊32.CSSCI 是——的简称中文社会科学引文索引(区别于CSCD 中国科学引文数据库)33.EI 是——的简称,90%的文献语种是——工程索引英语34.检索会议论文片名中包含外国文学的会议论文有多少篇CNKI---会议论文数据库----主题外国文学35.检索有关外国语言文字方面的2010年举办的学术会议上发表的论文CNKI---会议论文数据库---?外国语言文字,时间201236.检索2000-2009年英语类,且由南京财经大学作者发表在核心期刊上的文章有多少篇CNKI期刊论文数据库----文献分类目录----哲学与人文科学---外国语言文字--英语----时间2000-2009---作者单位南京财经大学---来源类别除了全部期刊其他都选37.2013年H32及其下属类目的发表在核心期刊的论文共有多少篇中国知网--期刊论文数据库--高级检索---中图分类号H32注:用学科分类或者说文献分类目录可以排除T大类的干扰KI 收录2012年度《外语学刊》一刊的论文有多少篇?CNKI期刊论文数据库---期刊导航---刊名《外语学刊》---刊期浏览201239.“大学英语跨文化教学的模式构建---研究现状与理论思考”一文发表在刊名为——的期刊上CNKI----期刊论文数据库-----篇名40.查找《外语界》2013 年第六期的目录CNKI期刊论文数据库-----期刊导航----刊名《外语界》----刊期浏览2013年41.检索2008--2013年,“外国语言文字”类目下,北京外国语大学授予学位的博士论文有——篇CNKI博硕士论文数据库---博士论文数据库----文献分类目录---哲学与人文科学---外国语言文字-----学位授予时间2008-2013-----学位授予单位北京外国语大学42.进入“学位授予单位导航”窗口,查看陕西省可以授予博士的单位有——家。
CNKI博硕士论文数据库----博士授予单位导航----地域导航----西北地区陕西省43.一篇论文列出了如下参考文献,分别写出各部分所对应的意义李文杰,胡志河·中国专利检索方法(J)食品科学和技术2004,25(4):155-157作者篇名中图分类号刊名年期页44.检索《物理学报》的期刊论文,在刊名输入,总有诸如“---物理学报”的刊物,如何排除?用ISSN(国家标准连续出版物编号)45.检索钱伟长在清华大学或上海大学时发表的文章CNKI专业检索----AU=钱伟长AND (AF=清华大学OR AF=上海大学)46.检索钱伟长1980年以前在清华大学期间发表的题名或摘要中都包含“物理”的文章CNKI专业检索----AU=钱伟长AND YE<1980 AND AF=清华大学AND(AI=物理OR AB=物理)注:AI 题名AB摘要YE年份AU作者AF作者单位所有小括号都得是英文半角状态下的47.知网节的作用系统揭示学科发展脉络和动态文献评价和选题立项的重要依据48.期刊论文记录中的“文献出处”字段是指?论文作者的工作单位49.国际连续出版物的编号是ISSN区别于ISBN国际标准书号international standard book numberOCLC 联机计算机图书馆中心online computer library center,inc50.相对于图书而言,论文的主要特点是时效性高51,。
CNKI 的中文全称是中国知识基础设施工程51.列举几种传统信息检索技术布尔逻辑检索位置检索截词检索限制检索加权检索52.查准率太低时,检索式应作何调整?减少同义词、增加限制概念、使用限制字段检索,把检索词限定在题目,主题词等主要字段53.如何统计我校网站的网页数Site : 54.如何统计我校网站的链入网页数Link: 55.在我校网站范围内检索有关研究生招生的网页资源Site:56.检索关于医疗健康与保健的网页资源,并要求网页的网址中包含healthcare英文网站inurl: healthcare中文网站inurl: 57.分类检索提高的是——查全率58.查找与大连理工大学-苏梅同学同一导师的所有人的论文CNKI博硕士论文数据库----作者苏梅---学位单位大连理工大学---检索找到其导师X----导师X59.如何利用搜索引擎查找与有相似内容的其他网页,写出检索式。
前加Link60.请举出一个元搜索引擎的例子,作为元搜索引擎,你认为最重要需要解决什么问题?百度,360,有道搜索结果质量不高查准率不高61.找出南京财经大学的老师写的期刊论文中哪些参考了周三多的文献?法一维普数据库---文献引证追踪----作者索引周三多---检索----选中机构南京财经大学法二CNKI引文检索----中国引文数据库----被引作者周三多62.分类目录式搜索引擎和索引式(全文)搜索引擎有什么区别?全文搜索引擎因为依靠软件进行,所以数据库的容量非常庞大,但是,它的查询结果往往不够准确。
分类目录依靠人工收集和整理网站,能够提供更为准确的查询结果,但收集的内容却非常有限。
1.搜索引擎属于自动网站检索,而目录索引则完全依赖手工操作。
2.搜索引擎收录网站时,只要网站本身没有违反有关的规则,一般都能登录成功;而目录索引对网站的要求则高得多,有时即使登录多次也不一定成功。
3.当用于在登录搜索引擎时,我们一般不用考虑网站的分类问题,而登录目录索引时则,必须将网站放在一个最合适的目录(Directory)4.搜索引擎中各网站的有关信息都是从用户网页中自动提取的,所以用户的角度看,我们拥有更多的自主权;而目录索引则要求必须手工另外填写网站信息,而且还有各种各样的限制。
4. 因此,分类目录型搜索引擎营销方法与技术性搜索引擎的方式有很大的不同,需要充分了解,这种区别,才能充分发挥各种不同搜索引擎的作用。