中国科学院大学现代信息检索2012年秋季期末试题及答案

合集下载

中国科学院大学计算机领域信息检索期末考试答案

中国科学院大学计算机领域信息检索期末考试答案

域信息检索与利用实用技巧任课老师:李玲试题专用纸1、简答题:您在学习和研究过程中遇到下列问题时,常用哪些方法来解决?(10题,3分/小题,共30分)(1)查找期刊时,您常用的方法?答: 中文期刊一般用:中国知网、万方数据库、维普数据库等;外文期刊一般用:ACM、IEEE、Elsevier ScienceDirect、SpringerLink、ScienceOnline 、Taylor & Francis Online Journals 、Cambridge Journal等;可通过国科大图书馆进入上述网站首页,输入所需检索的期刊信息,如期刊名称、作者、发表年份等信息进行查询。

(2)查找中国科学院学位论文时,您常用的方法?答: 进入“中国科学院大学”首页→点击右下方“图书馆”→点击进入“中科院学位论文数据库”→进入检索界面,输入所需检索的论文信息,如:论文名称、作者、指导老师等。

(3)查找各国专利以及专利的被引用情况时, 您常用的方法?答:进入国家知识产权局官网“”,输入所需检索专利的发明名称、申请号、申请人(三者至少必填其一)进行检索,查看专利被引用情况。

(4)查找SCI期刊的影响因子,您常用的方法?答:通过国科大图书馆点击“ISI-SCIE”进入web of science平台查询界面,输入期刊的关键词、作者等信息,可通过“AND”进行多个关键词组合以缩小查询范围。

(5)查找标准文献时,有哪些注意事项?答:合理选择标准数据库(如中文期刊会议类检索工具选用CNKI、维普、万方等,查询专利选用国家知识产权局等数据库);注意文献的发表时间(如利用CNKI科技类期刊数据库查询只能查询1994年之后发表的文献,维普中文科技期刊库可查询1984年之后发表的文献)使用多个精确的关键字组合,以减小检索范围。

(6)文献管理时,您常用的方法?答:使用EndNote文献管理工具,进行分类管理方便后期查询。

域信息检索与利用实用技巧任课老师:李玲试题专用纸(7)获取无法直接下载的文献全文时,您常用的方法?答:可通过文献传递,向有权限的人求助;或通过查询Researchgate,付费网站获取;也可以邮件联系文献作者求助。

信息检索技术习题答案(2012版)

信息检索技术习题答案(2012版)

答案******************************* 一 ********************************************填空1.数值型文字型(字符)语音型图像型2.原料成品3.信息4.自然人为5.数据文本声音图像6.语义差异传递载体7.外表整体内容8.收集传输加工储存(存储)9.信息形式信息内容10.内在的信息需要外在刺激11.标题词单元词叙词关键词12.线性结构非线性结构树形结构网状结构13.数据预处理索引生成查询处理检索14.信息需求信息集合15.出发点依据16.人工赋予自动生成名词解释1.数据:是指记载下来的事实,是客观实体属性的值,它是由原始事实组成的。

2.信息加工:是指对获取的信息进行判别、筛选、分类、排序、分析、计算和研究等一系列过程,使收集到的信息成为对我们有用的信息资源。

3.信息组织:即信息序化或信息整序,也就是利用一定的科学规则和方法,通过对信息外在特征和内容特征的表征和序化,实现无序信息流向有序信息流的转换,从而保证用户对信息的有效获取和利用及信息的有效流通和组合。

4.检索标识:就是为沟通文献标引与文献检索而编制的人工语言,也是连接信息存储和检索两个过程中标引人员与检索人员双方思路的渠道,是用于文献标引和检索提问的约定语言。

5.信息检索:可以从广义和狭义两个角度理解。

广义的信息检索是指将信息按一定方式组织和存储起来,并根据用户的需要找出相关信息的过程,其中包括存与取两个方面。

狭义的信息检索仅指信息查找过程。

6.信息检索系统:是指按某种方式、方法建立起来的用于检索信息的一种有层次的体系,是表征有序的信息特征的集合体。

7.检索效果:是指利用检索系统(或工具)开展检索服务时所产生的有效结果。

简答题1.简述了解用户信息需求的作用答:用户信息需求是信息系统发展的动力,也是制定信息政策的出发点和依据。

了解用户需求的特点、心理规律、查询行为及需求方式,有助于系统制订合理的信息搜集方针和信息资源的合理布局,从而提高服务效益和质量。

《信息检索》期末考试试题库

《信息检索》期末考试试题库

提示:期末考试题库内容一、填空1.在许多数据库中,都有“二次检索”功能,“二次检索”指:在前一次检索基础上再检索。

2.在google搜索引擎检索关键词为短语DA TA OUTPUT,将检索短语写成“DA TAOUTPUT”。

3.清华同方数据库默认的检索方式是多库检索。

4.数据库的类型:网络数据库、联机数据库和光盘数据库。

5.描述信息内容特征的检索语言包括分类语言和主题语言,主题语言又可分为关键词语言、单元词语言、标题词语言和叙词语言。

6.检索工具有多种索引,可以提供多种检索途径,一般来讲,检索途径可以分为以下四种:分类途径、主题途径、著者途径和其他途径。

7.按信息的存储媒体和技术手段来分,检索的手段有两种:手工检索和计算机检索。

8.信息检索常用的方法有:工具法、引文追溯法和循环法。

9.专利有三层含义新颖性、创造性和实用性。

10.标准文献的主体是标准。

11.期刊论文的文献出处包括期刊名称、年卷期和起止页码。

12.文件ABC.001.TXT的后缀名是TXT 。

文件类型是文本文件。

13.多数网页采用HTML编写,这里的HTML指的是:超文本标识语言。

14.按文献的相对利用率来划分,可以把文献分为核心文献、相关文献、边缘文献。

15.检索工具具有两个方面的职能:存储职能、检索职能。

16.将文献作者的姓名按字顺排列编制而成的索引称为:作者索引。

17.利用原始文献所附的参考文献,追踪查找参考文献的原文的检索方法称为追溯法,又称为引文法。

18.当检索关键词具有多个同义词和近义词时,容易造成漏检,使得查全率较低。

19.手稿、私人笔记等属于零次文献,辞典、手册等属于三次_文献。

20.狭义的信息检索就是指信息的_检索____过程。

21.按照检索对象的不同,信息检索可分为数据检索、事实检索和文献检索。

22.按信息检索的技术划分,信息检索有(全文本检索)、(多媒体检索)、超文本信息检索、(超媒体信息检索)。

按信息检索的手段划分,可分为(手工信息检索)、(计算机信息检索)。

(完整版)信息检索期末复习题及答案

(完整版)信息检索期末复习题及答案

《信息检索》期末复习题及答案(仅供参考)一、判断题1.综述和百科全书属于二次文献。

(× )2.从文献检索的角度来看,一次文献是检索对象,二次文献是检索手段。

(× )3.题录、目录属于一次文献;期刊论文属于二次文献。

(× )4.主题词规范化的目的是扩大检索范围。

(√)5.在众多的信息源中,期刊是最重要的信息源。

(√ )6.核心期刊是指经常使用的期刊。

(× )7.关键词和主题词都是表征文献实质性内容的词汇,前者是经过词表规范的,后者是未经词表规范的自由词。

(×)8.《中国图书分类法》(简称《中图法》)是由分类号(代码)和类名来揭示信息的主题概念。

(×)9.题录型的检索工具,其著录项目包括题目、作者、文献出处、文摘。

()10.一项发明创造要获得专利权必须具备新颖性、创造性和实用性。

()二、选择题1、广义的信息检索包含两个过程( B )A、检索与利用B、存储与检索C、存储与利用D、检索与报道2、文献是记录有知识的()。

A、载体B、纸张C、光盘D、磁盘3、下列哪种文献属于一次文献( A )。

A、期刊论文B、百科全书C、综述D、文摘4、下列哪种文献属于二次文献( D )。

A、专利文献B、学位论文C、会议文献D、目录5、下列哪种文献属于三次文献( C )。

A、标准文献B、学位论文C、综述D、文摘6、下列选项中属于连续出版物类型的选项有(C )。

A、人民日报B、学位论文C、科技期刊D、会议文献7、下列选项中属于特种文献类型的有( D )。

A、学位论文B、图书C、科技期刊D、标准文献8、纸质信息源的载体是()A、光盘B、缩微平片C、感光材料D、纸张9、《中国图书分类法》(简称《中图法》)将图书分成( A )A、5大部分22个大类B、5大部分26个大类C、6大部分22个大类D、6大部分26个大类10、《中国图书分类法》(简称《中图法》)是我国常用的分类法,要检索农业方面的图书,需要在( A )类目下查找。

信息检索期末考试题答案和题讲课讲稿

信息检索期末考试题答案和题讲课讲稿

学号:姓名:2012----2013学年第二学期信息检索与利用考查上机试卷(要求检索结果全部存放在Word 文档里,Word 文档命名为:学号+姓名。

文档的第一行写上:学号、姓名。

)一、搜索引擎检索:将检索结果存到Word 文档中。

(30 分)1、文献信息源按照内容的压缩程度,可分为_________、__________、__________2、霍金曾三次来到中国,时间分别是、____________、____________。

3、元搜索引擎的定义__________________________________________,并列举出6 个中文元搜索引擎:____________________、_____________________、______________________、_______________________、_______________________、____________________。

4、三国时期刘备生于公元161_____年,死于_公元223____年,字玄德_____,涿郡涿县(今河北涿州)_____人。

5、信息检索系统由输入系统,存储系统,用户界面,索引器,检索器。

_________、_________、_________、_________和_________组成。

6、苏州“道前街”一名的来历是_是_由原道前街、府前街、卫前街合并而成___,“五卅路”曾用名王废基___,位于苏州市古城区________。

7、室内空气中臭氧卫生标准____________________________________。

8、计算机信息检索大体经历了________________、_________________、__________________和_________________四个发展阶段。

9、“八五计划”的目标__________________________________________。

信息检索与利用期末总复习题

信息检索与利用期末总复习题

信息检索与利⽤期末总复习题信息检索与利⽤期末总复习题松江分校王芳 2012年6⽉考试说明:考试为卷⾯考,卷⾯成绩100分,折合最终成绩60分;形考分数占最终成绩40分,分别为⽹上课堂成绩占80%,出勤占20%。

考试总时间为90分钟,题型有两类,如下:卷⼀类型:(注:2011年7⽉,2012年1⽉都是考察此类题型)⼀、判断题(1×10)⼆、单选题(1×20)客观题要涂答题卡。

三、填空题(2×5)四、简答题(12×3)五、实践题(12×2)卷⼆类型:⼀、判断题(1×10)⼆、单选题(1×20)客观题要涂答题卡。

三、简答题(10×5)四、论述题(20×1)复习范围(部分)⼀、判断题1.在构建关键词时,我们尽量不要⽤⾃然语⾔,⽽要从⾃然语⾔中提炼关键词。

(对)2.在信息检索时查询词表述准确是获得良好搜索结果的必要前提。

(对)3.⽬前的搜索引擎能很好的处理⾃然语⾔。

(错)4.⽤户可以通过Google图书搜索在线阅读任何⼀本搜索到的图书。

(错)5.⼆次检索是指在第⼀次检索结果不符合要求时,重新选择检索条件再次进⾏检索。

(错)6.解决读者需求的⽆限性和馆藏的有限性的⽭盾,唯⼀有效的⽅法就是在图书馆间建⽴合作机制,实现资源共享。

(对)7.关键词语⾔的最⼤优点是能⽤计算机进⾏⾃动抽词标引,它适合于计算机⾃动编制各种类型的词索引。

(对)8.信息素养由信息意识、信息能⼒、信息道德三个⽅⾯内容构成,其中,信息道德是前提,信息能⼒是保证,信息意识是准则。

(错)9.搜索引擎与普通⽹站不同的是提供⼀个包含搜索框的页⾯,它不是⼀个WWW⽹站。

(错)10.⽤搜索引擎google检索专利和期刊的全⽂⽐⽤中国国家知识产权局专利数据库、《维普中⽂科技期刊数据库》等数据库的查全率和查准率都要⾼。

(错)11.GB/T 16159-1996,汉语拼⾳正词法基本规则[S].北京:中国标准出版社,1996.该⽂献类型为标准⽂献。

信息检索课期末复习题

信息检索课期末复习题

信息检索课期末复习题第一篇:信息检索课期末复习题信息检索课期末复习题第1章绪论1.信息素质的概念。

(P2)2.信息素质的四要素分别是什么?(P3)第3章信息与信息资源1.信息的含义。

(P33)2.信息的特征。

(P3-34)3.文献的概念。

(P35)4.文献信息资源的分类方法:按载体形式划分、按出版类型划分、按加工层次划分。

其中重点理解一次文献、二次文献、三次文献是什么。

第4章信息检索基础1.印刷型信息检索系统的类型及格式(P47)2.计算机信息检索系统的构成。

(P48)3.检索效果的评价指标中查全率和查准率是如何计算的?它们之间是什么关系?(P52)如何提高查全率(P60)?如何提高查准率?(P60)4.认真学习4.2信息检索的基本步骤这一节的内容,能够知道面对一个具体的检索课题需要设计经过怎样的检索流程?(P53-P61)5.检索点是什么?反应文献信息内容特征的检索点有哪些?反应文献外表特征的检索点有哪些?分类和主题检索点又有什么特点?6.看图表了解中图法是如何具体分类的?7.在计算机检索系统中的基本检索算符有哪些?(P71)重点掌握逻辑算符、字段限制算符、短语检索的表示方法,能够根据检索意图编制相应的检索式。

第5章国内学术信息资源检索结合实习作业复习本部分的内容1.广工图书馆网站上查找电子图书的数据库有哪些?KI、万方和维普分别可以查询哪些类型的文献?(期刊论文、会议论文、学位论文、专利文献、标准文献等)3.专利这个词有哪三层含义?(P109)4.中国专利有哪几种类型?保护时间分别多长?怎样从专利号中辨别不同类型的专利?5.授予专利权的条件是什么?6.专利有哪三种审查制度?我国的专利分别采用哪种审查制度?7.知道检索全世界专利文献的共同方法是利用国家专利分类表,了解国际专利分类号的组成。

(P113)8.结合实习,了解可通过哪些数据库或网站获取专利文献或标准文献?9.我国标准化法把标准分为哪四级?认识国家标准编号的组成。

信息检索课期末考试试题库(复习题)

信息检索课期末考试试题库(复习题)

信息检索课期末考试试题库(复习题)一、单项选择题在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。

错选、多选或未选均无分。

知识是指人类对客观世界的认识。

知识可分为(C)A.有用知识和无用知识B.基础知识和高级知识C.感性知识和理性知识D.理论知识和实践知识文献按载体形式可分为:印刷型、缩微型、声像型和(D)A.甲骨型B金石型C.电脑型D.机读型信息检索系统的功能为:报道文献信息、存储文献信息和(B)A.揭示文献信息B.检索文献信息C.宣传文献信息D.介绍文献信息检索系统的结构由几个部分组成:编辑使用说明、索引、附录、词表和(D)A.目次B.题录C.附图D.正文(主文档)为便于计算机识别记录的各个字段,每个字段都设有字段标识符,下列哪个字段的标识叙述是正确的(A)A.TI是题名的标识符B.AB是关键词的标识符C.AU是摘要的标识符D.AF是著者的标识符以下不是布尔逻辑算符的是(B)A.ANDB.NearC.ORD.NOT布尔逻辑算符通常的运算顺序是(A)A.有括号时,括号内的先执行;无括号时 NOT > AND > ORB.有括号时,括号内的先执行;无括号时 NOT > OR >ANDC.有括号时,括号内的先执行;无括号时 AND >NOT > ORD.有括号时,括号内的先执行;无括号时 AND > OR > NOT限定词“in”是为了缩小检索范围,提高检索速度和命中率的。

下列检索表述式正确的是(B)A.“信息in OCLC”B.信息in AB”C. 信息in CNKI”D.信息in Calis”我国高校与公共图书馆的文献资料,一般采用的分类法分类的是(A)A.《中国图书馆图书分类法》B.《国际十进分类法》C.《人大法》E.《科图法》信息检索的方法有追溯法、综合法和(C)A.须查法B.倒查法C.工具法D.抽查法CNKI数据库的全文数据输出文件的格式为(D)A.VIP和TXTB.CAJ和VIPC.PPT和PDFD.CAJ和PDF超星电子图书提供快速检索和高级检索两种检索方式,利用快速检索可以按图书的单项模糊查询,这些单项包括(A)A.书名、作者、索书号和出版日期B.书名、作者、索书号和出版社C.书名、作者、分类号和出版社D.书名、版本、索书号和出版社读秀知识库是由海量全文数据及元数据组成的超大型数据库。

2012---2013年信息检索期末试卷

2012---2013年信息检索期末试卷

2012----2013信息检索期末试卷班级姓名学号一、单项选择题(30分)1.( )的主要功能是检索、通报、控制一次文献,帮助人们在较短时间内获取较多的文献信息。

A.零次文献B.二次文献C.一次文献D.三次文献2.一次文献、二次文献、三次文献是按照( )进行区分的。

A.加工深度B.原创的层次C.印刷的次数D.评论的次数3.从文献的( )角度区分,可将文献分为印刷型、缩微型等。

A.内容公开次数B.载体类型C.出版类型D.公开程度4.具有固定名称、统一出版形式和一定出版规律的定期或不定期的连续出版物,称为( )。

A.图书B.会议文献C.学位论文D.期刊5.( )类型的专业文献出版周期最短、发行量最大、报道最迅速及时,成为多数论文发表渠道。

A.期刊B.报纸C.会议文献D.专利6.在公开出版物中,当前的( )反映的信息内容可能最新。

A.学位论文B.标准文献C.期刊论文D.报纸文献7.当我们需要对陌生知识作一般了解时,我们可先参考( )文献。

A.专利B.报告C.图书D.标准8.利用文献后面所附的参考文献进行检索的方法称为( )。

A.追溯法B.直接法C.抽查法D.综合法9.中国图书馆图书分类法的分类号采用了( )体系。

A.拼音字母+数字B.英语字母+数字C.全部拼音字母D.全部数字10.( )是以报道文献出版或收藏信息为主要功能的工具。

A.题录B.索引C.文摘D.目录11.按照顺序表述文献检索常用的五个步骤是( )。

A.明确要求和分析课题,选择检索系统,获取原文,确定检索途径和检索策略,实施检索以及调整检索策略B.明确要求和分析课题,获取原文,确定检索途径和检索策略,实施检索以及调整检索策略,选择检索系统C.明确要求和分析课题,实施检索以及调整检索策略,选择检索系统,获取原文,确定检索途径和检索策略D.明确要求和分析课题,选择检索系统,确定检索途径和检索策略,实施检索以及调整检索策略,获取原文12.图书分类法中,类名之间的上下位关系反映了学科概念之间的( )关系。

信息检索期末考试题

信息检索期末考试题

信息检索期末考试题一、单项选择题(每题2分,共20分)1. 信息检索的目的是()。

A. 存储信息B. 检索信息C. 传递信息D. 创造信息2. 以下哪个不是信息检索的类型()。

A. 布尔检索B. 模糊检索C. 精确检索D. 随机检索3. 在信息检索中,“AND”操作符的作用是()。

A. 逻辑或B. 逻辑与C. 逻辑非D. 逻辑异或4. 信息检索中的“关键词”是指()。

A. 与主题无关的词汇B. 与主题相关的词汇C. 任意词汇D. 专有名词5. 以下哪个数据库不是全文数据库()。

A. PubMedB. Web of ScienceC. Google ScholarD. JSTOR6. 在信息检索中,使用“*”符号的作用是()。

A. 表示精确匹配B. 表示任意字符的零次或多次出现C. 表示任意字符的一次出现D. 表示词组的开始或结束7. 信息检索中的“截词检索”是指()。

A. 检索词的精确匹配B. 检索词的前缀匹配C. 检索词的后缀匹配D. 检索词的中间匹配8. 以下哪个不是信息检索的步骤()。

A. 需求分析B. 选择检索工具C. 制定检索策略D. 撰写检索报告9. 在信息检索中,“OR”操作符的作用是()。

A. 逻辑与B. 逻辑或C. 逻辑非D. 逻辑异或10. 以下哪个不是信息检索的效果评价指标()。

A. 召回率B. 准确率C. 相关性D. 速度二、多项选择题(每题3分,共15分)1. 信息检索的基本原则包括()。

A. 相关性原则B. 经济性原则C. 系统性原则D. 可扩展性原则2. 信息检索中的“布尔逻辑”包括()。

A. ANDB. ORC. NOTD. NEAR3. 信息检索中的“字段检索”可能包括()。

A. 标题字段B. 作者字段C. 关键词字段D. 摘要字段4. 信息检索中的“高级检索”功能通常包括()。

A. 精确检索B. 模糊检索C. 截词检索D. 限定检索5. 信息检索中,提高检索效果的方法可能包括()。

信息检索试题及答案

信息检索试题及答案

信息检索试题及答案### 信息检索试题及答案#### 一、选择题1. 信息检索系统的主要功能是什么?- A. 存储信息- B. 检索信息- C. 分析信息- D. 创造信息答案:B2. 以下哪项不是全文检索的特点?- A. 快速- B. 准确- C. 只包含关键词- D. 包含完整的文本内容答案:C3. 在信息检索中,布尔逻辑运算符不包括以下哪一项? - A. AND- B. OR- C. NOT- D. XOR答案:D#### 二、填空题4. 信息检索的目的是_________。

答案:快速、准确地找到所需的信息5. 信息检索的两种基本类型是_________和_________。

答案:系统检索;手工检索6. 信息检索中,倒排索引是一种_________结构。

答案:反向#### 三、简答题7. 简述信息检索的基本原则。

答案:信息检索的基本原则包括:- 相关性原则:检索结果应与用户需求高度相关。

- 准确性原则:检索结果应准确反映信息内容。

- 效率原则:检索过程应快速高效。

- 可扩展性原则:检索系统应能适应信息量的增长。

8. 描述信息检索过程中的“关键词”概念。

答案:关键词是信息检索过程中用来标识文档主题或内容的词或短语。

它们是检索查询的核心,帮助用户快速定位到包含这些关键词的文档。

#### 四、论述题9. 论述信息检索技术在现代图书馆服务中的应用。

答案:信息检索技术在现代图书馆服务中的应用主要体现在以下几个方面:- 提供在线目录查询服务,方便读者快速找到所需图书。

- 支持电子资源的检索,包括电子书、期刊文章、多媒体资料等。

- 实现个性化推荐服务,根据读者的阅读历史和偏好推荐相关资源。

- 辅助图书馆进行资源管理,如自动化编目、馆藏资源的盘点等。

- 支持远程访问服务,使读者能够通过网络访问图书馆资源。

#### 五、案例分析题10. 某公司需要检索关于“人工智能”的最新研究论文,分析如何有效进行信息检索。

中国科学院大学现代信息检索2012年秋季期末试题及答案

中国科学院大学现代信息检索2012年秋季期末试题及答案

中国科学院研究生院课程编号:71258-Z-2试题专用纸课程名称:现代信息检索任课教师:王斌———————————————————————————————————————————————姓名学号成绩一、判断题(正确打√,错误打X。

每题2分,共30分)1、建立倒排索引时,只能以文件作为索引单位。

(X)2、词项集合和词条集合有时可以完全不同,甚至交集为空集。

(√ )3、轮排索引和k-gram索引都可以支持通配查询的处理。

(√ )4、倒排索引的构建与所处的硬件环境息息相关。

(√ )5、γ的编码序列唯一,但解码序列不唯一。

(X)6、向量空间模型的计算当中,采用余弦相似度和欧氏距离得到的相似度是一致的,即两个向量的余弦相似度大,则欧氏距离一定小,而当余弦相似度小时欧氏距离大。

(X)7、信息检索系统中只存在一种索引结构。

(X)8、隐式相关反馈中对用户的行为进行分析,因此一定会提高检索的效果。

(X)9、在BM25检索模型中,考虑了文档长度对检索带来的影响。

(√)10、在朴素贝叶斯分类器,基于多项式模型和基于贝努利模型的实现中采用了完全相同的假设。

(X)条件独立假设+ 位置独立假设+只考虑出现位置独立假设+ 考虑不出现11、特征选择函数MI(Expected Mutual Information)考虑了词项不存在对分类带来的影响。

(√ )12、SVM分类的速度与支持向量的个数无关。

(X)13、K-均值聚类算法的结果依赖于初始种子质心的选择。

(√)14、GAAC层次聚类算法的结果具有确定性。

(√)15、隐性语义索引LSI本质上是将原始的向量空间线性变换到另一个高维向量空间。

(X)二、选择题(单项或多项选择。

每题2分,共16分)1、关于倒排索引的压缩,以下叙述正确的是(A B )。

A)压缩能提高空间的利用率B)压缩能提高硬盘到内存的传输速度C)词典压缩作用不大D)可变字节编码压缩是一种有损压缩方法2.关于向量空间模型,以下叙述正确的是(A B D )。

科技信息检索期末考试试题

科技信息检索期末考试试题
科技信息检索期末考试试题
(考试目的:针对具体课题,利用所学课题分析方法和信息资源检索方法对研究课题进行充分的分析,考察分析问题的能力和信息资源检索的能力。请同学们本着诚恳、务实的态度认真填写以下三个表格)
表一:课题基本情况
姓名
学号
专业
课题名称:
课题涉及的专业方向与需要的知识体系:
课题专业方向的中图法分类号:
课题涉及知识的题词或关键词:
课题基本思想简要说明:
表二:课题研究现状考察
课题相关专业方向研究现状以及主要思想或方法(附参考文献名称、日期、发表刊物、来源):
课题相关专业方向研究代表人物(或机构)以及主要著作(附著作名称、日期、发表刊物、来源):
表三:课题分析报告(综合阐述研究现状、存在的不足、研究目标计划以及可行性分析)

信息检索试题(有答案)

信息检索试题(有答案)

信息检索试题(有答案)第一篇:信息检索试题(有答案)1.检索系统:由大量的数据库集合生成的数据库。

2.自然语言:未经加工和规范化处理的非受控于言。

3.二次文献:对一次文献进行加工整理后的产物,即对无序的一次文献的外部特征如题名、作者、出处等进行著录,或将其内容压缩成简介、提要或文摘,并按照一定的学科或专业加以有序化而形成的文献形式,如目录、文摘杂志(包括简介式检索刊物)等4.主题词:是用于表述、存储、查找文献主题的受控词汇,是主题表中能表达一定意义的最基本的词汇单元。

5.科技报告:科技报告是研究单位向主管机构和资助单位提交的关于某项科技成果的正式报告或其进展阶段的实际记录。

一般依托于国家的军事和高科技科研项目,是科研工作成果的体现,需要经过专家评审鉴定,技术上可靠性较高。

6.体系分类语言:体系语言是以科学分类为基础,运用概念的划分与概括的逻辑方法,形成一个概念等级体系,按知识门类的逻辑次序,按照从总到分,从一般到具体,从低级到高级,从简单到复杂的原则进行概念的综分,层层划分,累累隶属,逐步展开而形成的一个等级体系。

1.当关键词具有多个含义的时容易造成误检,使得查准率较低。

2.信息素质的内涵包括信息意识、信息能力和信息道德。

3.主题词的体现形式是叙词表。

4.文献按其加工深度不同可分为零次文献,一次文献,二次文献和三次文献。

5.中国图书馆图书分类法简称为:中图法。

6.连续出版物的主要类型有期刊、报纸、年底出版物。

7.标准文献的主体是技术标准。

8.当计算机访问范围受到限制时,可通过代理服务器访问外部网络。

9.构成文献的三要素是载体、知识和记录手段。

10.布尔逻辑运算符包括: 逻辑“或”、逻辑“与”和逻辑“非”三种。

11.专利有三层含义:专利权、专利技术和专利文献。

12.文献的内容特征用于找出相关文献,外部特征用于获得特定文献。

13.信息检索常用的方法有:工具法、引文法和循环法。

KI的中文全称是 China National Knowledge Infrastructure。

信息检索技术习题答案(2012版)

信息检索技术习题答案(2012版)

答案******************************* 一 ********************************************填空1.数值型文字型(字符)语音型图像型2.原料成品3.信息4.自然人为5.数据文本声音图像6.语义差异传递载体7.外表整体内容8.收集传输加工储存(存储)9.信息形式信息内容10.内在的信息需要外在刺激11.标题词单元词叙词关键词12.线性结构非线性结构树形结构网状结构13.数据预处理索引生成查询处理检索14.信息需求信息集合15.出发点依据16.人工赋予自动生成名词解释1.数据:是指记载下来的事实,是客观实体属性的值,它是由原始事实组成的。

2.信息加工:是指对获取的信息进行判别、筛选、分类、排序、分析、计算和研究等一系列过程,使收集到的信息成为对我们有用的信息资源。

3.信息组织:即信息序化或信息整序,也就是利用一定的科学规则和方法,通过对信息外在特征和内容特征的表征和序化,实现无序信息流向有序信息流的转换,从而保证用户对信息的有效获取和利用及信息的有效流通和组合。

4.检索标识:就是为沟通文献标引与文献检索而编制的人工语言,也是连接信息存储和检索两个过程中标引人员与检索人员双方思路的渠道,是用于文献标引和检索提问的约定语言。

5.信息检索:可以从广义和狭义两个角度理解。

广义的信息检索是指将信息按一定方式组织和存储起来,并根据用户的需要找出相关信息的过程,其中包括存与取两个方面。

狭义的信息检索仅指信息查找过程。

6.信息检索系统:是指按某种方式、方法建立起来的用于检索信息的一种有层次的体系,是表征有序的信息特征的集合体。

7.检索效果:是指利用检索系统(或工具)开展检索服务时所产生的有效结果。

简答题1.简述了解用户信息需求的作用答:用户信息需求是信息系统发展的动力,也是制定信息政策的出发点和依据。

了解用户需求的特点、心理规律、查询行为及需求方式,有助于系统制订合理的信息搜集方针和信息资源的合理布局,从而提高服务效益和质量。

title信息检索期末考试试题及答案

title信息检索期末考试试题及答案

title信息检索期末考试试题及答案一、选择题(每题2分,共20分)1. 信息检索中,布尔逻辑运算符包括AND、OR和NOT,其中AND表示()。

A. 逻辑与B. 逻辑或C. 逻辑非D. 逻辑异或答案:A2. 在信息检索中,以下哪个选项不是信息检索的基本步骤?()A. 提出问题B. 选择检索工具C. 制定检索策略D. 编写检索报告答案:D3. 以下哪个数据库不是全文数据库?()A. CNKIB. Web of ScienceC. PubMedD. Google Scholar答案:B4. 以下哪个检索词不是同义词?()A. 计算机与电脑B. 信息与数据C. 汽车与轿车D. 书籍与书架答案:D5. 在信息检索中,以下哪个选项不是评估检索效果的指标?()A. 查全率B. 查准率C. 响应时间D. 相关性答案:D6. 以下哪个选项不是信息检索中常用的检索技术?()A. 关键词检索B. 布尔检索C. 模糊检索D. 顺序检索答案:D7. 在信息检索中,以下哪个选项不是信息检索语言的类型?()A. 主题词语言B. 分类语言C. 元数据语言D. 描述性语言答案:D8. 以下哪个选项不是信息检索中常用的检索策略?()A. 扩展检索B. 限制检索C. 精确检索D. 随机检索答案:D9. 在信息检索中,以下哪个选项不是信息检索系统的主要组成部分?()A. 用户B. 检索工具C. 检索对象D. 检索结果答案:D10. 以下哪个选项不是信息检索中常用的评价指标?()A. 准确率B. 召回率C. F1分数D. 错误率答案:D二、填空题(每题2分,共20分)1. 信息检索的目的是帮助用户从大量信息中快速、准确地找到所需的信息。

2. 信息检索的基本步骤包括:提出问题、选择检索工具、制定检索策略、实施检索、评估检索结果。

3. 信息检索中,同义词是指在特定领域内具有相同或相似意义的词。

4. 信息检索中,布尔检索是一种基于布尔逻辑的检索方法,包括AND、OR和NOT三种运算符。

信息检索期末考试题及答案

信息检索期末考试题及答案

信息检索考试题一、结合自己的检索经历,谈一谈学习信息检索的意义。

要求内容包括但不局限于“图书馆馆藏查询、期刊数据库查询、电子图书查询、学位论文查询、搜索引擎查询”的意义”(30分)新的世纪随着现代科学技术尤其是计算机技术和网络技术的迅猛发展,社会信息量激增,信息呈现出爆炸式的增长趋势,然而在信息的汪洋之中,存在着大量虚假信息和无用信息,这使得获取有用的信息资源变得越来越困难。

因此,信息检索能力已成为新时代人才的一项必备技能。

通过学习信息检索这门课程,我发现在我学习中遇到一些问题时,我又多了一种解决问题的方法,那就是利用图书馆的电子资源,若是在以前我可能更多的向老师和同学求助来解决问题,现在我可以利用图书馆馆藏查询来寻找与之相关的书籍,在学校图书馆里我们可以通过图书馆馆藏查询中的简单查询和组合查询高效快速的查询我们需要的图书,这极大地提高了我们的学习的效率,在我们学校的图书馆我们还可以通过期刊数据库查询来查找一些学术论文,例如我们常用的《中国期刊网》(CNKI),该库是目前世界上最大的连续动态更新的中国期刊全文数据库,收录国内8200多种重要期刊,在《中国期刊网》(CNKI)我们可以查询我们学校的老师发表的论文,更多的了解所学学科的动态。

除了这些我们还可以在图书馆首页电子图书类下进行电子图书查询在超星数字图书馆下载一些专业书籍,在我们毕业的时候,我们可能也需要一些资料来指导我们的论文写作,这个时候我们可以利用万方中国学位论文数据库进行学位论文查询,可以避免一些我们在写论文时容易犯的错误,给我的论文写作带来方便,有些同学可能直接利用百度搜索论文,有些论文不够专业,不过搜索引擎查询在我们确实给我们的生活带来了一些便利,当我们到了另外一个城市,我们可能不知道坐哪一路公交车找我们的同学,这时我们可以通过百度或谷歌来查询一下路线。

最后我想说学习信息检索可以增强人的信息意识,提高信息素质;作为新时代的大学生,学好信息检索将给我们的现在的学习和以后的工作提供更多的帮助。

《信息检索》期末考试试题(含答案)

《信息检索》期末考试试题(含答案)

装 订 线 装 订 线 装 订 线 装 订 线 学号: 姓名: 专业 : 年级: 学院:
封 线 密 封 线 密 封 线 密 封 线 密 题号 一 二 三 四 五 六 成绩 复核 得分
阅卷
受到专利法保护的专利类型有 、 和 。

方法有 等。

有 、 等。

传统文献信息媒体按文献信息载体形式划分,可分为印刷型、 、 、 4计算机检索的方式大致可以归纳为 、 、 、指令检索、分类检索、二次检索等几种方式。

,截词的含义是 ,的含义是 。

作者的原始创作是 次文献, 次文献仅仅是对文献的有序化加工,专利属于 次文献,综述属于 次文献,学位论文属于 次文献所学数据库中,能够检索会议文献的数据库有 、 等;能够检索学位论文的数据库有 、 。

”的含义是 。

分类检索语言的定义为 ,我国常用的分类法是 , 是国外的一种分类体系。

我校订购的中文数据库有 、 、 外文数据库有 、 、 等。

的中文全称是 ,的中文全称是 ,是 ,的英文全称是 。

请根据下图回答:①该检索界面是来自于 数据库;②该文献的题目是 ;称是 ;④该文献的第一作者是 ;否可以直接查看该文献的全文 。

装 订 线 装 订 线 装 订 线 装 订 线 学号: 姓名: 专业 : 年级: 学院:
封 线 密 封 线 密 封 线 密 封 线 密
装 订 线 装 订 线 装 订 线 装 订 线 学号: 姓名: 专业 : 年级: 学院:
封 线 密 封 线 密 封 线 密 封 线 密 引 ;。

大学信息检索考试题及答案

大学信息检索考试题及答案

大学信息检索考试题及答案一、选择题(每题2分,共20分)1. 信息检索中,布尔逻辑运算符包括哪些?A. 与、或、非B. 加、减、乘C. 只有、所有、没有D. 是、不是、可能是答案:A2. 在进行网络信息检索时,以下哪个搜索引擎是专门用于学术文献检索的?A. Google ScholarB. BingC. YahooD. Baidu答案:A3. 下列哪个数据库是用于检索期刊论文的?A. PubMedB. JSTORC. LexisNexisD. All of the above答案:D4. 在信息检索中,哪个术语指的是对信息进行分类和排序的过程?A. 索引B. 排序C. 编目D. 检索答案:A5. 以下哪个不是信息检索的步骤?A. 需求分析B. 选择检索工具C. 购买书籍D. 获取信息答案:C6. 元数据是用来描述信息资源的哪些方面?A. 内容、形式、出版信息B. 价格、作者、出版社C. 格式、大小、存储位置D. 所有上述选项答案:A7. 在信息检索中,“关键词”通常指的是什么?A. 文档的标题B. 文档中的高频词汇C. 用于检索的特定词汇或短语D. 文档的摘要答案:C8. 以下哪个工具不是用于信息检索的?A. 百度指数B. CNKI(中国知网)C. 微博热搜D. Web of Science答案:C9. 信息检索中的“查全率”是指什么?A. 检索到的相关文档数量与数据库中所有相关文档数量的比率B. 检索到的文档数量与检索工具中的文档总数的比率C. 检索到的不相关文档数量与检索到的所有文档数量的比率D. 数据库中所有相关文档数量与检索工具中的文档总数的比率答案:A10. 在信息检索中,“查准率”是指什么?A. 检索到的相关文档数量与检索到的所有文档数量的比率B. 检索到的不相关文档数量与检索到的所有文档数量的比率C. 检索到的所有文档数量与数据库中所有文档数量的比率D. 数据库中所有相关文档数量与检索到的所有文档数量的比率答案:A二、判断题(每题1分,共10分)11. 信息检索的目的是为了找到尽可能多的相关信息。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

中国科学院研究生院课程编号:71258-Z-2试题专用纸课程名称:现代信息检索
任课教师:王斌———————————————————————————————————————————————姓名学号成绩
一、判断题(正确打√,错误打X。

每题2分,共30分)
1、建立倒排索引时,只能以文件作为索引单位。

(X)
2、词项集合和词条集合有时可以完全不同,甚至交集为空集。

(√ )
3、轮排索引和k-gram索引都可以支持通配查询的处理。

(√ )
4、倒排索引的构建与所处的硬件环境息息相关。

(√ )
5、γ的编码序列唯一,但解码序列不唯一。

(X)
6、向量空间模型的计算当中,采用余弦相似度和欧氏距离得到的相似度是一致的,即两个向量的余弦相
似度大,则欧氏距离一定小,而当余弦相似度小时欧氏距离大。

(X)
7、信息检索系统中只存在一种索引结构。

(X)
8、隐式相关反馈中对用户的行为进行分析,因此一定会提高检索的效果。

(X)
9、在BM25检索模型中,考虑了文档长度对检索带来的影响。

(√)
10、在朴素贝叶斯分类器,基于多项式模型和基于贝努利模型的实现中采用了完全相同的假设。

(X)
条件独立假设+ 位置独立假设+只考虑出现位置独立假设+ 考虑不出现
11、特征选择函数MI(Expected Mutual Information)考虑了词项不存在对分类带来的影响。

(√ )
12、SVM分类的速度与支持向量的个数无关。

(X)
13、K-均值聚类算法的结果依赖于初始种子质心的选择。

(√)
14、GAAC层次聚类算法的结果具有确定性。

(√)
15、隐性语义索引LSI本质上是将原始的向量空间线性变换到另一个高维向量空间。

(X)
二、选择题(单项或多项选择。

每题2分,共16分)
1、关于倒排索引的压缩,以下叙述正确的是(A B )。

A)压缩能提高空间的利用率B)压缩能提高硬盘到内存的传输速度
C)词典压缩作用不大D)可变字节编码压缩是一种有损压缩方法2.关于向量空间模型,以下叙述正确的是(A B D )。

A)查询和文档均看成向量B)权重计算的方式很多
C)查询和文档表示成不同空间的向量D)相似度计算的方式很多
共5页第1页
3.关于隐式相关反馈,以下叙述错误的是(B )。

A)该反馈中实际上有用户参与B)该反馈后的检索效果一定会提高
C)该反馈是一种局部方法D)该反馈效果一般会低于用户相关反馈
4.关于伪相关反馈,以下叙述错误的是(A B )。

A)该反馈中实际上有用户参与B)该反馈后的检索效果一定会提高
C)该反馈是一种局部方法D)该反馈效果一般会低于用户相关反馈
5.关于kNN分类器,以下叙述错误的是(B )。

A)该分类器几乎不需要训练B)该分类器分类速度很快
C)该分类器是非线性分类器D)该分类器通常分类效果不错
6.关于Rocchio分类器,以下叙述错误的是(A B )。

A)该分类器不需要训练B)该分类器通常分类效果不错
C)该分类器训练速度很快D)该分类器分类速度很快
7.关于K-均值聚类算法,以下叙述错误的是(B D )。

A)该聚类算法要事先给定聚类数目B)该聚类算法是确定性算法
C)该聚类算法的时间复杂度是线性的D)该聚类算法能得到全局最优结果
8.关于HAC聚类算法,以下叙述错误的是(A C D )。

A)HAC必须要指定聚类数目B)HAC算法都是确定性算法
C)HAC要求文档要以向量来表示D)HAC的相似度只能采用向量内积计算
三、计算题(每题6分,共30分)
1、面对两个正确答案集合分别是Rq1={d1,d2,d3,d4,d5}及Rq2={d6,d7,d8,d9,d10 }的查询q1、q2,某个检索系统
A返回的检索结果如表1所示。

试计算出该系统对每个查询的P、R、F、P@10、AP等指标,并计算整个系统的MAP指标。

请写出计算过程并将最后结果汇总填入表2中(小数点后保留2位即可)。

其中AP计算采用未插值方法。

表1 检索结果表
共5页第2页
表2 结果汇总表
2、对于下列分别采用VB编码和γ编码的间距编码结果(第一个是原始值,后面为间隔值),请还原原始的间距
序列及倒排记录表。

(1)VB编码:00010110 10111000 10010101 00101101 00001101 10110101
00101100111000 0010101 010110100011010110101
2872, 21, 738997
2872, 2893, 741890
00010110 10111000 101100111000 2872
10010101 10101 21
00101101 00001101 10110101 10110100011010110101 738997
2872 2893 741890
(2)γ编码:1100111111100101111111111010001111110110
11001 4 + 1 =5
1111110010111 64 + 23 = 87
111111101000111 128 + 71 = 199
1110110 8 + 6 = 14 5 92 291 305
110 01 1111110 010111 11111110 1000111 1110 110
101 1010111 11000111 1110
5 87 199 14
5, 92, 291, 305
3、对于如下坐标轴上的点,请分别采用单连接、全连接和质心法HAC对这些点进行聚类,并输出聚类的树状
图。

0 1 2 3 4 5 6 7
单连接
0 1 2 3 4 5 6 7
全连接
0 1 2 3 4 5 6 7
质心法
0 1 2 3 4 5 6 7
4、假设五个网页A、B、C、D、E构成如下的链接关系,试采用如下公式(u指当前页面,B u是所有链接到u
的页面集合,N v是页面v的总链出链接数,R(u)和R(v)分别是u和v的PageRank值,为计算方便,假定c=1)计算每个网页的归一化PageRank值,即五个网页的PageRank总和为1。

R(A)=1/2 R(C) R(B)=1/3 R(A)
A
B
D C
E
R(C)=1/2 R(B)+R(D)
R(D)=1/3R(A)+1/2R(B)+1/2R(E)
R(E)=1/3R(A)+1/2R(C)
R(A)+R(B)+R(C)+R(D)+R(E)=1
解得,A=B=6/41, C=12/41, D=9/41, E=8/41
共5页第3页
5、假设有图中三角形和圆形两类数据,某个分类器在某个测试数据集上得到的分类结果如下图所示(分类器将
左图中的数据判定为三角形类,将右图中的数据判定为圆形类),分别计算该分类器在三角形和圆形这两个个类别上的正确率、召回率和F值,并计算该分类器在所有类别上的宏平均F值、微平均F值和精确率(accuracy)。

三角形类圆形类
三角形类:P=4/5=0.8, R=4/6=2/3, F=8/11=0.727
圆形类:P=5/7, R=5/6, F=10/13=0.769
MacroF=(8/11+10/13)/2=80/157=0.5222
MicroP=MicroR=MicroF=Accuracy=(4+5)/12=0.75
四、应用题(每题8分,共24分)
1、基于网页的新闻内容抽取是指从新闻网页中提取新闻标题和正文的过程(如下图所示),试应用本课程学到的
文本聚类技术实现上述过程,给出你的思路的详细步骤(内容抽取到文本聚类问题的映射、文本表示方法、相似度计算方法、聚类算法等)和过程(提示:尽量详细)。

可以根据文本之间的距离或密度定义相似度从而进行聚类。

其他方法也行。

共5页第4页
2、中文分词是将输入的中文句子切分成一个个词语的过程,如“我是中国人 我是中国人”,中文分词可
以采用无事先定义词典的方法。

试应用本课程学到的文本分类技术实现无词典的分词过程,给出你的思路的详细步骤(内容抽取到文本分类问题的映射、文本表示方法、特征选择及分类算法等)和过程(提示:尽量详细)。

一种是在每个字边界上定义连-断二类分类问题;
一种是在每个字上定义:词开始,词中部、词尾部三类分类问题。

可以根据上下文提取特征。

3、从发表内容和关注关系(结构)两个角度出发,设计一个算法来计算微博用户之间的相似度(提示:尽量详细)。

根据用户之间内容的相似度可以计算,基于两个用户的关注关系可以计算集合相似度,然后两个相似度组合起来。

共5页第5页。

相关文档
最新文档