国科大 中科院 现代信息检索 何苯 试卷 2015
大学考试试卷《文献检索与应用》及参考答案
大学考试试卷《文献检索与应用》及参考答案大学考试试卷《文献检索与应用》及参考答案文献检索与应用一、单项选择题( 本大题共70 分,共35 小题,每小题 2 分) 1. 国际标准连续性出版物编号的缩写形式为( ) A. ISBNB. ISSNC. CNKID. VIP2. 关于信息检索, 以下描述错误的是( )A. 信息检索的类型有文献检索、数据检索和事实检索B. “查看月球的年龄”的信息检索属于数据检索属于数据检索C. “班上平均成绩超过80 分的学生人数统计”D. 文献检索的目的是要检索出包含所需要信息的文献3. 从物理构成来讲, 数字资源检索系统由( ) 几部分构成 A. 软件和数据库B. 硬件、软件、数据库C. 硬件系统和软件D. 服务器和数据库4. 以下对专利的四种论述, 哪一个是错误的,A. 专利是指一个国家授予创造发明人在一定的时间内对该发明创造的独占实施权, 包括专利产品的生产、使用和销售.B. 专利有三种类型C. 专利具有独占性D. 只有新的、水平较高的, 能在工业上制造的产品或使用方法, 才可以申请专利.5. 关于人工语言描述错误的是( )A. 人工语言是根据信息检索的需要而由人工创制的B. 人工语言将同义词、近义词、相关词、多义词及缩略词规范在一起, 由人工控制C. 人工语言的维护成本不如自然语言D. 人工语言可分为分类检索语言、主题检索语言、代码检索语言6. 检索工具的类型有( )A. 目录型检索工具、题录型检索工具和索引型检索工具B. 目录型检索工具、题录型检索工具、文摘型检索工具和索引型检索工具C. 目录型检索工具、文摘型检索工具和索引型检索工具D. 目录型检索工具、题录型检索工具和索引型检索工具7. 以下四种期刊数据库哪一个不是外文期刊数据库( ), A.CNKIB. Elsevier SciencC. EBSCOhostD. IEEE/IEE8. 专利具有的特性有: ( )A. 排他性B. 地域性C. 时效性D. 以上全部9. 检索基本方法有( )A. 工具法、追溯法B. 常用法、循环法C. 工具法、追溯法、循环法D. 追溯法、循环法10. 一个完整的IPC分类号为()级A. 三B. 四C. 五D. 六), 11. 以下哪个文献不属于手写性文献(A. 手稿B. 会议记录C. 期刊D. 书信12. 关于检索工具描述错误的是( )A. 检索工具仅仅指数据库而已B. 检索工具具有存储和检索两方面的职能C. 一般由说明、目次、正文、索引和附录等几部分组成格式的不同可划分为目录型、索引型、题录型和文摘型13. 以下位置算符检索中, 哪项不属于gold (w) bowlA. gold bowlB. golden bowlC. gold bowlsD. the gold bowl14. 要在SCI 中查找重庆大学关于轻合金研究的文献D. 检索工具按著录的检索结果( ), 请问以下检索式正确的A. AD=Chongqing Univ* and TI=light alloyB. AD=Chongqing Univ and TI=light alloyC. AD=Chongqing Univ* and AU=light alloyD. AD=Chongqing Univ or TI=light alloy15. 以下关于自然语言的四种描述,描述错误的是( ), A. 自然语言检索用词是从信息内容本身抽取的B. 自然语言主要依赖于计算机自动抽词技术完成 C. 自然语言的检索效率高于人工语言D. 自然语言的标识包括关键词、题名、全文和引文16. 以下哪类文献不属于文献的出版类型分类(), A. 图书B. 期刊C. 手稿D. 技术标准17. 文献的基本要素有( )A. 知识内容和载体材料B. 知识内容、信息符号和载体材料C. 信息符号和载体材料D. 知识内容和载体材料18. 以下哪个不属于电子图书系统( )A. 方正ApabiB. CNKIC. 书生之家D. 超星电子图书19. 目前在计算机网络中最为通用和广泛接受的协议是( ) A. TCP/IP 和IEEE802协议B. FTPC. DCPD. IEEE802错误的是( ) 20. 关于电子图书的描述,A. 现有的电子图书数据库的缺点是,电子图书只能在线浏览, 不能脱机阅读B. 电子图书的出现降低了图书购买的成本C. 电子图书的出现节省了存储空间,减小了管理强度D. 电子图书, 指以数字文件形式存储的图书, 其中可以包含文本、图片、动画、声音等, 人们可以把它下载到计算机、掌上电脑或专用的手持设备上进行阅读.21. 要查找“汽车发动机的温度控制技术”课题的相关文献, 以下哪个检索式是正确的( )A. 汽车发动机or 温度控制B. 汽车发动机and 温度控制C. 汽车发动机not 温度控制D. 汽车发动机温度控制22. 关于学位论文及其数据库的描述错误的是( ) A. 学位论文研究内容新, 时代性、实用性强, 有很高的信息价值 B. 我国有学士学位论文、硕士学位论文、博士学位论文三种类型, 学位论文数据库都包含博硕学位论文和学士学位论文C. 开发学位论文数据库有利于最大限度挖掘学位论文的利用价值D. 开发学位论文数据库有利于保存和提供历史素材. 23. 关于检索系统工作原理, 以下描述错误的是( ) A. 检索系统包括信息的存储和检索两部分B. 用户检索都是一次性返回结果, 不需要反馈C. 信息的存储包括标引过程D. 检索其实匹配的过程24. 工程索引的缩写为( )A. SCIB. CSSCIC. EID. ISTP25. 文献的加工级别有( )A. 零次文献、一次文献、二次文献和三次文献B. 一次文献、二次文献和三次文献C. 一次文献和二次文献D. 零次文献和一次文献26. 以下四项检索哪一项属于数据检索( ), A. 历史成绩超过89 分的学生人数B. 查喜马拉雅山有多高C. 检索关于网络教育的文献D. 某同类产品中,那种牌号的销量最大27. 客户端/ 服务器模式简称为( )A. C/S 模式B. B/S 模式C. B/W/S 模式D. N-Tier 模式。
中国科学院大学计算机领域信息检索期末考试答案
域信息检索与利用实用技巧任课老师:李玲试题专用纸1、简答题:您在学习和研究过程中遇到下列问题时,常用哪些方法来解决?(10题,3分/小题,共30分)(1)查找期刊时,您常用的方法?答: 中文期刊一般用:中国知网、万方数据库、维普数据库等;外文期刊一般用:ACM、IEEE、Elsevier ScienceDirect、SpringerLink、ScienceOnline 、Taylor & Francis Online Journals 、Cambridge Journal等;可通过国科大图书馆进入上述网站首页,输入所需检索的期刊信息,如期刊名称、作者、发表年份等信息进行查询。
(2)查找中国科学院学位论文时,您常用的方法?答: 进入“中国科学院大学”首页→点击右下方“图书馆”→点击进入“中科院学位论文数据库”→进入检索界面,输入所需检索的论文信息,如:论文名称、作者、指导老师等。
(3)查找各国专利以及专利的被引用情况时, 您常用的方法?答:进入国家知识产权局官网“”,输入所需检索专利的发明名称、申请号、申请人(三者至少必填其一)进行检索,查看专利被引用情况。
(4)查找SCI期刊的影响因子,您常用的方法?答:通过国科大图书馆点击“ISI-SCIE”进入web of science平台查询界面,输入期刊的关键词、作者等信息,可通过“AND”进行多个关键词组合以缩小查询范围。
(5)查找标准文献时,有哪些注意事项?答:合理选择标准数据库(如中文期刊会议类检索工具选用CNKI、维普、万方等,查询专利选用国家知识产权局等数据库);注意文献的发表时间(如利用CNKI科技类期刊数据库查询只能查询1994年之后发表的文献,维普中文科技期刊库可查询1984年之后发表的文献)使用多个精确的关键字组合,以减小检索范围。
(6)文献管理时,您常用的方法?答:使用EndNote文献管理工具,进行分类管理方便后期查询。
域信息检索与利用实用技巧任课老师:李玲试题专用纸(7)获取无法直接下载的文献全文时,您常用的方法?答:可通过文献传递,向有权限的人求助;或通过查询Researchgate,付费网站获取;也可以邮件联系文献作者求助。
2015年文献检索题库整理版(含答案)
word 可自由复制编辑问题1得0 分,满分3分超星图书浏览器是[B],cnki 专用阅读器是[C],阿帕比图书浏览器是[A]A 的正确答案: ApabiReader B 的正确答案: SSReader C 的正确答案: CAJViewer 问题2得0 分,满分3 分中文社会科学引文索引的英文缩写为[B]、是由[A]大学创办的、包括的学科类别有[C]种B 的正确答案: CSSCI A 的正确答案:南京C 的正确答案: 24 问题3得2 分,满分2 分在参考文献著录时,网络资源的文献类型用[1]表示,网上电子公告的文献类型用[2]表示,网上期刊的文献类型用[3]表示,联机网上数据库的文献类型用[4]表示。
正确答案:在参考文献著录时,网络资源的文献类型用OL 表示,网上电子公告的文献类型用EB/OL 表示,网上期刊的文献类型用J/OL 表示,联机网上数据库的文献类型用DB/OL 表示。
问题4得0 分,满分2 分按从上到下的顺序选择,Science direct 数据库中,下列检索途径属于文献外部特征的有[1]、[2],属于文献内部特征的有[3]、[4]。
正确答案:按从上到下的顺序选择,Science direct 数据库中,下列检索途径属于文献外部特征的有AUT 、AFF ,属于文献内部特征的有ABS 、KEY 。
问题5得2 分,满分2 分不能进行跨库检索的是[2],能按会议举办方检索文献的数据库是[1],维普数据库中任意字段用[3]表示正确答案:不能进行跨库检索的是维普数据库,能按会议举办方检索文献的数据库是万方数据库,维普数据库中任意字段用U 表示问题6得2 分,满分2 分"《人民日报》的国内统一刊号是[1],《浙江日报》的国内统一刊号[2],杂志《读者》的国内统一刊号是[3]。
" 正确答案:"《人民日报》的国内统一刊号是CN11-0065,《浙江日报》的国内统一刊号CN33-0001 ,杂志《读者》的国内统一刊号是CN62-1118/Z 。
《文献信息检索》习题答案文献信息检索(答案)
《文件信息检索》习题答案一、单项选择题1、文件是记录有知识的(A.载体B.纸张A)C.光盘D.磁盘2、假如需要检索某位作者的文件被引用的状况,应当使用(A.分类索引 B .作者索引 C .引文索引 D .主题索引3、以下哪一种文件属于二次文件( D.)A. 专利文件B.学位论文C.会议文件D.目录C)检索。
4、纸质信息源的载体是(D)A. 光盘B.缩微平片C.感光资料D.纸张5、《中国图书室分类法》(简称《中图法》)将图书分红A.5 大多数 22 个大类大多数26个大类C.6 大多数 22 个大类大多数26个大类( A.)6、利用文件末端所附参照文件进行检索的方法是(C)A. 倒查法B. 顺查法C. 引文追忆法D. 抽查法7、广义的信息检索包含两个过程(B)A. 检索与利用B.储存与检索C.储存与利用D. 检索与报导8、中国国家标准的代码是(A)A.GB. B.CB.9、( D)A. 题录是报导文件第一版或珍藏信息为主要功能的工具。
B.索引C.文摘D.目录10、逻辑运算符包含(D)A. 逻辑与B.逻辑或C.逻辑非D.A,B 和C11、记录是对某一实体的所有下性进行描绘的结果,在全文数据库中一条记录相当于(C),在书目数据库中,一条记录相当于()A. 一条则摘,一篇完好的文件C. 一篇完好的文件,一条题录或文摘B.一条则摘,一条题录D.一条题录,一条则摘12、《中国学术期刊全文数据库》供给的文件内容特点检索门路有(B)A. 机构B.篇名/重点词/纲要C.中文刊名D.作者13、依据反应新内容的程度从大到小,以下文件种类的排序正确的选项是:( A)A.会谈论文,科技期刊,科技报告,科技图书B.科技图书,科技期刊,科技报告,会谈论文C.科技报告,会谈论文,科技图书,科技期刊D.以上都不对14、《中国科研机构数据库》、《中国科技名人数据库》属于:(B)A.书目数据库B.指南数据库C.全文数据库D.数值数据库15、以下检索工具中,主要收录化学与化工类文件的是:(D)16、国内的专利能够经过哪个数据库检索?(B)A.超星数字图书室B.万方数据C.学术期刊网17、供给检索式/ 命令行检索的利处在于:(C)A.简单记忆,简单编写B.文本形式,简单理解C.能够保留成功的检索,以便再次检索D.以上都不对18、逻辑“与”算符是用来组配( D.)。
信息检索考试题及答案
信息检索考试题及答案第一篇:信息检索考试题及答案一、名词解释0、文献及其要素“文献”是泛指“有历史价值或参考价值的图书资料。
”要素:1、构成文献内核的信息、知识、数据、事实2、载体信息、知识、数据、事实的物质载体。
3、记录信息、知识、数据、事实的符号系统。
1、专利文献专利文献是实行专利的国家、地区及国际专利组织在批审专利过程中产生的官方文件及出版物,包括专利说明书、专利权利要求书、专利公报、专利分类表、专利检索工具等。
2、三大检索系统三大检索系统是:SCI(《科学引文索引》,英文全称为Science Citation Index)是美国科学情报研究所(Institute for Scientific Information,简称ISI)出版的一部世界著名的期刊文献检索工具,其出版形式包括印刷版期刊和光盘版及联机数据库,现在还发行了互联网上Web版数据库。
EI是美国《工程索引》(TheEngineeringIndex)的简称。
EI创刊于1884年,由美国工程情报公司(EngineeringInformationCo.)出版发行。
EI是工程技术领域内的一部综合性检索工具,报道内容包括:电类、自动控制类、动力、机械、仪表、材料科学、农业、生物工程、数理、医学、化工、食品、计算机、能源、地质、环境等学科。
ISTP是IndextoScientific&TechnicalProceedings的缩写,是美国科学情报研究所的网络数据库WebofScienceProceedings中两个数据库(ISTP和ISSHP)之一。
专门收录世界各种重要的自然科学及技术方面的会议,包括一般性会议、座谈会、研究会、讨论会、发表会等的会议文献,涉及学科基本与SCI相同。
3、二次文献二次文献又称二级次文献,它是文献检索工具,能比较全面、系统地反映某个学科、专业或专题在一定时空范围内的文献线索,是积累、报道和检索文献资料的有效手段.4、受控语言受控语言是一种规范化的人工语言,包括具有较强族性检索功能的分类语言和具有较强特性检索功能的主题语言。
信息检索与利用(本科)试题及答案讲解学习
信息检索与利用(本科)试题及答案文件检索1、个人信息源又称为( B )。
A、文献信息源B、口头信息源C、生物信息源D、实物信息源2、文献是记录有知识的( A)。
A、载体B、纸张C、光盘D、磁盘3、下列哪种文献属于一次文献(A)。
A、期刊论文B、百科全书C、综述D、文摘4、下列哪种文献属于二次文献( D )。
A、专利文献B、学位论文C、会议文献D、目录5、下列哪种文献属于三次文献( C )。
A、标准文献B、学位论文C、综述D、文摘6、下列选项中属于连续出版物类型的选项有( A )。
A、人民日报B、学位论文C、科技期刊D、会议文献7、下列选项中属于特种文献类型的有( A )。
A、学位论文B、图书C、科技期刊D、标准文献8、纸质信息源的载体是( D)A、光盘B、缩微平片C、感光材料D、纸张9、《中国图书分类法》(简称《中图法》)将图书分成( A )A 5大部分22个大类B 5大部分26个大类C 6大部分22个大类D 6大部分26个大类10、《中国图书分类法》(简称《中图法》)是我国常用的分类法,要检索农业方面的图书,需要在( A )类目下查找。
A、S类目 B、Q类目 C、T 类目 D、R类目11、使用逻辑“与”是为了( B)A、提高查全率B、提高查准率C、减少漏检率D、提高利用率12、使用逻辑“或”是为了(A )A、提高查全率B、提高查准率C、缩小检索范围D、提高利用率13、利用文献末尾所附参考文献进行检索的方法是( C )A、倒查法B、顺查法C、引文追溯法D、抽查法14、至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合,称为(A )。
A、数据库B、记录C、字段D、文档15、广义的信息检索包含两个过程(B )A、检索与利用B、存储与检索C、存储与利用D、检索与报道16、要查找李平老师所发表的文章,首选途径为(A )A、著者途径B、分类途径C、主题途径D、刊名途径17、狭义的专利文献是指(C )A、专利公报B、专利目录C、专利说明书D、专利索引19、政府出版物主要包括两大类型的文献( B )A、专利与标准B、行政文件与科技文献C、图书与期刊D、档案与标准20、ISBN是( B )的缩写A、国际标准刊号 B、国际标准书号 C、连续出版物代码 D、国内统一刊号二、多选题(20分,每题2分)1、文献的构成要素( A B C )A、信息内容 B、载体材料 C、信息符号 D、纸、光盘2、下列各项哪些属于文献( A B C )A、图书、期刊B、光盘、磁盘C、光盘数据库D、纸张3、期刊论文的外部特征有( A B C D )A、文献题目B、著者C、文献出处D、主题词4、图书的外部特征有( A B C D )A、分类号B、著者C、书名D、出版社5、检索词包括规范化词和非规范化词,下列选项中属于规范化词的有( A C D )。
(完整版)信息检索期末复习题及答案
《信息检索》期末复习题及答案(仅供参考)一、判断题1.综述和百科全书属于二次文献。
(× )2.从文献检索的角度来看,一次文献是检索对象,二次文献是检索手段。
(× )3.题录、目录属于一次文献;期刊论文属于二次文献。
(× )4.主题词规范化的目的是扩大检索范围。
(√)5.在众多的信息源中,期刊是最重要的信息源。
(√ )6.核心期刊是指经常使用的期刊。
(× )7.关键词和主题词都是表征文献实质性内容的词汇,前者是经过词表规范的,后者是未经词表规范的自由词。
(×)8.《中国图书分类法》(简称《中图法》)是由分类号(代码)和类名来揭示信息的主题概念。
(×)9.题录型的检索工具,其著录项目包括题目、作者、文献出处、文摘。
()10.一项发明创造要获得专利权必须具备新颖性、创造性和实用性。
()二、选择题1、广义的信息检索包含两个过程( B )A、检索与利用B、存储与检索C、存储与利用D、检索与报道2、文献是记录有知识的()。
A、载体B、纸张C、光盘D、磁盘3、下列哪种文献属于一次文献( A )。
A、期刊论文B、百科全书C、综述D、文摘4、下列哪种文献属于二次文献( D )。
A、专利文献B、学位论文C、会议文献D、目录5、下列哪种文献属于三次文献( C )。
A、标准文献B、学位论文C、综述D、文摘6、下列选项中属于连续出版物类型的选项有(C )。
A、人民日报B、学位论文C、科技期刊D、会议文献7、下列选项中属于特种文献类型的有( D )。
A、学位论文B、图书C、科技期刊D、标准文献8、纸质信息源的载体是()A、光盘B、缩微平片C、感光材料D、纸张9、《中国图书分类法》(简称《中图法》)将图书分成( A )A、5大部分22个大类B、5大部分26个大类C、6大部分22个大类D、6大部分26个大类10、《中国图书分类法》(简称《中图法》)是我国常用的分类法,要检索农业方面的图书,需要在( A )类目下查找。
国家开放大学《科技文献检索》形考作业2参考答案
国家开放大学《科技文献检索》形考作业2参考答案1、纸质信息源的载体是()A. 感光材料B. 缩微平片C. 光盘D. 纸张2、图书馆所购买的下列数据库中可以检索期刊论文的是()A. 超星数字图书馆B. 书生之家数字图书馆C. 万方数据库资源系统D. 方正Apabi数字图书馆3、下面哪项工具是不属于书目检索范畴( )A. 《中文科技资料目录》B. 《中国期刊网全文专题数据库》C. 美国《医学索引》D. 《中国药学文摘》4、国际专利分类法等级分为()。
A. 5级B. 4级C. 6级D. 8级5、计算机文献信息检索发展的最高阶段是( )A. 国际联机检索B. 网络信息检索C. 光盘检索D. 脱机检索6、在机检中,当检索结果太少,查全率较低时,检索式可做如下调整()。
A. 减少同义词或同类相关词B. 进行扩展检索(族性检索),根据词表的分类结构体系扩展关键的检索词C. 增加限制概念,用逻辑"与"(and)将它们连接起来D. 使用适当的位置算符,排除误检,提高查准率7、下列说法中错误的是()。
A. 综述是对特定的问题利用有关的情报进行的综合性叙述;B. 综述是为了评述新知识。
C. 综述对某一特定问题从一定时间内的大量文献中摘取情报;D. 综述是研究所有问题的文章;8、根据全国科学技术名词委员会发布试用的新词的定名,Internet的规范称谓应该是()。
A. 因特网B. 互联网C. 网际网D. 万维网9、( ) 是一页书或一页文章展现在我们面前的样子,是经过检索或翻阅最后让我们仔细了解其中信息和知识的界面,是人与文献直接接触和面对以及交流的主要接口A. 文摘B. 文献C. 文本D. 索引10、美国《化学文摘》的主要特点不包括()A. 出版迅速B. 索引完备C. 摘录广泛D. 非核心期刊11、下列关于“核心期刊”叙述错误的是()A. 现在是指由《中国科技期刊引证报告》(中国科学技术信息研究所)、中国科学引文数据库、《中文核心期刊要目总览》(大学图书馆和高校图书馆期刊工作研究会)所界定的期刊。
信息检索题目(含答案)
2013 年(秋)《信息检索》练习单选题(每题1 分,共45 题,45 分)1. 计算机中使用的0与1的二进制代码是(C)A. 自然信息B. 生物信息C. 机器信息D. 人类信息2. 以下(B)不是信息的基本要素。
A. 载体B. 数据库C. 信源D. 信宿3. 国际标准书号中地区号为7,代表其是(B)出版的图书。
A. 美国B. 中国大陆C•俄语系国家D. 法语系4. 以下(D不是信息的特征。
A. 共享性B. 价值型C. 时效性D .不可扩充性5. (A)使用的是http协议。
A. WWW网络资源B. FTP 信息资源C. TELNET信息资源D. 用户服务组资源6. (B)使用的是ftp协议。
A. WWW网络资源B. FTP 信息资源C. TELNET信息资源D. 用户服务组资源7. 分类法用(A)作为文献容标识和检索标识。
A. 分类号B. 词语C. 阿拉伯数字D. 英文字母8. 主题法用(A)做描述文献主题的标识和检索标识。
正确答案:BA. 分类号B. 词语C. 阿拉伯数字D. 英文字母9. 关键词语言属于(B)正确答案:AA. 自然语言B. 标题词语言C. 叙词语言D .分类语言10. 以下族性检索功能最强的是(A)A. 分类途径B. 文献名途径C .著者途径D. 主题途径11. (D)是从参考文献着手来查找文献的方法。
A. 顺查法B. 倒查法C. 抽查法D. 追溯法12. 一个截词符代表多个字符指的是(D)正确答案:CA. 后截词B. 中截词C .无限截词D .有限截词13. 在布尔逻辑检索技术中,用(B)表示在检索结果中只需包含A或者B即可。
正确答案:DA. A not BB. A and BC. A - BD. A or B14. (B)之前,必须输入一个空格。
正确答案:CA. 与运算B. 或运算C. 非运算D. 异或运算15.ISBN 中最后一个数字代表( C)。
正确答案:DA. 地区码B. 代码C. 书序号D. 校验码16. ( B)属于文献的外表特征。
信息检索考试题汇总附答案(供参考).docx
文档来源为 :从网络收集整理.word 版本可编辑 .欢迎下载支持 .1. 专利文献根据发明创造的性质可以分为发明、实用新型和外 一、单项选择题 (从下列各题四个备选答案中选出一个正确答案, 观设计专利。
(√)并将其代号写在答题纸相应位置处。
每题 2 分,共 30 分)2. CNKI 检索系统可以检索博硕士论文。
( √ )C 1 . _ 是题录型检索工具3. Google 不具有学术搜索功能。
( × )A. CABIB. 中国学术期刊文摘C. 全国报刊索引(自然版)D. 经 ISBN ,新版国际标准书号 2007 年济纵横4. 国际标准书号的英文简称正式实施,国际标准书号由10位升至 13位。
( √ )D 2.浏览超星数字图书馆,应首先安装______.5. 检索效果的评价指标主要有查全率和漏检率。
( × )A. Apabi ReaderB. Adobe ReaderC. CAJ ViewerD. SSReaderA 3.世界上第一大联机检索系统是__。
1.NSTL 是(国家科技图书文献中心)的简称。
2. (信息检索系统)是指由一定的设备和信息集合构成,具有一 A.DIALOG 系统 B.OBRIT 系统 C.OCLC 系统 D.STN 系统B 4.定存储、检索与传送技术设备,提供一定的存贮与检索方法及检 利用 baidu 搜索信息时,要将检索范围限制在网页标题中,应该使用的语法是 _________。
索服务功能的工作系统。
3. 体系分类表通常由(类目表、标记符号、说明和注释、类目索A.site:B.intitle:C. inurl::引) 4 个部分组成。
A 5 .国际农业和生物科学中心英文名称的简称为_ 。
A.CABIB. AGRINDEXC. BAD.B of A4. 正式出版的中文期刊在检索工具和数据库中一般著录有国际标准刊号( ISSN )和国内统一刊号(CN )。
中国科学院大学现代信息检索2012年秋季期末试题及答案
中国科学院研究生院课程编号:71258-Z-2试题专用纸课程名称:现代信息检索任课教师:王斌———————————————————————————————————————————————姓名学号成绩一、判断题(正确打√,错误打X。
每题2分,共30分)1、建立倒排索引时,只能以文件作为索引单位。
(X)2、词项集合和词条集合有时可以完全不同,甚至交集为空集。
(√ )3、轮排索引和k-gram索引都可以支持通配查询的处理。
(√ )4、倒排索引的构建与所处的硬件环境息息相关。
(√ )5、γ的编码序列唯一,但解码序列不唯一。
(X)6、向量空间模型的计算当中,采用余弦相似度和欧氏距离得到的相似度是一致的,即两个向量的余弦相似度大,则欧氏距离一定小,而当余弦相似度小时欧氏距离大。
(X)7、信息检索系统中只存在一种索引结构。
(X)8、隐式相关反馈中对用户的行为进行分析,因此一定会提高检索的效果。
(X)9、在BM25检索模型中,考虑了文档长度对检索带来的影响。
(√)10、在朴素贝叶斯分类器,基于多项式模型和基于贝努利模型的实现中采用了完全相同的假设。
(X)条件独立假设+ 位置独立假设+只考虑出现位置独立假设+ 考虑不出现11、特征选择函数MI(Expected Mutual Information)考虑了词项不存在对分类带来的影响。
(√ )12、SVM分类的速度与支持向量的个数无关。
(X)13、K-均值聚类算法的结果依赖于初始种子质心的选择。
(√)14、GAAC层次聚类算法的结果具有确定性。
(√)15、隐性语义索引LSI本质上是将原始的向量空间线性变换到另一个高维向量空间。
(X)二、选择题(单项或多项选择。
每题2分,共16分)1、关于倒排索引的压缩,以下叙述正确的是(A B )。
A)压缩能提高空间的利用率B)压缩能提高硬盘到内存的传输速度C)词典压缩作用不大D)可变字节编码压缩是一种有损压缩方法2.关于向量空间模型,以下叙述正确的是(A B D )。
中科院计算机学院现代信息检索复习
第五章 特征选择与提取
• 特征选择的概念
– 所谓特征选择,就是从n个度量值集合中, 按某一准则选取出供分类用的子集,作为 降维(m维,m<n)的分类特征;
• 特征提取的概念
– 所谓特征提取,就是通过某种变换,从n个 度量值集合中产生m个特征 (m<n) ,作为新 的分类特征(或称为二次特征);
• 目的
• 第二类势函数
– 双变量的对称函数
• 实例
• 决策树简介
– 概念 – 二叉树
第四章 统计判别
• 作为统计判别问题的模式分类
– 贝叶斯判别原则 – 贝叶斯最小风险判别
• 正态分布模式的贝叶斯分类器
– M种模式类别的多变量正态类密度函数
– 两类问题且其类模式都是正态分布的特殊 情况
• 模式分布密度的协方差矩阵不等 • 模式分布密度的协方差矩阵相等 • 实例
– 普通的无指导信号的训练过程 – 一种常用的无指导学习方法
• 竞争学习,包括:
– 竞争过程的权值调整 — 最佳匹配 – 竞争过程的网络组织 — 胜者为王
– 一种典型的自组织网络
• Hamming网络
– Kohonen网络
• 网络的拓扑结构 • 网络自组织算法
第六章 人工神经网络
• 人工神经网络的应用开发设计
• 系统聚类法
– 算法
• 几种距离计算准则:最小距离准则
– 实例
• 动态聚类法
– K-均值算法
• 算法和实例
– ISODATA算法
• 基本步骤和思路 • 算法和实例
第三章 判别函数
• 线性判别函数
– 用判别函数分类的概念 – 线性判别函数的一般形式和分类问题
• 两类情况: • 多类情况:三种多类情况
(完整版)信息检索试题(有答案)
(完整版)信息检索试题(有答案)1.检索系统:由大量的数据库集合生成的数据库。
2.自然语言:未经加工和规范化处理的非受控于言。
3.二次文献:对一次文献进行加工整理后的产物,即对无序的一次文献的外部特征如题名、作者、出处等进行著录,或将其内容压缩成简介、提要或文摘,并按照一定的学科或专业加以有序化而形成的文献形式,如目录、文摘杂志(包括简介式检索刊物)等4. 主题词:是用于表述、存储、查找文献主题的受控词汇,是主题表中能表达一定意义的最基本的词汇单元。
5. 科技报告:科技报告是研究单位向主管机构和资助单位提交的关于某项科技成果的正式报告或其进展阶段的实际记录。
一般依托于国家的军事和高科技科研项目,是科研工作成果的体现,需要经过专家评审鉴定,技术上可靠性较高。
6. 体系分类语言:体系语言是以科学分类为基础,运用概念的划分与概括的逻辑方法,形成一个概念等级体系,按知识门类的逻辑次序,按照从总到分,从一般到具体,从低级到高级,从简单到复杂的原则进行概念的综分,层层划分,累累隶属,逐步展开而形成的一个等级体系。
1.当关键词具有多个含义的时容易造成误检,使得查准率较低。
2. 信息素质的内涵包括信息意识、信息能力和信息道德。
3.主题词的体现形式是叙词表。
4. 文献按其加工深度不同可分为零次文献,一次文献,二次文献和三次文献。
5.中国图书馆图书分类法简称为:中图法。
6. 连续出版物的主要类型有期刊、报纸、年底出版物。
7.标准文献的主体是技术标准。
8.当计算机访问范围受到限制时,可通过代理服务器访问外部网络。
9. 构成文献的三要素是载体、知识和记录手段。
10. 布尔逻辑运算符包括: 逻辑“或”、逻辑“与”和逻辑“非”三种。
11. 专利有三层含义:专利权、专利技术和专利文献。
12.文献的内容特征用于找出相关文献,外部特征用于获得特定文献。
13. 信息检索常用的方法有:工具法、引文法和循环法。
14. CNKI的中文全称是China National Knowledge Infrastructure。
自-2015年信息检索与利用试题及答案
信息检索与利用试卷1、分别列举搜索引擎、馆藏检索工具、文摘索引检索工具、全文检索工具、数据检索工具和专利检索工具各两个。
答:搜索引擎有:百度、雅虎馆藏检索工具:科技热点门户、国家科技文献中心文摘索引检索工具:CA、Ingenta全文检索工具:Elsevie、InfoTrac数据检索工具:SCI、EI专利检索工具:IPGET、USPTO2、文献的类型有哪些?答:按照不同的分类依据划分为以下情况:1)根据载体材料、存储技术、和传递方式划分可划分为:印刷型、缩微型、试听型和机读型文献信息源。
2)根据加工程度的不同划分可分为:一次文献信息源、二次文献信息源、和三次文献信息源。
3)根据文献信息源的内容划分可以分为:图书、期刊、报纸、科技报告、政府出版物、会议文献、专利文献、学位论文、标准文献、档案文献、产品样本。
3、试比较采用“全文”检索字段进行检索与采用“关键词”字段进行检索的差异。
全文:可以深入搜索全文中与检索词有关的内容。
关键词:输入一个字或一个词,检索程序会找出关键词字段,含有该字或词的相关文献。
在想要查全或检索结果过少时,可以采用“全文检索”,当检索结果过泛,想要精确检索结果,提高查准率时用“关键词”字段检索。
4、信息检索的基本程序是什么?答:信息检索的步骤如下:一、分析研究课题,明确检索要求课题的主题内容、研究要点、学科范围、语种范围、时间范围、文献类型等二、选择信息检索系统,确定检索途径1、选择信息检索系统的方法:(1)在信息检索系统齐全的情况下,首先使用信息检索工具指南来指导选择;(2)在没有信息检索工具指南的情况下,可以采用浏览图书馆、信息所的信息检索工具室所陈列的信息检索工具的方式进行选择;(3)从所熟悉的信息检索工具中选择;(4)主动向工作人员请教;(5)通过网络在线帮助选择。
2、选择信息检索系统的原则:(1)收录的文献信息需含盖检索课题的主题内容;(2)就近原则,方便查阅;(3)尽可能质量较高、收录文献信息量大、报道及时、索引齐全、使用方便;(4)记录来源,文献类型,文种尽量满足检索课题的要求;(5)数据库是否有对应的印刷型版本;(6)根据经济条件选择信息检索系统;(7)根据对检索信息熟悉的程度选择;(8)选择查出的信息相关度高的网络搜索引擎。
国科大现代信息检索第二次作业
国科大2013年秋季《现代信息检索》第二次作业(第六章到第十五章)以下1—16每题6分,第17题3分,共计100分。
1. 习题 6—10 考虑图6—9中的3篇文档Doc1、Doc2、Doc3中几个词项的tf 情况,采用图6—8中的idf 值来计算所有词项图6-9 习题 6—10中所使用的tf 值car 在三篇文档中的tf —idf 值分别:Doc1:27*1.65=44.55;Doc2:4*1.65=6.6;Doc3:24*1.65=39。
6 auto 在三篇文档中的tf -idf 值分别为:Doc1:3*2.08=6。
24;33*2。
08=68。
64;0*2。
08=0 insurance 在三篇文档中的tf —idf 值分别为:Doc1:0*1。
62=0;33*1.62=53。
46;29*1.62=46。
98best 在三篇文档中的tf —idf 值分别为:Doc1:14*1。
5=21;0*1。
5=0;17*1.5=25。
52. 习题 6—15 回到习题6—10中的tf—idf 权重计算,试计算采用欧氏归一化方式处理后的文档向量,其中每个向量有4维,每维对应一个词项。
Doc1=(44.55,6.24,0,21), Len(Doc1)=49。
6451对其长度归一化得到Doc1=(0。
897,0。
126,0,0.423) Doc2=(6。
6,68。
64,53.46,0),Len (Doc2)=87。
2524对其长度归一化得到Doc2=(0.076,0.787,0.613,0)Doc3=(39。
6,0,46。
98,25.5),Len (Doc3)=66。
5247对其长度归一化得到Doc3=(0.595,0,0。
706,0。
383) 3.习题 6-19 计算查询digital cameras 及文档digital cameras and video cameras 的向量空间相似度并将结果填入表6-1的空列中。
北京中国科学院大学2015年考研计算机学科综合真题
(北京)中国科学院大学2015年考研计算机学科综合真题中国科学院大学2015 年招收攻读硕士学位研究生入学统一考试试题科目名称:计算机学科综合(专业)考生须知:1.本试卷满分为 150 分,全部考试时间总计 180 分钟。
2.所有答案必须写在答题纸上,写在试题纸上或草稿纸上一律无效。
一、单项选择题:第1~40小题,每小题2分,共80分。
下列每题给出的四个选项中,只有一个选项最符合试题要求。
1.下列数据结构中,()是非线性数据结构。
A.栈 B.队列 C.二叉树 D.堆2.在非空双向循环链表中q所指的结点后插入一个由p所指的链结点的过程依次为:rlink(p)<-rlink(q); rlink(q)<-p; llink(p)<-q; ( )A. rlink(q)<-pB. rlink(llink(p))<-pC. llink(rlink(p))<-pD. rlink(rlink(p))<-p3. 若一个栈以向量V[1…n]存储,初始栈顶指针top为n+1,则下面x入栈的正确操作是()。
A.top=top+1; V[top]=x B. V[top]=x; top=top+1C. top=top-1; V[top]=xD. V[top]=x; top=top-14. 若6行5列的数组以行序为主序顺序存储,基地址为1000,每个元素占2个存储单元,则第3行第4列的元素(假定无第0行第0列)的地址是()。
A. 1040B. 1042C. 1026D. 以上答案都不对5.A[N,N]是对称矩阵,将下三角(包括对角线)以行序存储到一维数组T[N(N+1)/2] 中,则对任一上三角元素a[i][j]对应T[k]的下标k是()。
A. i(i-1)/2+jB. j(j-1)/2+iC. i(j-i)/2+1D. j(i-1)/2+16. 一棵二叉树的前序遍历序列为ABCDEFG,它的中序遍历序列可能是()。
中国科学院大学现代信息检索课后习题答案
《信息检索导论》课后练习答案王斌最后更新日期2013/9/28第一章布尔检索习题1-1 [*]画出下列文档集所对应的倒排索引(参考图1-3中的例子)。
文档1 new home sales top forecasts文档2 home sales rise in july文档3 increase in home sales in july文档4 july new home sales rise习题1-2 [*]考虑如下几篇文档:文档1 breakthrough drug for schizophrenia文档2 new schizophrenia drug文档3 new approach for treatment of schizophrenia文档4 new hopes for schizophrenia patientsa. 画出文档集对应的词项—文档矩阵;解答:breakthrough1000drug1100for1011new0111of0010patients0001schizophrenia1111treatment0010b. 画出该文档集的倒排索引(参考图1-3中的例子)。
解答:参考a。
习题1-3 [*]对于习题1-2中的文档集,如果给定如下查询,那么返回的结果是什么?a.schizophrenia AND drug解答:{文档1,文档2}b.for AND NOT (drug OR approach)解答:{文档4}习题1-4 [*] 对于如下查询,能否仍然在O(x+y)次内完成?其中x和y分别是Brutus和Caesar所对应的倒排记录表长度。
如果不能的话,那么我们能达到的时间复杂度是多少?a.Brutus AND NOT Caesarb.Brutus OR NOT Caesar解答:a.可以在O(x+y)次内完成。
通过集合的减操作即可。
具体做法参考习题1-11。
b.不能。
不可以在O(x+y)次内完成。