《信息检索导论》课后习题答案
信息检索题库+答案(终极版)
信息检索题库+答案(终极版)四川师范大学信息检索课后作业1.(第1章?单选)联合国教科文组织分别于2003年和2005年召开了以(A)为主题的世界性大会,并发布了《布拉格宣言》和《亚历山大宣言》。
A、信息素养B、信息安全C、信息检索D、信息评价2.(第1章?多选)信息素养的基本构成具体包括(ABCD)A、信息知识B、信息意识C、信息能力D、信息伦理3.(第1章?多选)信息意识具体包括(ABCD)。
A、充分认识到信息在学习、工作和生活中的重要作用,遇到问题时首先应该想到通过信息的获取和利用来解决所遇到的问题;B、对信息具有敏锐的感知力和洞察力,能高效、快速识别有价值的信息,善于从所获取的信息中找出解决问题的思路、线索或方案;C、对信息具有积极的内在需求,善于根据社会需要主动发现自身的信息需求;D、具有通过获取信息强化自身学习能力的想法和观念,遇到不懂的东西能积极主动的通过获取信息找寻答案。
4.(第1章?多选)关于信息素养教育,下列说法正确的是(ABCD)。
A、信息素养教育的第一个层次是拓展视野,使人们知道这个世界上原来还有这么多信息资源。
B、信息素养教育的第二个层次是训练信息获取能力,使人们知道如何获取所需要的信息。
C、信息素养教育的第三个层次是培养信息利用能力,使人们具有敏锐的信息意识和利用信息解决问题的能力。
D、信息素养教育的目标是培养终身学习能力,而信息素养教育自身也是一个终身学习的过程,信息素养教育与终身学习能力是一个相互促进、螺旋提升的关系。
5.(第1章?多选)信息素养是指:基于(ABC),通过确定、检索、获取、评价、管理、应用信息解决所遇到的问题并以此重构自身知识体系的综合能力和基本素质。
A、信息意识B、信息知识C、信息伦理D、信息评价6.(第1章?多选)2000年1月18日,美国大学与研究图书馆协会(ACRL)标准委员会审议通过了《高等教育信息素养能力标准》,其中包含5项标准和22项具体指标。
信息检索题库-答案(终极版)分析
信息检索题库-答案(终极版)分析四川师范大学信息检索课后作业1.(第1章•单选)联合国教科文组织分别于2003年和2005年召开了以(A)为主题的世界性大会,并发布了《布拉格宣言》和《亚历山大宣言》。
A、信息素养B、信息安全C、信息检索D、信息评价2.(第1章•多选)信息素养的基本构成具体包括(ABCD)A、信息知识B、信息意识C、信息能力D、信息伦理3.(第1章•多选)信息意识具体包括(ABCD)。
A、充分认识到信息在学习、工作和生活中的重要作用,遇到问题时首先应该想到通过信息的获取和利用来解决所遇到的问题;B、对信息具有敏锐的感知力和洞察力,能高效、快速识别有价值的信息,善于从所获取的信息中找出解决问题的思路、线索或方案;C、对信息具有积极的内在需求,善于根据社会需要主动发现自身的信息需求;D、具有通过获取信息强化自身学习能力的想法和观念,遇到不懂的东西能积极主信息评价6.(第1章•多选)2000年1月18日,美国大学与研究图书馆协会(ACRL)标准委员会审议通过了《高等教育信息素养能力标准》,其中包含5项标准和22项具体指标。
下列属于5项标准的是(ABCD)。
A、具有信息素养的学生能够确定所需信息的性质和范围B、具有信息素养的学生能够有效和高效地获取所需信息C、具有信息素养的学生能评价信息及其来源并将选取的信息整合入其知识基础和价值体系中D、具有信息素养的学生,不论是个人或作为小组成员,都能够有效地利用信息达到特定的目的7.(第1章•单选)"information literacy "一般翻译为(B)。
A、信息检索B、信息素养C、信息安全D、信息评价8.(第1章•单选)(D)是指在信息的生产、存储、获取、传播和利用等信息活动各个环节中,用来规范相关主体之间相互关系的法律关系和道德规范的总称。
A、信息知识B、信息能力C、信息意识D、信息伦理9.(第1章•单选)(C)是指人类对信息需求的自我意识,是人类在信息活动中产生的认识、观念和需求的总和。
信息检索答案
1、信息素养或素质的具体内容有那些?答:信息素质是指用户在利用以计算机及其网络技术为代表的现代科学技术进行知识学习、成长的过程中,逐步形成的制动参与信息活动、自觉应用信息技术的意识、态度、理念及具备的获取、识别、加工、处理、传递、创造信息的能力和利用信息去解决实践问题的能力。
它包括强烈的信息意识、系统化的信息理念、综合信息能力等内容。
2、信息、知识、情报、文献的概念?文献的组成要素?答:信息的概念:1、信息是人们根据一定目的和需要,把从自然现象和社会现象中搜集的原始材料进行加工、处理,找出其中关系而形成的对象实体。
2、信息是有一定含义的、经过加工处理的、对决策有价值的的数据,即信息=数据+处理3、信息是人们对数据进行系统组织、整理和分析,使其产生相关性,但没有与特定用户行动相关性的实体对象,信息可以被数字化。
知识的概念:知识是指人们在认识世界、改造世界中所获得的认知,包括通过阅读、学习等方式的认知和通过自己或他人的历练所积累的一切经验的总结。
情报的概念:是被人们所利用的信息、被人们感受并可交流的信息。
文献的概念:是记录有知识的一切载体。
文献的组成要素:不但包括现代图书馆的全部馆藏,同时也包括了档案馆、博物馆、声像馆和情报中心收藏的全部馆藏。
3、信息、信息资源包括那些类型?答:1)信息的类型:从产生信息的客体的性质来分,可分为自然信息(瞬时发生的声、光、热、电、形形色色的天气变化、缓慢的地壳运动、天体演化……)、生物信息(生物为繁衍生存而表现出来的各种形态和行为,如遗传信息、生物体内信息交流、动物种群内的信息交流)、机器信息(自动控制系统)和(人类)社会信息。
以信息所依附的载体为依据,可分为文献信息、口头信息、电子信息、生物信息等2)信息资源类型:根据存储媒介不同,信息资源可以划分为印刷型信息资源、电子信息资源、数字信息资源和多媒体信息资源。
4、文献有那些类型?将文献划分成这些类型的依据是什么?答:1)根据载体材料、存储技术、和传递方式划分可划分为:印刷型、缩微型、试听型和机读型文献信息源2)根据加工程度的不同划分可分为:一次文献信息源、二次文献信息源、和三次文献信息源3)根据文献信息源的内容划分可以分为:图书、期刊、报纸、科技报告、政府出版物、会议文献、专利文献、学位论文、标准文献、档案文献、产品样本5、信息(文献)检索的方法与途径,详细论述检索步骤?答:1、分析研究课题,明确检索要求:分析课题的主要内容、确定课题的文献类型、确定检索时间范围、分析用户的检索评价要求2、选择检索工具:根据检索课题的要求,选择最能满足检索要求的检索工具书,不同的资料类型就应该选用不同的数据库3、确定检索策略:确定检索途径、制定检索策略4、调整检索方案:确定了具体的检索方法之后,就要利用所用数据库,在一定的年代范围内具体查找,以获得文献线索。
《信息检索技术》书中答案
《信息检索技术》书后习题及参考答案(部分)第1章绪论【综合练习】一、填空题1.文献是信息的主要载体,根据对信息的加工层次可将文献分为_________文献、__________文献、___________文献和___________文献。
2.追溯法是指利用已经掌握的文献末尾所列的__________,进行逐一地追溯查找_________的一种最简便的扩大情报来源的方法。
3.用规范化词语来表达文献信息__________的词汇叫主题词。
主题途径是按照文献信息的主题内容进行检索的途径,利用能代表文献内容的主题词、关键词、叙词、并按字顺序列实现检索。
4.计算机信息检索过程实际上是将___________与____________进行对比匹配的过程。
5.无论是手工检索还是计算机检索,都是一个经过仔细地思考并通过实践逐步完善查找方法的过程。
检索过程通常包含以下几个步骤_________、__________、__________、__________、_________。
6.检索工具按信息加工的手段可以分文__________、____________、___________。
7.《中国图书馆图书分类法》共分___________个基本部类,下分________个大类。
8.索引包括4个基本要素:索引源、___________、___________、和出处指引系统。
答案1.零次,一次,二次,三次2.参考文献,引文3.内容特征4.检索提问词,文献记录标引词5.分析课题,选择检索工具,确定检索途径及检索式,进行检索,获取原文6.手工检索工具,机械检索工具,计算机检索工具7.五,228.索引款目,编排方法二、判断题1.在检索信息时,使用逻辑符“AND”可以缩小收缩范围。
()2.逆查法是由近及远地查找,顺着时间的顺序利用检索工具进行文献信息检索的方法。
()3.按编制方法划分,信息检索工具可以分为:手工检索工具、机械检索工具、计算机检索工具。
信息检索题目(含答案)
信息检索题目(含答案)2013 年(秋)《信息检索》练习单选题(每题 1 分,共 45 题, 45 分)1.计算机中使用的0 与 1 的二进制代码是(C)A.自然信息B.生物信息C.机器信息D.人类信息2.以下( B)不是信息的基本要素。
A.载体B.数据库C.信源D.信宿3.国际标准书号中地区号为7,代表其是(B)出版社出版的图书。
A.美国B.中国大陆C.俄语系国家D.法语系4.以下( D)不是信息的特征。
A.共享性B.价值型C.时效性D.不可扩充性5.( A )使用的是http 协议。
A.WWW 网络资源B.FTP 信息资源C.TELNET 信息资源D.用户服务组资源6.( B )使用的是ftp 协议。
A.WWW 网络资源B.FTP 信息资源C.TELNET 信息资源D.用户服务组资源7.分类法用( A )作为文献内容标识和检索标识。
A.分类号B.词语C.阿拉伯数字D.英文字母8.主题法用( A )做描述文献主题的标识和检索标识。
正确答案: BA.分类号B.词语C.阿拉伯数字D.英文字母9.关键词语言属于( B )正确答案: AA.自然语言B.标题词语言C.叙词语言D.分类语言10.以下族性检索功能最强的是(A)A.分类途径B.文献名途径C.著者途径D.主题途径11.(D )是从参考文献着手来查找文献的方法。
A.顺查法B.倒查法C.抽查法12.一个截词符代表多个字符指的是(D)正确答案: CA.后截词B.中截词C.无限截词D.有限截词13.在布尔逻辑检索技术中,用(B)表示在检索结果中只需包含A 或者B 即可。
正确答案: DA. A not BB. A and BC.A-BD. A or B14.( B )之前,必须输入一个空格。
正确答案: CA.与运算B.或运算C.非运算D.异或运算15.ISBN 中最后一个数字代表(C)。
正确答案: DA.地区码B.出版社代码C.书序号D.校验码16.( B )属于文献的外表特征。
信息检索题目(含答案)概述
A.分类号
B.词语
C.阿拉伯数字
D.英文字母
8.主题法用(A)做描述文献主题的标识和检索标识。
正确答案:B
A.分类号
B.词语
C.阿拉伯数字
D.英文字母
9.关键词语言属于(B)
正确答案:A
A.自然语言
B.标题词语言
C.叙词语言
D.分类语言
10.以下族性检索功能最强的是(A)
A.分类途径
B.文献名途径
C.著者途径
D.主题途径
11.(D)是从参考文献着手来查找文献的方法。
A.顺查法
B.倒查法
C.抽查法
D.追溯法
12.一个截词符代表多个字符指的是(D)
正确答案:C
A.后截词
B.中截词
C.无限截词
D.有限截词
13.在布尔逻辑检索技术中,用(B)表示在检索结果中只需包含A或者B即可。
正确答案:C
A.书名
B.主题词
C.丛书名
D.出版社
37.在我校图书馆的OPAC中查询“《傲慢与偏见》”应该选择检索途径:(A)
A.书名
Bபைடு நூலகம்主题词
C.丛书名
D.责任者
38.下面哪一项不是工具书的共同特性(A)
A.必读性
B.概括性
C.查考性
D.易检性
39.我国现存最大的类书是:(A)
A.《古今图书集成》】
A.专利文献
B.学位论文
C.会议文献
D.目录
20.下列哪种属于三次文献(A)
正确答案:C
A.标准文献
B.学位论文
C.综述
D.目录
21.CJFD是(D)。
信息检索课后答案
作业习题《信息检索》思考题及参考答案(根据新编教学大纲内容选答)第一讲信息检索基础知识1.简述大学图书馆的地位和作用。
大学图书馆是大学的文献信息中心,是为教学和科研服务的学术性机构,是学校信息化和社会信息化的重要基地。
高等学校图书馆的工作是学校教学和科学研究工作的重要组成部分。
现代化的大学图书馆与学校高水平的教师队伍、先进的教学实验设备,共称为现代化大学的三大支柱。
大学图书馆既是是学校的文献信息中心又是学习资源中心,是培养人才的重要基地,是自学深造的场所,是学生构建合理知识结构的第二课堂。
2.简述信息、知识、文献的概念及相互关系。
答:信息的概念:一般来说,信息是指与客观事物相联系,反映客观事物的运动状态,通过一定的物质载体被发出、传递和感受,对接受对象的思维产生影响并用来指导接受对象的行为的一种描述。
从本质上说,信息是反映现实世界的运动、发展和变化状态及规律的信号与消息。
知识的概念:知识是人类通过信息对自然界、人类社会以及思维方式与运动规律的认识和掌握,是人的大脑通过思维重新组合的系统化的信息的集合。
知识是人类在改造客观世界的实际中所获得的认识和经验的总和,是信息的一部分,是一种特定的人类信息。
文献的概念:文献是记录有知识的一切物质载体。
具体地说是用文字、图形、符号、声频、视频等技术手段记录人类知识的一切物质载体。
信息、知识和文献之间的关系是:信息是事物发出的消息,信息经过人脑加工形成知识。
只有将自然现象和社会现象的信息经过加工,上升为对自然和社会发展客观规律的认识,这种再生信息才构成知识。
知识信息被记录在载体上就形成文献。
3.何谓信息资源?网络信息资源有何特点?所谓信息资源,就是信息的来源。
各种客观存在的、可供人们直接或间接开发与利用的信息的集合总称为信息资源。
网络信息资源具有数量大、类型多、多媒体、非规范、跨时间、跨地域、跨行业、多语种等特点。
正式出版物和非正式信息交流交织在一起,使传统的人类信息交流链的格局被打破,各方在网络上既可以是信息的生产者、发布者,也可以是传播者和使用者,对学术交流环境和信息利用产生了深刻的影响。
信息检索练习题及答案(五篇范文)
信息检索练习题及答案(五篇范文)第一篇:信息检索练习题及答案《信息检索》练习题第一章练习一、名词解释1.信息——是世界上一切事物的状态和特征的反映,是用文字、数据或信号等形式,通过一定的传递和处理,来表现各种相互联系客观事物在运动变化中所具有特征内容的总称。
2.信息资源——是指经过人类的选取、组织、序化等整理与开发后的信息的集合。
3.白色文献——是指公开出版发行的、通过正常渠道可以得到的常规文献。
二、填空题1.信号只是信息的(),信息是信号所载荷的()。
载体、内容2.现实的信息资源依据传递信息的载体和表述方式的不同,可以划分为(),(),(),(),()。
口语信息资源、体语信息资源、文献信息资源、实物信息资源、网络信息资源3.口语信息资源、体语信息资源和实物信息资源,通过计算机技术的转化,成为(),如果有长期开发的价值,往往会转化成()。
网络信息资源、文献信息资源4.()是记录有信息和知识的一切有形载体,是将知识用文字、符号、图像、音频、视频等方式记录在一定的固态物质载体的结合体。
文献5.期刊按内容和性质划分,可以分为(),(),()。
学术性期刊、检索性期刊、其他类型期刊6.()是指未经出版发行的或未以公开形式进入社会交流的最原始的文献。
零次文献三、判断题1.情报只是一类专门的信息,是信息的一个子集。
()2.网络信息资源也称虚拟信息资源,是指以数字化形式记录的,以多媒体形式表达的,存储在网络计算机磁介质、光介质以及各类通讯介质上的。
()3.机读型文献是以磁性材料为存储介质,采用计算机技术、磁性存储技术、激光技术,以键盘输入、文件拷贝、刻录或光学扫描等方法作为记录手段,通过计算机处理而产生的一种新的文献。
()4.缩微型文献是以印刷型文献为母本,以感光材料为载体,采用光学缩微技术将文字或图像记录存储在感光材料上而形成的文献。
()5.声像型文献是一种以磁性和光学材料为载体,将声音和图像记录存储在磁性或光学材料上的非文字形式的文献。
信息检索题目(含答案)
2013 年(秋)《信息检索》练习单选题(每题1 分,共45 题,45 分)1. 计算机中使用的0与1的二进制代码是(C)A. 自然信息B. 生物信息C. 机器信息D. 人类信息2. 以下(B)不是信息的基本要素。
A. 载体B. 数据库C. 信源D. 信宿3. 国际标准书号中地区号为7,代表其是(B)出版的图书。
A. 美国B. 中国大陆C•俄语系国家D. 法语系4. 以下(D不是信息的特征。
A. 共享性B. 价值型C. 时效性D .不可扩充性5. (A)使用的是http协议。
A. WWW网络资源B. FTP 信息资源C. TELNET信息资源D. 用户服务组资源6. (B)使用的是ftp协议。
A. WWW网络资源B. FTP 信息资源C. TELNET信息资源D. 用户服务组资源7. 分类法用(A)作为文献容标识和检索标识。
A. 分类号B. 词语C. 阿拉伯数字D. 英文字母8. 主题法用(A)做描述文献主题的标识和检索标识。
正确答案:BA. 分类号B. 词语C. 阿拉伯数字D. 英文字母9. 关键词语言属于(B)正确答案:AA. 自然语言B. 标题词语言C. 叙词语言D .分类语言10. 以下族性检索功能最强的是(A)A. 分类途径B. 文献名途径C .著者途径D. 主题途径11. (D)是从参考文献着手来查找文献的方法。
A. 顺查法B. 倒查法C. 抽查法D. 追溯法12. 一个截词符代表多个字符指的是(D)正确答案:CA. 后截词B. 中截词C .无限截词D .有限截词13. 在布尔逻辑检索技术中,用(B)表示在检索结果中只需包含A或者B即可。
正确答案:DA. A not BB. A and BC. A - BD. A or B14. (B)之前,必须输入一个空格。
正确答案:CA. 与运算B. 或运算C. 非运算D. 异或运算15.ISBN 中最后一个数字代表( C)。
正确答案:DA. 地区码B. 代码C. 书序号D. 校验码16. ( B)属于文献的外表特征。
(完整word版)《信息检索导论》课后习题答案
《信息组织与检索》作业答案第一章布尔检索习题1-2考虑如下几篇文档:文档1 breakthrough drug for schizophrenia文档2 new schizophrenia drug文档3 new approach for treatment of schizophrenia文档4 new hopes for schizophrenia patientsa. 画出文档集对应的词项—文档矩阵;b. 画出该文档集的倒排索引(参考图1-3中的例子)。
Term-Documentmatrix:1 2 3 4approach 0 0 1 0breakthrough 1 0 0 0drug 1 1 0 0for 1 0 1 1hopes 0 0 0 1new 0 1 1 1of 0 0 1 0patients 0 0 0 1schizophrenia 1 1 1 1treatment 0 0 1 0Inverted Index:approach -> 3breakthrough ->1drug ->1->2for ->1->3->4hopes ->4new ->2->3->4of ->3patients ->4schizophrenia ->1->2->3->4treatment >3注意:倒排索引中的词表(dictionary)和每个词项的倒排列表(posting list)需要排序,便于查找。
这里我们暂不考虑词的正规化处理(如hopes->hope)。
补充习题1写出AND查询的伪代码面向过程风格的伪代码:给定两个指针p1和p2,分别指向两倒排列表list1和list2(链表实现)的首元素;令docId(p1)表示p1所指向的元素的docId查询结果存放在answer列表里。
这里应用了“化归”思想(将新问题转化归为旧问题来解决)。
信息检索题目(含答案)
B.数据库
C.信源
D.信宿
3.国际标准书号中地区号为7,代表其是(B)出版社出版的图书。
A.美国
B.中国大陆
C.俄语系国家
D.法语系
4.以下(D)不是信息的特征。
A.共享性
B.价值型
C.时效性
D.不可扩充性
5.(A)使用的是http协议。
A.WWW网络资源
B.FTP信息资源
C.TELNET信息资源
正确
73.OPAC是指公共联机书目查询系统。(对)
正确
74.目前我校图书馆的新书集中放置在流通01。(错)
正确答案:对
75.词典可分为语文类词典和知识类词典。(错)
正确答案:对
76.百科全书的正文由条目组成。(对)
正确
77.可以通过《全国总书目》及时了解我国图书出版情况。(对)
正确答案:错
78.索引既可以作为一种独立检索工具,也可作为其他检索工具的辅助部分。(对)
B.一次文献
C.二次文献
D.三次文献
3.学位论文是(
错误正确答案:B
A.零次文献
B.一次文献
C.二次文献
D.三次文献
4.J是(C)的文献类型代码。正确答案:B
A.学位论文
B.期刊
C.专著
D.报纸
5.N是(D)的文献类型代码。
A.学位论文
B.期刊
C.专著
D.报纸
6.M是(C)的文献类型代码。
A.学位论文
C.非
D.与
30.利用CNKI数据库,检索我校教师“宋惠兰”在2008年到2012年发表在核心期刊上的文献篇数为(A)。
正确答案:B
A.9
B.7
信息检索简答题答案
信息检索简答题答案第一篇:信息检索简答题答案信息检索简答题答案1.1 什么是信息,信息具有哪些基本特点。
答:信息就是事物存在的方式和运动状态及其规律的表征,是事物的一种普遍属性。
信息的基本特点:1.客观性2.时效性3.传递性4.共享性1.2 计算机信息检索有哪些基本特点答:1.检索速度快2.检索途径多3.更新快4.资源共享5.检索更方便、灵活6.检索结果可直接输出3.1Internet信息资源有哪些基本特点答:1.信息源丰富多样2.以多媒体为信息表现形式3.信息交互性强4.信息开放性好5.信息组织的局部有序性与整体无序性3.2什么是搜索引擎?常见的搜索引擎有哪些?答:搜索引擎是指根据一定的策略,运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,为用户提供检索服务的系统,常见的搜素引擎Google、雅虎、AltaVista、Alltheweb、Inktomi3.5为了提高检索效率,检索时应遵守哪些检索策略?答:1.对课题进行仔细分析,明确检索要求2.根据检索课题的要求、检索工具的特点等,选择检索工具3.选择检索途径和检索方法,确定检索词或检索式4.实施信息检索5.获取原始文献4.1运算符*和+的基本含义和作用是什么答:AND也可用*表示,是用来组配不同的概念的检索词,是一种概念相交和限定关系的组配。
其基本作用是对检索范围加以限定,逐步缩小检索范围,提高检索结果的查准率。
OR也可用+表示,是用来组配具有同义或同族概念的检索词。
其基本作用是扩大检索范围,增加命中文献量,提高文献的查全率。
5.1三大检索工具是什么各有什么特点答:1.SCI(科学引文索引)2.ISTP(科技会议录索引)3.EI(工程索引)科学引文索引:自然科学领域,基础理论学科方面的期刊文摘索引数据库,工程索引:主要收录工程技术领域的论文从索引的编排方式来看,SCI属于关系索引,同时兼具形式索引和类容索引的特征,ISTP和EI具有形式索引和类容索引的特征5.2简述SCI高级检索的基本过程答:7.1简述科技论文的常见形式答:学术论文、科技报告、专题研究论文、学位论文、简报综述、评论、设计计算、理论分析和理论推导 7.2科技论文由哪些部分组成答:科技论文一般由标题、作者、摘要、关键词、引言、材料与方法、结果、讨论、结论等部分组成。
信息检索参考答案
一、选择题1、字段代码JN、DE、TI分别代表(A )50页A·刊名字段、主题字段、标题字段B·文摘号、文献类型、文摘字段C·分类号、机构来源、公司2、在信息检索技术中,算符AND、OR、NOT指的是哪一中信息检索技术方法(C )A、截词检索B、位置检索C、布尔检索3、在主题语言中,不能再分解的、最小的并经过规范化处理的词语是( D )A 关键词语言B标题语言C 叙词语言 D单元词语言3、查找“中国计算机学会”的有关资料使用下列那种工具书?(A )A、《学术世界》B、《世界知识年鉴》C、《世界地名录》4、在主题语言中,不能再分解的、最小的并经过规范化处理的是(D)A、关键词语言B、标题语言C、叙词语言D、单元词语言5、中国高等教育文献保障体系的英文简称是( C )A. OCLCB. CALISC. CERNET6、全文搜索引擎以( B )检索为主。
A网站B网页C网页全文6、布尔逻辑算符构造的检索提问式“A-B”的检索结果是( A )A 只含有A 的文献B 不含B的文献C 同时含有A和B的文献D 含有A而不含B的文献7、自然语言检索标识包括下列那一组选项( C )A、类号、类名B标题词、叙词C、著者姓名、题名8、三次文献是在合理利用二次文献的基础上,对一次文献内容进行归纳综合撰写的专著。
下列属于三次文献的是( C )A报纸、教材、期刊目录B图书、专利、产品资料C手册、述评、进展报告9、根据检索的目的和要求,信息检索常用的方法可分为( B )三种:A合取法、交替法、限定法B直接法、追溯法、综合法C排除法、跟踪法、引文法10、就书目而言,下列何种书目为推荐书目( C )A全国总书目全国新书目B馆藏目录专题目录C每周新书目中外名著目录11、字段代码AU、AB、 PY所代表的字段是(B)A标题、注释、文摘类型B著者、文摘、出版年C叙词、分类、语言12、手册的别称很多,下列正确的一组是(A)A指南、须知、便览B大全、提要、综录C题记入门、必备手册的别称很多有指南、便览、大全、必备、须知、入门等。
信息检索导论课后答案
信息检索导论课后答案【篇一:信息检索导论王斌译第一章课后习题答案】casts 1 1home 4 1 2 3 4in2 2 3increase 1 3july3 2 3 4new2 1 4rise2 2 4sales4 1 2 3 4top1 1把所有文档中的词抽取,按顺序排序。
倒排记录也要按顺序排列,文档频率(几个文档中出现该词)要写习题 1-2a题1234approach 0 0 1 0breakthrough1 0 0 0drug 1 1 0 0for 1 0 1 1hope 0 0 0 1new 0 1 1 1of0 0 1 0patient 0 0 0 1schizophrenia1 1 1 1treatment0 0 1 0矩阵行是词,按顺序排列;列方向是文档编号。
某文档出现某词,相应位置填 1,否则填 0 b 题approach 1 3breakthrough 1 1drug 2 1 2for3 1 3 4hope 1 4new3 2 3 4of1 3patient 1 4schizophrenia 4 1 2 3 4treatment 1 3习题 1-71. kaleidoscope or eyes87009+2133122. marmalade or skies 107913+2716583. tangerine or trees46653+316812按估计的记录个数,从小到大的顺序124113145173174p2 31 54 101q11 2 4 11 31 45 54 101 173 174相等把文档编号添加到结果集,两个一起往后移;不相等小的往后移习题 1-10answer -while p1!=nil or p2!=nildo if docid(p1)=docid(p2)then add(answer,docid(p1))p1-next(p1)p2-next(p2)else if docid(p1)docid(p2)add(answer,docid(p1))p1-next(p1)elseadd(answer,docid(p2))p2-next(p2) return answer【篇二:信息检索导论-王斌第三次课后作业 (13-21) 】xt>1 、习题 13-2答: (i) 贝努利模型:三个文档具有相同的模型表示(ii) 多项式模型:文档 1 和文档 2 相同,文档 3 与它们都不同。
信息检索题目(含答案解析)
2013年(秋)《信息检索》练习单选题(每题1分,共45题,45分)1.计算机中使用的0与1的二进制代码是(C)A.自然信息B.生物信息C.机器信息D.人类信息2.以下(B)不是信息的基本要素。
A.载体B.数据库C.信源D.信宿3.国际标准书号中地区号为7,代表其是(B)出版社出版的图书。
A.美国B.中国大陆C.俄语系国家D.法语系4.以下(D)不是信息的特征。
A.共享性B.价值型C.时效性D.不可扩充性5.(A)使用的是http协议。
A.WWW网络资源B.FTP信息资源C.TELNET信息资源D.用户服务组资源6.(B)使用的是ftp协议。
A.WWW网络资源B.FTP信息资源C.TELNET信息资源D.用户服务组资源7.分类法用(A)作为文献内容标识和检索标识。
A.分类号B.词语C.阿拉伯数字D.英文字母8.主题法用(A)做描述文献主题的标识和检索标识。
正确答案:BA.分类号B.词语C.阿拉伯数字D.英文字母9.关键词语言属于(B)正确答案:AA.自然语言B.标题词语言C.叙词语言D.分类语言10.以下族性检索功能最强的是(A)A.分类途径B.文献名途径C.著者途径D.主题途径11.(D)是从参考文献着手来查找文献的方法。
A.顺查法C.抽查法D.追溯法12.一个截词符代表多个字符指的是(D)正确答案:CA.后截词B.中截词C.无限截词D.有限截词13.在布尔逻辑检索技术中,用(B)表示在检索结果中只需包含A或者B即可。
正确答案:DA. A not BB. A and BC. A - BD. A or B14.(B)之前,必须输入一个空格。
正确答案:CA.与运算B.或运算D.异或运算15.ISBN中最后一个数字代表(C)。
正确答案:DA.地区码B.出版社代码C.书序号D.校验码16.(B)属于文献的外表特征。
正确答案:AA.题名B.主题词C.关键词D.分类号17.广义的信息检索的全过程包括文献信息的(B)两个过程。
《信息检索》总复习思考题参考答案
《信息检索》总复习思考题参考答案《信息检索》总复习思考题参考答案一、单选题1.下列属于布尔逻辑算符的是(D)。
A、与B、或C、非D、以上都是2、信息素养的核心是(C).A、信息意识;B、信息知识;C、信息能力;D、信息道德3、20世纪70年代,联合国教科文组织提出:人类要向着( B )发展.A、终身学习;B、学习型社会;C、创新发展;D、信息素质4.参考文献的标准著录格式是( A )。
A、著者篇名来源出处;B、篇名著者来源出处5.哪一种布尔逻辑运算符用于交叉概念或限定关系的组配?( A )。
A.逻辑与()B.逻辑或(OR) C.逻辑非(NOT)D.逻辑与和逻辑非6.根据国家相关标准,文献的定义是指“记录有关( C )的一切载体。
”A.情报 B.信息. C.知识 D.数据7、( D )是指通过文献信息资料的主题内容进行检索的途径。
A.题名检索途径B.作者检索途径C.分类检索途径D.主题检索途径8、搜索含有“data bank”的PDF文件,正确的检索式为:( A )A."data bank" filetype:pdf B.data and bank and pdfC. “data bank”filetype;pdfD. “data bank ”pdf9、毕业论文答辩的一般程序是( B )①学生答辩②学生作说明性汇报③毕业答辩小组提问④评定成绩A.③④②① B.②③①④ C.③②①④ D.②③①④10、下列文献中属于哪类属于一次文献(C )?A.文摘 B.索引 C.科技报告 D.题录11、从文献的( B )角度区分,可将文献分为印刷型、电子型文献。
A.内容公开次数 B.载体类型. C.出版类型 D.公开程度12、按照出版时间的先后,应将各个级别的文献排列成( C )A.三次文献、二次文献、一次文献B.一次文献、三次文献、二次文献C.一次文献、二次文献、三次文献 D.二次文献、三次文献、一次文献13、利用文献后面所附的参考文献进行检索的方法称为( A )。
《信息检索导论》课后习题答案
《信息组织与检索》作业答案第一章布尔检索习题1-2考虑如下几篇文档:文档1 breakt hrough drug for schizo phren ia文档2 new schizo phren ia drug文档3 new approa ch for treatm ent of schizo phren ia文档4 new hopesfor schizo phren ia patien tsa. 画出文档集对应的词项—文档矩阵;b. 画出该文档集的倒排索引(参考图1-3中的例子)。
Term-Docume ntmat rix:1 2 3 4approa ch 0 0 1 0breakthroug h 1 0 0 0drug 1 1 0 0for 1 0 1 1hopes0 0 0 1new 0 1 1 1of 0 0 1 0patien ts 0 0 0 1schizophren ia 1 1 1 1treatm ent 0 0 1 0Invert ed Index:approa ch -> 3breakt hroug h ->1drug ->1->2for ->1->3->4hopes->4new ->2->3->4of ->3patien ts ->4schizo phren ia ->1->2->3->4treatm ent >3注意:倒排索引中的词表(dictio nary)和每个词项的倒排列表(p ostin g list)需要排序,便于查找。
这里我们暂不考虑词的正规化处理(如hopes->hope)。
补充习题1写出AND查询的伪代码●面向过程风格的伪代码:给定两个指针p1和p2,分别指向两倒排列表list1和list2(链表实现)的首元素;令docId(p1)表示p1所指向的元素的docId查询结果存放在ans wer列表里。
信息检索题目答案
4、信息检索在发展过程中经历了那些阶段?20世纪中期以前,手工式阶段20世纪中期,机械式阶段3、试分析布尔模型的优缺点•缺点–开始时需要猜想把文档分为相关和不相关的两个集合,一般来说很难–实际上这种模型没有考虑关键词在文档中的频率(因为所有的权重都是二值的)–假设关键词之间相互独立第03章文本索引和搜索1、什么是索引?建立索引的目的是什么?常用的索引技术有哪些?–索引是一种数据结构,它在关键词与包含关键词的文档之间建立了一种映射关系,从而加快检索的速度。
•建立索引的目的–加快检索速度•常用的索引技术–倒排索引–后缀数组–签名文件2、什么是倒排索引•倒排索引–也称倒排文档,是从关键词快速查询到文档的索引结构。
文档正常表示为关键词的集合,建立倒排索引是把每个关键词表示为其所在文档的集合,这个过程称为inversion,即倒排。
3、倒排索引的记录表中可以存放哪些内容?•位置信息–形式上:序号或指针–内容上:文档、段落、句子、词•附加信息–特殊位置信息:所在单元(标题、小标题)–权重信息4、倒排索引的建立方法有哪些?各方法具体如何实现?•基于排序的倒排文档建立方法•步骤–在文档中抽取关键词,并在其后附上其文档编号。
即表示成<单词,文档编号>的形式–对抽出的关键词进行排序,使之便于归并相同关键词–对相同关键词进行归并,把合并后的关键词放入倒排文档的词汇表。
统计每一关键词的文档频率作为目长,把每一关键词后的记录号顺序放在记录表中•基于合并的倒排文档建立方法算法–①逐个读取文档,在内存中使用动态数据存储结构(如动态数组、链表等)保存索引,直到占用的内存大小超过一定的阈值为止–②将生成的临时索引结构转存到磁盘,并清空内存–③如果所有文档处理完毕,则转到④;否则,转到①记录表中一般用16位或32位整数表示文档和单词位置的绝对编号,16位容易溢出而32位浪费空间。
解决该问题的方法1、定长整数描述变化:用比较少的字节(如16位)表示编号的相对变化,仅记录相邻位置之间的差异。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《信息组织与检索》作业答案第一章布尔检索习题1-2考虑如下几篇文档:文档1 breakthrough drug for schizophrenia文档2 new schizophrenia drug文档3 new approach for treatment of schizophrenia文档4 new hopes for schizophrenia patientsa. 画出文档集对应的词项—文档矩阵;b. 画出该文档集的倒排索引(参考图1-3中的例子)。
Term-Documentmatrix:1 2 3 4approach 0 0 1 0breakthrough 1 0 0 0drug 1 1 0 0for 1 0 1 1hopes 0 0 0 1new 0 1 1 1of 0 0 1 0patients 0 0 0 1schizophrenia 1 1 1 1treatment 0 0 1 0Inverted Index:approach -> 3breakthrough ->1drug ->1->2for ->1->3->4hopes ->4new ->2->3->4of ->3patients ->4schizophrenia ->1->2->3->4treatment >3注意:倒排索引中的词表(dictionary)和每个词项的倒排列表(posting list)需要排序,便于查找。
这里我们暂不考虑词的正规化处理(如hopes->hope)。
补充习题1写出AND查询的伪代码面向过程风格的伪代码:给定两个指针p1和p2,分别指向两倒排列表list1和list2(链表实现)的首元素;令docId(p1)表示p1所指向的元素的docId查询结果存放在answer列表里。
这里应用了“化归”思想(将新问题转化归为旧问题来解决)。
这里,比较两排序列表的首元素,排除较小的docId(不可能有匹配)后,我们构造出新的剩余列表,再次进行两列表的首元素的比较。
While p1 != null AND p2 != nullIf p1->docId==p2->docId //对两(剩余)列表的首元素进行比较insert(answer, p1);p1=p1->next;//构造新的剩余列表,迭代执行p2=p2->next;//Else if p1->docId < p2->docIdp1=p1->next;//p1->docId不可能有匹配;构造新的剩余列表Elsep2=p2->next;//p2->docId不可能有匹配;构造新的剩余列表End●面向对象风格的伪代码:注:为一个数据结构(对象)定义方法,通过方法操作自己的内部数据(List对象里隐含包含了一个成员变量,它是真正的链表或变长数组)。
While list1.currentItem() != null AND list2.currentItem() != nullIf list1.currentItem().getDocId() == list2.currentItem().getDocId()answer.insert(list1.currentItem());list1.moveToNext();list2.moveToNext();Else if list1.currentItem().getDocId() < list2.currentItem().getDocId() list1.moveToNext();Elselist2.moveToNext();End习题1-10写出OR查询的伪代码●面向过程风格的伪代码:给定两个指针p1和p2,分别指向两倒排列表list1和list2(链表实现)的首元素;令docId(p1)表示p1所指向的元素的docId;查询结果存放在answer列表里。
While p1 != null AND p2 != nullIf p1->docId == p2->docIdinsert(answer, p1);p1=p1->next;p2=p2->next;//构造新的剩余列表,迭代执行Else if p1->docId < p2->docIdinsert(answer, p1);p1=p1->next;//构造新的剩余列表,迭代执行Elseinsert(answer, p2);p2=p2->next;//构造新的剩余列表,迭代执行EndWhile p1 != null//条件为真时,加入list1的剩余元素(此时list2已遍历到结尾)insert(answer, p1);p1=p1->next;ENDWhile p2 != null//条件为真时,加入list2的剩余元素(此时list1已遍历到结尾)insert(answer, p2);p2=p1->next;END面向对象风格的伪代码:While list1.currentItem() != null AND list2.currentItem() != null If list1.currentItem().getDocId() == list2.currentItem().getDocId() answer.insert(list1.currentItem());list1.moveToNext();list2.moveToNext();Else if list1.currentItem().getDocId() < list2.currentItem().getDocId() answer.insert(list1.currentItem());list1.moveToNext();Elseanswer.insert(list2.currentItem());list2.moveToNext();EndWhile list1.currentItem() != nullanswer.insert(list1.currentItem());list1.moveToNext();ENDWhile list2.currentItem() != nullanswer.insert(list2.currentItem());list2.moveToNext();END补充习题2若一个文集有1000篇文档,有40篇是关于信管专业建设的。
我的信息需求是了解信管专业的专业建设情况,用某搜索引擎在这个文集上搜索,查询词为“信管”,搜出100篇包含“信管”的文档,这其中有20篇是信管专业建设方面的,其它80篇是关于信管的其它情况。
请问该查询的正确率和召回率是多少正确率=20/100=0.2召回率=20/40=0.5第二章词项词典及倒排记录表习题2-1a.在布尔检索系统中,进行词干还原从不降低正确率。
错;相当于扩充出同一个词干表示的多个词,会降低正确率。
b.在布尔检索系统中,进行词干还原从不降低召回率。
对。
c. 词干还原会增加词项词典的大小。
错。
d. 词干还原应该在构建索引时调用,而不应在查询处理时调用。
错;应同时做才能保证索引中和查询词的匹配。
习题2-2请给出如下单词的归一化形式(归一化形式也可以是词本身)。
a. ’Cos -> cosb. Shi’ite -> shiite('是隔音号)c. cont’d ->contd(contd. 可表示contained 包括;continued 继续)d. Hawai’i ->hawaiie. O’Rourke ->orourke习题2-3如下词经过Porter词干还原工具处理后会输出同样的结果,你认为哪对(几对)词不应该输出同样的结果?为什么?a. abandon/abandonmentb. absorbency/absorbentc. marketing/marketsd. university/universee. volume/volumes按Porter词干还原算法,这几组词都可以被还原为相应的词干。
但是这里问的是哪些组做词干还原不合适,原因是某组的两个词虽然来源于同一个词干,但是它们的意思不同,如果做词干还原处理会降低正确率。
c组不做词干还原。
marketing表示营销,market表示市场。
d组不做词干还原。
university表示大学,universe表示宇宙。
习题2-6对于两个词组成的查询,其中一个词(项)的倒排记录表包含下面16个文档ID:[4,6,10,12,14,16,18,20,22,32,47,81,120,122,157,180]而另一个词(项)对应的倒排记录表仅仅包含一个文档ID:[47]请分别采用如下两种策略进行倒排记录表合并并计算所需要的比较次数,同时简要地说明计算的正确性。
a.使用标准的倒排记录表。
比较:(4,47), (6,47), (10,47), (12,47), (14,47), (16,47), (18,47), (20,47), (22,47),(32,47), (47,47)。
共比较11次。
b.使用倒排记录表+跳表的方式,跳表指针设在P1/2处(P是列表长度)。
P=16。
也就说第一个列表的跳表指针往后跳4个元素。
下图蓝色表示安装了跳表指针的元素,其中120跳到180上。
[4,6,10,12,14,16,18,20,22,32,47,81,120,122,157,180]比较:(4,47), (14,47), (22,47), (120,47), (32,47), (47,47)。
共比较6次。
习题2-9下面给出的是一个位置索引的一部分,格式为:词项: 文档1: (位置1, 位置2, …); 文档2: (位置1, 位置2, …);angels: 2: (36,174,252,651); 4: (12,22,102,432); 7: (17);fools:2: (1,17,74,222); 4: (8,78,108,458); 7: (3,13,23,193);fear:2: (87,704,722,901); 4: (13,43,113,433); 7: (18,328,528);in:2:(3,37,76,444,851); 4: (10,20,110,470,500); 7: (5,15,25,195); rush:2:(2,66,194,321,702); 4: (9,69,149,429,569); 7: (4,14,404); to:2:(47,86,234,999); 4: (14,24,774,944); 7: (199,319,599,709); tread:2: (57,94,333); 4: (15,35,155); 7: (20,320);where:2: (67,124,393,1001); 4: (11,41,101,421,431); 7: (16,36,736);那么哪些文档和以下的查询匹配?其中引号内的每个表达式都是一个短语查询。