存储与检索复习题

合集下载

信息存储与检索B卷答案

信息存储与检索B卷答案

信息存储与检索试卷(B)答案
一.选择题(每题2分,共20分)
DADCC DBCDA
二.多选题(每题2分,共20分)
1、BDE
2、ACD
3、ABCE
4、ADE
5、BE
6、ABC
7、BE
8、ACD
9、BCD 10、BDE
三.判断题(每题2分,共20分)
×√×××√×√×√
四.名词解释(每题5分,共20分)
1.相关度优先:和查询的条件内容最相关的文献优先排在前面。

2.查全率:是指检出的相关文献量与检索系统中相关文献总量的比率,是衡量
信息检索系统检出相关文献能力的尺度,可用下面的公式表示:
查全率=(检出相关文献量/系统中相关文献总量)*100%
3.同句检索是要求参加检索运算的两个词必须在同一自然句中出现,其先后顺
序不受限制。

4.跨库检索:可同时检索多个平台上的多种资源,输入一个检索式,便可以看
到多个数据库的查询结果。

五.问答题(每题10分,共20分)
1.文献检索工具的作用是什么?
文献检索工具是用于报道、存贮和查找文献线索的工具,它通过对文献特征的描述,并按一定的科学方法排列、提供多种检索途径,使我们能从文献的汪洋大海里找到特定的文献
2.信息检索的类型按检索对象分为哪些种类?
按检索对象的内容区分:
(1)文献检索(文献检索是以文献作为检索对象,查找含有用户所需信息内容。

信息存储与检索练习题

信息存储与检索练习题

信息存储与检索练习题二、问答题1.简述信息、资源的概念。

信息:是生物以及具有自动控制系统的机器通过感觉器官或者细胞组织,或者具有类似功能的设备部件与外界进行交流的一切内容。

资源的涵义:资源可分为两个范畴,一是自然界赋予的自然资源;二是人类社会中人的劳动创造的各种资源。

资源是一切可被人类开发和利用的客观存在。

2.简述信息资源的概念及特征。

信息资源是经过人类主观或客观处理了的,并且能够被传播或传输的文字、声音、图像、数据。

共享性这是信息资源区别于物质资源的根本属性之一。

一般来说,信息资源可同时为众多的使用者享用,也可被不同时期的使用者使用,同一条信息可以同时为不同领域的人服务、满足不同的需要。

而不象物质资源那样具有排他性,即特定的物质资源只能被某些国家、地区或某些群体、甚至个人占有和消耗。

当然,一些人可控制或保密的信息,不具有这一特性。

时效性:一般来说,信息资源的时效性,是由事物运动变化的规律决定的。

因此,信息资源能否转化为生产力,取决于收集、加工和利用信息是否适时,只有时机适宜,才能发挥最佳效益。

智能性:信息资源是人类按照一定次序开发与组织起来的信息,是人类脑力劳动的产物。

无限性与有限性并存增值性即对信息资源的投入和使用,不但可以使自然资源、人力资源、资本资源增值,同时信息资源可以一次投入、多次开发利用,并不断产生新的信息使其自身增值。

3.简述电子信息资源含义。

含义:电子信息资源书是以数字化形式(即二进制代码0、1),把文字、图像、声音动画等,多种形式的信息存储在光、磁等非印刷型介质上,以光信号、电信号的形式传输,并通过相应的计算机和其他外部设备再现出来的信息资源。

4.什么是信息检索信息检索的类型有哪些信息检索的概念:通过一定的方法和手段将用户的提问特征与数据源所采用的特征标志进行对比,然后将二者相一致或比较一致的信息提取出来供用户使用的过程。

类型:文献检索数据检索事实检索5.简述信息存储与检索原理。

信息存储与检索复习资料答案

信息存储与检索复习资料答案

一、单项选择题1. 以下哪个数据库提供同名作者检索功能:〔D〕A.万方数据库B.中国期刊全文数据库C.复印报刊资料全文数据库D.中文科技期刊全文数据库2. _______提供一次文献的线索.〔B〕A.文摘、索引等B.图书C.百科全书D.手册3. 以下属于特种文献的是〔 B〕. A.图书 B.科技报告 C.报纸D.期刊4. 用主题词检索只可以检索出对应的〔〕5. 我国制定专利法的主要目的就是为了保护发明创造的〔D〕A.著作权 B.发明权 C.发现权 D.专利权6. 利用分类途径进行检索,其检索标识为〔C〕A.主题词B.关键词C.分类号D.分子式7. 在一般的著录格式中可以通过_______来判断该文献为会议文献〔C〕A.Journal B.Report C.Conference D.Patent8. 下列选项中,不属于信息能力的有〔 B〕A.鉴别 B.传递 C.评价 D.有效利用9. 从狭义上说专利文献就是指〔专利注明书〕10. Google搜索引擎的首页面上有一个"手气不错"的按钮,这个按钮的作用是什么?〔D〕A.测试你当天的手气B.提供最相关的一组检索结果列表C.提供最相关的一个检索结果的 D.直接跳转到系统认为是最相关的页面11. 利用___索引,我们可以检索任一知名专家的文献被引用的情况〔D〕A、Citation Index;B、Corporate Index;C、Permuterm Subject Index;D、Source Index;12. 文献信息检索的全过程包括文献信息的______两个过程〔C〕A.存贮和检索B.存贮和编排C.标引和编排D.存贮和标引13. 利用分类途径进行检索,其检索标识为〔C〕.A.主题词 B.关键词 C.分类号D.分子式14. 已知名叫孙钱章的作者99年出版了一本书,若想找到书名与其他信息,应在下列哪个数据库中查找?〔C.〕A.中文科技期刊全文数据库B.复印报刊资料全文数据库C. 超星数字图书馆D.万方数据资源系统15. 利用搜索引擎检索有关知识管理方面的学术论文,其检索式采用哪种比较好?〔C〕A.关键词摘要intitle:知识管理B.论文知识管理PDFC.学术论文知识管理D.学术论文intitle:知识管理16.在中国知网提供的检索服务中,〔检索词扩展〕起到扩展检索的作用.17. 下列哪种语言不属于规范化语言______〔B〕A.分类语言B.叙词语言C.关键词语言D.标题词语言18. 数据库检索中,布尔逻辑检索的逻辑关系中A OR B 又可以表示成〔A〕A.A+B B.A-B C.A*B D.B OR A19. 下列哪些不属于主题途径?〔D〕A.标题B.关键词C.摘要D.ISBN20. 《中华人民共和国专利法》开始实施的时间是〔B〕A.1984年4月l日B.1985年4月1日C.1990年9月7日D.1987年1月1日21. 赵一.科技成果向现实生产力转化.科学学研究,1996,14〔2〕:33-38是< A >A.期刊论文B.专著C.书目D.论文集22. 在检索式中,下列哪一个不能为提高检索的查全率而起到扩展检索范围的作用.〔D〕A.逻辑或B.截词检索C.位置运算符W D.逻辑与23. 在中文网络数据库中,能查到企业名录的是哪一个?〔C〕A.中国知网B.维普中文科技期刊数据库C.万方数据库D.超星数字图书馆24.读者阅读万方资源数据库的全文,需要安装的阅读器是〔PDF〕25. 检索最新的学术动态方面的信息,最好用哪种检索工具书?〔A〕A.手册 B.年鉴 C.期刊 D.书目26. 根据"Anon D..Biomedical applications of nanoscale devices[J].Materials Technology, 2004, 19<2>: 118-119."的著录特点,可以判断,该文献属于〔A〕.A.期刊论文B.图书C.科技报告D.会议论文27. 哪种不属于常规检索方法〔D〕A.直接检索法B.顺查法C.抽查法D.引文法28.根据"林福宗.多媒体技术基础[M].:清华大学,2006."的著录特点,可以判断,该文献属于〔B〕.A.期刊论文B.图书C.科技报告D.会议论文29. 世界三大检索刊物是指SCI<科学引文索引>、EI<工程索引>、ISTP<科技会议录索引>30. 检索2009年中国房地产方面的统计信息,最好用哪种检索工具书?〔A〕 A.年鉴B.手册C.书目D.百科全书31. 课题"查找王安石的相关资料"应用____〔B〕A.分类途径B.主题途径C.作者途径D.高级途径32.在《科学引文索引》中,下列哪个索引能提供从著者单位名称检索文献〔〕33. 查找中文科技期刊全文文献的数据库有〔维普〕二、名词解释1. 主题标引:是依据一定的主题词表或主题标引规则,赋予信息资源语词标识的过程.具体而言,主题标引是在主题分析的基础上,以一定的词表或标引规则作为依据,将信息资源中具有检索意义的特征转换成相应的主题词,并将其组织成表达信息资源内容特征的标识的过程.2. INTERNET〔因特网〕:泛指由多个计算机网络相互连接而成的一个网络,它是在功能和逻辑上组成的一个大型网络.3. 顺查法:就是以课题研究的起始年限为出发点,利用选定的检索工具如书目、索引、文摘又远与近的逐年查找.4. 三次文献:是在一、二次文献的基础上,经过综合分析而编写出来的文献,人们常把这类文献称为"情报研究"的成果5. 文献信息资源:文献是记录有知识的一切载体,文献信息资源是以文字、图形、符号、声频、视频等方式记录在各种载体上的知识和信息资源.6. 倒查法:一种逆时间顺序由近而远地查找信息的方法.7. 一次文献:即原始文献.它是作者以生产或科研为依据而创作的原始文献.如专著、期刊论文、学位论文等.8. 检索语言:又称为情报语言、情报存储和检索语言、信息组织语言等.它是根据检索的需要而创作的人工语言,把信息的存储和检索联系起来,把标引人员与检索人员联系起来,以便取得共同理解、实现交流的语言.9. 手工检索:是由检索者通过卡片式或书本式的目录、题录、文摘、索引等检索工具查找文献线索的过程.10. 信息检索语言:信息检索语言是用来描述信息的内容特征、外部特征和表达信息检索提问的一种专门语言.11. 特种文献:特种文献是指和获取途径都比较特殊的科技文献.特种文献一般包括会议文献、科技报告、专利文献、学位论文、标准文献等.12. 间接检索法:利用一定检索工具进行文献检索13. 专利:有三层含义:一指受专利法保护的发明,二是指专利权,三指专利说明书等专利文献.这三层含义的核心是受专利法保护的发明,而专利权和专利文献是专利的具体体现.14. 搜索引擎:是一种 Web 上应用的软件系统,它以一定的策略在 Web 上搜集和发现信息,在对信息进行处理和组织后,为用户提供Web信息查询服务.用户可以通过主题浏览和关键词检索的方式搜索所需信息.15. 技术档案:指生产、设计、建设、科研等专业部门,在科技活动中形成的文件、图书、照片、数据等原始记录文献,包括项目规划、设计、实施方案、任务说明书、协议书、技术指标、实验计划等,具有##性和内部使用的特点.16. 索引:根据标题法的原理,将类目与其注释改成标题形式,按字顺排列,并注明相应的分类号.这样不仅可方便查表,而且还可将分类表中因为按学科分类而被分散的同一事物不同方面的类目集中,使分类法在某种程度上兼有主题法的性能.17. 抽查法:针对研究课题发展的特点,选择有关的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的方法.18. 回溯检索:又叫追溯法,是以某一篇文献末尾所附的参考文献为依据,由近与远进行逐一追踪的查找方法.19. 循环检索:先利用检索工具查出一批有用文献,然后再利用这些文献末尾所附参考文献的线索进行追溯查找.20. 追溯法:以已获文献后面所附参考文献为线索进行追溯查找,又称为参考文献法.21. 分类标引:对档案给予分类号标识的过程.22. 目录:是图书、期刊或其他单位出版物外表特征的揭示与报道.它是以一本书、一种刊物为著录的基本单位,记录图书、期刊、资料等的名称、著者、出版项与馆藏项等内容,并按照一定的编排体例进行编制,但不涉与书中的章节或期刊中具体的文章.23. 竞争情报:竞争情报是20世纪80年代在国际上迅速发展起来的一种信息业务,是关于竞争环境、竞争对手和竞争策略的情报研究.三、简答题1. 光盘检索与手工检索相比有哪些优势?使用光盘检索系统,可免除联机检索系统所必须使用的电讯设备,节省了电讯费和联机系统使用费,还可免除由通信线路传输过程中所造成的失误光盘系统向用户随盘提供相当于联机信息检索系统功能的软件,并提供菜单驱动与命令驱动两种方式光盘存贮容量大,耐用,复制费用低可以把文本,图形,图像,声音与动态形象结合在一起如果光盘数据库量不够多,则信息资源就显得有限,购买大量光盘数据库,又要受到经费限制在信息需求的适时性上,光盘检索不如联机检索系统,因为光盘只能定期提供数据库费用大手工检索的优势〔1〕手工检索能了解标引规则,按规则进行各项的著录,便于检索者根据文献标引规则查阅相关文献.〔2〕手工检索能了解各类检索刊的收录范围、专业覆盖面、特点和编制要点,检索回溯期长,可以提高查全率和查准率.〔3〕手工检索灵活性高、费用低.〔4〕手工检索也便于检索策略的制定和修改,所得到的文献信息一般能符合检索者的信息要求,并且手工检索过程中发现问题,可以与时地修改和提出.手工检索过程中,直接查找任务的是人,在查找过程中,人的思维一直起着主导作用.检索者可以在检索过程中,结合检索的结果不断明确自己的信息需求和不断地修改自己的检索提问.检索提问标识与检索系统中文献特征标识的组配完全可以做到内容、概念和形式上的一致,而无须严格的字面的组配.因此,检索到的文献信息一般能符合检索者的信息要求.〔5〕在载体内容的直观性方面,手工检索也优越于计算机检索.利用手工检索工具,人们无须借助任何转换设备便可一目了然地判读具体文献的描述内容,也能够比较准确地了解其全部.而计算机检索则不然,必须借助于相应的读取工具,如计算机、光盘阅读器等,才能得以判读.手工检索的缺憾:<1> 检索速度慢 <2 >检索受时空的限制 <3> 检索受馆藏资源的限制 <4> 更新周期长 <5> 检索途径少2. 信息的特征有哪些?答:普遍性、无限性、传递性、可知性与可贮性、动态性、共享性3. 简述联机检索的基本原理.信息用户利用终端设备,通过通讯网络与世界各地的信息检索系统联机,进行人机对话,从检索系统的数据库中查找出用户所需信息的全过程.一个典型的计算机信息系统,能完成数据收集,分析,加工处理,存储,传递通信和检索信息的全过程.4. 信息的概念是什么?信息有哪些特征?广义的信息概念:即信息是事物运动的状态和方式,也叫本体论信息狭义的信息概念:即信息是认识主体对事物运动状态和方式的反映,也叫认识论信息信息具有如下几个特征:普遍性、无限性、传递性、可知性与可贮性、动态性、共享性5. 检索系统必备四大要素是什么?答:检索文档〔数据库〕、检索设备〔检索硬件与通讯设施〕、系统规则、相关人员、.6. 简述信息检索语言的功能.信息检索语言是沟通信息存储和信息检索的桥梁;对信息组织人员来说,它是表达信息主题内容,形成标识并赖以组织信息的依据;对信息检索人员来说,它是表达检索需求的依据.7. 简述信息检索的作用.答:全面掌握必要信息;提高信息利用效率;提高信息素质;具有一定经济性.8. 简述信息检索原理〔可以用图描述〕.9. 简述网络信息资源的特点.<1>信息量大,有污染.在Internet上的信息资源数量究竟有多少,谁也说不清楚,因为它是世界上联系在网络上的所有主机里存储的信息总和.有人估计,在Internet上每天发布的新信息约有14万件,它的信息量是过去任何一种存储信息方法所无法比拟的.但同时也产生了信息的污染,任何人只要同网络相联系,就既是网上的信息使用者,也是信息生产者.这就使网上存在有大量信息的同时也产生了一定的垃圾,出现了信息污染.当我们在检索时,往往会出现许多无关的信息,而信息的真伪是需要鉴别的.<2>信息共享性好,更新快.Internet上的信息共享性最好,只要在网上的任何一个主机上发表信息,在全世界范围内都能看到.许多聪明的商家充分利用这一特点在网上大做广告,树立企业形象,推销产品.Internet网络信息的另一特点是新陈代谢快,可以说Internet网络信息资源要比其他信息资源更新得快.<3>信息源分散无序.Internet上的信息源是在每个独立的计算机服务器上,使网上的信息源呈现出分散、无政府状态.用户无法判断网上有多少同自己需求有关的信息,给用户的信息检索带来一定的困难.<4>信息商品化.刚刚利用Internet查询信息时,你可能会感到网上的大量信息在利用时都不需要付费,只要付少量的通讯费就可以了.但只要细心观察就会发现,免费信息多数都是具有一定宣传作用的,真正有用的信息多数是要付费的,可以说Internet上的网络信息具有一定的商品化.10. 什么是检索策略?以Google搜索引擎为例,论述检索策略的优化方法.检索策略,就是在分析课题内容具有哪些概念单元的基础上,确定检索系统、检索文档、检索途径和检索词,并科学安排各检索词之间的位置关系和逻辑关系以与查找步骤等.检索策略考虑得是否周全,直接影响文献的查全率和查准率.优化方法略11. 简述信息检索的本质.答:本质就是提问标识语文献标识的对比和匹配.12. 举例说明什么是一次文献、二次文献、三次文献.一次文献指以作者本人的研究成果为依据而创作的原始文献,如期刊论文、研究报告、专利说明书、会议论文等.二次文献是对一次文献进行加工整理后产生的一类方面,如书目、题录、简介、文摘等检索工具.三次文献是在一、二次文献的基础上,经过综合分析而编写出来的文献,人们常把这类文献称为"情报研究"的成果,如综述、专题述评、学科年度总结、进展报告、数据手册等.13. 如果要查找有关"转基因生物和细胞与其制备方法"方面的中外文文献,如何查找?请写出具体的检索步骤.1、分析课题,明确检索要求;2、选择检索系统:要考虑文献类型3、选择检索途径4、选择检索方法5、查找文献线索6、获取原始文献14. 简述文献检索步骤答:明确信息检索需求、选择检索系统、确定检索词、构造检索表达式、实施检索策略并分析结果、检索策略的修改与完善15. 影响查全率和查准率的因素有哪些?查全率:R=检出的相关信息量/检索系统中相关信息总量使用泛指性较强的检索语言<如上位类、上位主题词>能提高查全率,但查准率下降.使用专指性较强的检索语言<如下位类、下位主题词>能提高查准率,但查全率下降主要从以下几个方面考虑:选词、选择数据库是否全面;时间,文献类型16. 信息检索系统都包含哪些子系统?答:文献信息选择子系统;检索语言和名称规范子系统;标引著录子系统;查询子系统;交互子系统;匹配子系统.17. 简述信息检索的特征.答:相关性;不确定性;逻辑性.18. 信息检索智能化主要体现在哪些方面?答:检索技术智能化;检索结果处理智能化;检索服务智能化.19. 某同学在检索一个课题时,第一次检索的结果有200条文献,你建议一下她采用何种方式来缩小检索范围?增加文献的检准率,减少文献的检全率第一,变逻辑或为逻辑非,增加"and"的检索词第二,限定文献的类别,〔如该文献是医学方面的,就将其限定在医学这个大类下〕第三,或变模糊检索为精确检索第四,增加其他的限度,这就要看你自己的,如有没有年限现在啊,作者之类20. 什么是检索策略?计算机检索策略的制定一般经过哪几个步骤?检索策略,就是在分析课题内容具有哪些概念单元的基础上,确定检索系统、检索文档、检索途径和检索词,并科学安排各检索词之间的位置关系和逻辑关系以与查找步骤等.检索策略考虑得是否周全,直接影响文献的查全率和查准率.检索步骤〔1〕弄清信息需求,明确检索目的〔2〕选择数据库,确定检索途径〔3〕确定课题的概念组面和检索标识21. 简述专利的新颖性、创造性与实用性的含义,并说明中国保护的专利有哪几种类型?专利的新颖性,是指申请日前没有同样的发明或者实用新型在国内外出版物上公开发表过、在国内公开使用过或者以其他方式为公众所知,也没有同样的发明或者实用新型由他人向国务院专利行政部门提出过申请并且记载在申请日以后公布的专利申请文件中. 专利的创造性:是指在有新颖性的情况下,不同的技术之间实际上是没有产生意想不到的技术效果,简单说,就是两者之间的差异不明显,而且效果无进步. 专利的实用性:指该理论或者观点的提出对实践的知道程度. 中国保护的专利类型有3种类型,分别是:发明专利、实用新型专利和外观设计专利.22. 什么是信息检索查全率和查准率?两者之间的关系如何?查全率<Recall Ratio> 当用户要全面检索某一信息库时,检出的成功度可用检出的所有相关信息在信息库所有相关信息中所占的比例来表示.这种对信息库检索全面性的测量指标即为查全率.查全率与系统能够检索出的相关文献能力有关.可定义为:查全率 =<检出的相关信息数/信息库中相关信息总数>×100%查准率<Precision Ratio> 当用户要对检索到的结果进行分析时,检出的相关信息数在所有检出信息中所占的比例往往成了较重要的评判指标.这种对检索结果中的相关信息的测量指标即为查准率.也有称为信号噪声比<signal-to-noise ratio>.查准率与检索出的相关信息数有关.可定义为:查准率 =<检出的相关信息数 /检出的信息总数>×100%查全率和查准率必须结合使用,单独使用两者中的任何一个都不能全面说明检索效果的好坏.若检出 1 篇相关信息,必能达到100% 的查准率,但查全率却会非常低;同样,若检出的信息数等于库##息的总量 a + b + c + d ,则必能获得 100% 的查全率,但很显然查准率必定也低得可怜.查全率和查准率是评价检索效果好坏的指标,而漏检率和误检率则是测量检索误差的指标.23. 影响信息检索效果的因素有哪些?<1> 影响查全率的因素从文献存储来看,主要有:文献库收录文献不全;索引词汇缺乏控制和专指性;词表结构不完整;词间关系模糊或不正确;标引不详;标引前后不一致;标引人员遗漏了原文的重要概念或用词不当等.此外,从情报检索来看,主要有:检索策略过于简单;选词和进行逻辑组配不当;检索途径和方法太少;检索人员业务不熟练和缺乏耐心;检索系统不具备截词功能和反馈功能,检索时不能全面地描述检索要求等.<2> 影响查准率的因素主要有:索引词不能准确描述文献主题和检索要求;组配规则不严密;选词与词间关系不正确;标引过于详尽;组配错误;检索时所用检索词〔或检索式〕专指度不够,检索面宽于检索要求;检索系统不具备逻辑"非"功能和反馈功能;检索式中允许容纳的词数量有限;截词部位不当,检索式中使用逻辑"或"不当等等.实际上,影响检索效果的因素是非常复杂的.根据国外有关专家所做的实验表明,查全率与查准率是呈互逆关系的.要想做到查全,势必会要对检索范围和限制逐步放宽,则结果是会把很多不相关的文献也带进来,影响了查准率.企图使查全率和查准率都同时提高,不是很容易的.强调一方面,忽视另一方面,也是不妥当的zx.应当根据具体课题的要求,合理调节查全率和查准率,保证检索效果.24. 信息检索的方法有哪几种?从检索手段看,信息检索分为: 手工信息检索机械信息检索计算机信息检索25. 什么是信息检索漏检率和误检率,二者之间的关系如何?误检率为检出的结果中,不相关信息占检出信息的比例.这种对检索结果中不相关信息数的测定即为误检率.可定义为:误检率 =<检出的非相关信息数/检出的信息总数>× 100%漏检率为系统未检索出的相关信息占库中相关信息总数的比例.这种对检索结果中不包含系统中存在的相关信息数的测定即为漏检率.可定义为:漏检率 =<未检出的相关信息数/信息库中相关信息总数>× 100%其实,查全率和漏检率是互补的;而查准率和误检率也是互补关系.即:查全率 + 漏检率 = 1 ;查准率 + 误检率 = 1 .漏检率和误检率则是测量检索误差的指标.26. 试比较分类语言与主题词语言分类语言是运用概念划分的原理,以分类号为标识,将各种概念按学科性质加以划分和排列,用以分门别类地、系统地组织信息的一种检索语言,它又可以分为体系分类语言和组配分类语言以与混合分类语言.主题语言是直接以表达主题内容的语词作为检索标识,以字顺为主要检索途径的标引和检索信息的语言.主题语言是一种描述性语言,它使用自然语言中的词语或规范化的词语来描述文献所论述或研究的事物概念,具有较强的直观性、专指性和灵活性.。

信息存储与检索复习资料答案

信息存储与检索复习资料答案

一、单项选择题1. 以下哪个数据库提供同名作者检索功能:(D )A.万方数据库 B.中国期刊全文数据库C.复印报刊资料全文数据库 D.中文科技期刊全文数据库2. _______提供一次文献的线索。

( B ) A.文摘、索引等 B.图书 C.百科全书 D.手册3. 以下属于特种文献的是( B )。

A.图书B.科技报告C.报纸 D.期刊4. 用主题词检索只可以检索出对应的()5. 我国制定专利法的主要目的就是为了保护发明创造的(D )A.著作权 B.发明权 C.发现权 D.专利权~6. 利用分类途径进行检索,其检索标识为( C ) A.主题词B.关键词C.分类号D.分子式7. 在一般的著录格式中可以通过_______来判断该文献为会议文献( C )A. Journal B. Report C. Conference D. Patent8. 下列选项中,不属于信息能力的有( B ) A.鉴别 B.传递 C.评价 D.有效利用9. 从狭义上说专利文献就是指(专利注明书)10. Google搜索引擎的首页面上有一个“手气不错”的按钮,这个按钮的作用是什么( D )A.测试你当天的手气 B.提供最相关的一组检索结果列表C.提供最相关的一个检索结果的链接D.直接跳转到系统认为是最相关的页面…11. 利用___索引,我们可以检索任一知名专家的文献被引用的情况( D )A、Citation Index;B、Corporate Index;C、Permuterm Subject Index;D、Source Index;12. 文献信息检索的全过程包括文献信息的______两个过程( C )A.存贮和检索B.存贮和编排C.标引和编排D.存贮和标引13. 利用分类途径进行检索,其检索标识为( C )。

A.主题词 B.关键词 C.分类号 D.分子式14. 已知名叫孙钱章的作者99年出版了一本书,若想找到书名及其他信息,应在下列哪个数据库中查找( C. )A.中文科技期刊全文数据库B.复印报刊资料全文数据库C. 超星数字图书馆D.万方数据资源系统…15. 利用搜索引擎检索有关知识管理方面的学术论文,其检索式采用哪种比较好( C )A.关键词摘要 intitle: 知识管理B.论文知识管理 PDFC.学术论文知识管理D.学术论文 intitle:知识管理16. 在中国知网提供的检索服务中,(检索词扩展)起到扩展检索的作用。

信息存储与检索作业1【精选】

信息存储与检索作业1【精选】

《信息存储与检索》作业1一、选择题1.最早的网络搜索引擎是( )A. Yahoo B .Excite C. ArchieD .Google2. 近几年,有不少拉美国家发生了人畜被蜂类伤害致死的事件,这种蜂类被称为“杀人蜂”。

你知道“杀人蜂”是非洲蜂与什么蜂杂交后的品种吗?( )A 、美洲蜂B 、欧洲蜂C 、亚洲蜂D 、澳洲蜂3.Google 公司于2004年8月首次公开募股(IPO)的发行价为每股___美元,2006年10月宣布以__亿美元的股票收购著名视频网站YouTobe ( )A .75;15.5 B. 85;16.5 C. 95;16 D. 105;16.84.请问被苏轼赞为“诗中有画,画中有诗”的人是谁?( )A.曾巩B.韩愈C.林和靖D.王维5.“我思故我在”,是____ ____的名言,这句话说明思想的重要性。

人类的认知是不断进步的,随着人们不断的认识到新的事物思想也在不断转变A.帕斯卡尔B.伏尔泰C.笛卡儿D.孟德斯鸠6.中国互联网络信息中心(CNNIC)是在信息产业部的授权和领导下的,得到国际互联网络管理机构认可的、中立的、非盈利性的服务和管理机构,行使国家互联网络信息中心的职责,属于国家事业单位。

CNNIC 在行政上受___ ____的领导。

A. 信息产业部 B. 国务院信息化办公室C. 中国互联网络协会D. 中国科学院计算机网络信息中心7.1998年5月4日,江泽民总书记在庆祝北大建校100周年大会上向全社会宣告:“为了实现现代化,我国要有若干所具有世界先进水平的一流大学。

”为贯彻落实党中央科教兴国的战略和江泽民同志的号召,教育部决定在实施“面向21世纪教育振兴行动计划”中,重点支持北京大学、清华大学等部分高等学校创建世界一流大学和高水平大学,简称“985”工程。

请问现在985工程院校数总计多少_______所,湖北有____ ___所入选。

A. 39;2B.38;4C. 34;4D. 34;28.“解百纳”一直被认为是一种高档红酒,“解百纳”干红是三种优质葡萄酿制而成,请问下列葡萄中哪种葡萄不是酿制"解百纳"的原料? ()A.赤霞珠B.品丽珠C.蛇龙珠D.绛霞珠9.我国最早的图书馆学专业教育机构创立于___年,它是___ __ 创始人_____A. 1920 武昌文华大学图书馆学专修科 韦棣华B. 1922 武汉大学图书馆学专修科 杜定友C.1927 南京金陵大学图书馆学系 韦棣华D.1947 北京大学中国语言文学系图书馆学 杜定友10.手机135****1310和IP 地址 218.65.96.5的归属地分别是哪里?( )A. 武汉 郑州B.武汉 南昌C. 广州 武汉D.广州 太原4 11 201628陈登恪, 人称“登老”,唐宋小说专家。

2011-2012学年信息存储与检索期末考试(B)

2011-2012学年信息存储与检索期末考试(B)

阅卷须知:阅卷用红色墨水笔书写,得分用阿拉伯数字写在每小题题号前,用正分表示,不得分则在题号前写0;大题得分登录在对应题号前的得分栏内并签名;统一命题的课程应集体阅卷,流水作业;阅卷后要进行复核,发现漏评、漏记或总分统计错误应及时更正;对评定分数或统分记录进行修改时,修改人必须签名。

一、填空题(每空2分,共40分)1.信息资源的基本特征有______________、时效性、_____________、无限性与有限性并存和增值性。

2.信息存取由__________________和_______________________两部分组成。

3.索引款目一般由:_________________、说明语和___________________。

4.全文数据库中的文档通常由_________________和_______________组成。

5.构造提问检索式的基本要素是____________、布尔逻辑算符、_____________和截词算符等。

6.一个真正的元搜索引擎由3部分组成:检索请求提交机制、_________________和________________。

7.中国专利局发行的专利文献包括:____________、专利公报和___________等。

8.影响数字声音波形质量的主要因素有三个:____________、采样精度和__________。

9.多媒体信息标引,按标引入口点的不同将这些标引方式划分为三大类:_______________、以内容分析为主的标引方法和_______________________。

10.基于内容的图像检索技术的关键在于__________________,以及在图像特征基础上进行的_____________________,这些方法与技术融合了计算机图形处理、模式识别、数据库等多门学科关键技术。

二、问答题(每小题4分,共20分)请说出下面DIALOG系统中基本索引字段的后缀和前缀的含义1、Computer/ti2、Information retrieval/ab3、au=Johnson4、dt=review5、py=2000三、简答题(第1、2、4、5小题各5分,第3、6小题各6分;共32分)1.简单叙述信息检索的步骤。

信息存储与检索练习题[1][1]

信息存储与检索练习题[1][1]

信息存储与检索练习题一、名词解释1.信息2.资源3.信息资源4.信息检索5.检索词p776.提问检索式p777.零次文献p248.一次文献p239.二次文献p2310.三次文献p2311.关键词索引p5712.主题索引p5613.顺查法p8514.逆查法p8615.抽查法p8616.追溯法p8617.综合法p8618.Web信息资源p919.Gopher信息资源p1020.FTP信息资源p921.Telnet信息资源p922.搜索引擎p19323.科技报告p249二、问答题1.简述信息、资源的概念。

信息:是生物以及具有自动控制系统的机器通过感觉器官或者细胞组织,或者具有类似功能的设备部件与外界进行交流的一切内容。

资源的涵义:资源可分为两个范畴,一是自然界赋予的自然资源;二是人类社会中人的劳动创造的各种资源。

资源是一切可被人类开发和利用的客观存在。

2.简述信息资源的概念及特征。

信息资源是经过人类主观或客观处理了的,并且能够被传播或传输的文字、声音、图像、数据。

共享性这是信息资源区别于物质资源的根本属性之一。

一般来说,信息资源可同时为众多的使用者享用,也可被不同时期的使用者使用,同一条信息可以同时为不同领域的人服务、满足不同的需要。

而不象物质资源那样具有排他性,即特定的物质资源只能被某些国家、地区或某些群体、甚至个人占有和消耗。

当然,一些人可控制或保密的信息,不具有这一特性。

时效性:一般来说,信息资源的时效性,是由事物运动变化的规律决定的。

因此,信息资源能否转化为生产力,取决于收集、加工和利用信息是否适时,只有时机适宜,才能发挥最佳效益。

智能性:信息资源是人类按照一定次序开发与组织起来的信息,是人类脑力劳动的产物。

无限性与有限性并存增值性即对信息资源的投入和使用,不但可以使自然资源、人力资源、资本资源增值,同时信息资源可以一次投入、多次开发利用,并不断产生新的信息使其自身增值。

3.简述电子信息资源含义。

《信息存储与检索》模拟考试题一

《信息存储与检索》模拟考试题一

《信息存储与检索》模拟考试题一(开卷)考试时间 90 分钟试卷编号姓名学号班级一. 选择题(每题3分,共30分)1. ISBN 7-302-02372-7是A 标准号B 专利号C 国际标准刊号D 国际标准书号2. 检索时所谓的“关键词”是()A 规范词B 受控词C 主题词D 非规范词3. 记录在非正式传播媒体上未经任何加工处理的信息是A 零次信息B 一次信息C 二次信息D 三次信息4.检索出具有同一词干的所有形式的词,应使用()A 复数形式B 概念词C 同义词D 截词符5.在整个数据库中查找含有特定信息的过程,称之为A 检索B 指令C 标引D 分类6.当检索词必须紧挨着,且词序可变时,应使用算符A (1W)B (W) 或()C (N)D ?7. 使用OR算符组配检索词,对检索结果将有怎样的影响A 没有影响B 增加检索结果C 减少检索结果D 提高查准率8.下面的表达中,哪一个是不正确的A 所有的书目型数据库都含有文摘B 所有全文型数据库都含有文献来源C 有些数据库含有图形D 数据库可以含有不止一种类型的数据9.数据库中的每一条记录,其各项属性被称为()A 字段B 文档C 记录D 指令10.书目型数据库总含有A 文献的全文B 文献出处C 作者和地址D 表格数据二、填空题(每空2分,共20分)1.题录一般以内容是独立的文献单元作为著录的基本单位,著录项通常包括:著者、__________和来源出处。

2.文献的三要素是:知识、载体和_______。

3.描述文献内容特征的语言有分类语言和___________。

4.SCI可以提供论文被______检索和论文被引用检索。

5.信息的组织可分为按照内容特征和按_________特征组织两种方式。

6.TN912.2是________的分类号。

7.三大索引包括_______、EI和ISTP。

8.目前我国生产制作学位论文全文数据库的两家以盈利为目的的公司是_______________和_______________。

信息存储与检索A卷

信息存储与检索A卷

济南大学继续教育学院信息存储与检索试卷(A)学年:学期:年级:专业:学习形式:层次:(本试题满分100分,时间90分钟)一.选择题(每题2分,共20分)1.(D)是指未检出的相关信息量与检索系统中实际与课题相关的信息总量的比率。

A、查全率B、查准率C、误检率D、漏检率2.《四级英语阅读与完型填空》这本图书在中图法体系中的分类号可能是()。

A、G636.33B、G216.2C、I247.4D、H3193.布尔逻辑表达式:在职人员NOT(中年AND教师)的检索结果是()A、检索出除了中年教师以外的在职人员的数据B、中年教师的数据C、中年和教师的数据D、在职人员的数据4.布尔逻辑检索中检索符号“OR”的主要作用在于()。

A、提高查准率B、提高查全率C、排除不必要信息D、减少文献输出量5.根据一定的需要,将特定范围内的某些文献中的有关知识单元或款目按照一定的方法编排,并指明出处,为用户提供文献线索的一种检索工具是()。

A、目录B、题录C、索引D、文摘6.知识是指人类对客观世界的认识。

知识可分为()A、有用知识和无用知识B、基础知识和高级知识C、感性知识和理性知识D、理论知识和实践知识7.文献按载体形式可分为:印刷型、缩微型、声像型和()A、甲骨型B、金石型C、电脑型D、机读型8.信息检索系统的功能为:报道文献信息、存储文献信息和()A、揭示文献信息B、检索文献信息C、宣传文献信息D、介绍文献信息9.检索系统的结构由几个部分组成:编辑使用说明、索引、附录、词表和()A、目次B、题录C、附图D、正文(主文档)10.为便于计算机识别记录的各个字段,每个字段都设有字段标识符,下列哪个字段的标识叙述是正确的()A、TI是题名的标识符B、AB是关键词的标识符C、AU是摘要的标识符D、AF是著者的标识符二.多选题(每题2分,共20分)1.常见的索引有以下几种()A.分类索引B.主题索引C.著者索引D.编号索引E.引文索引2.信息检索的常用途径有:主题词、关键词、顺序号、引文和()A.题录B.作者C.全文D.题名E.分类3.工具法查找文献信息资源的方法可分为()A.顺查法B.调查法C.抽查法D.倒查法E.取样法4.信息检索效果评价标准为(A、D、E)A.查全率B.错误率C.准确率D.查准率E.漏检率5.查找中文会议论文全文资料,可利用下列哪些数据库进行查找。

复习题(有答案)

复习题(有答案)

复习题一、名词解释及简答信息的概念及特征文献及分类情报、信息、知识、文献的关系目录追溯法文献信息资源ISBN和ISSN的组成及组成部分的含义《全国报刊索引》信息检索的含义及分类(广义的信息检索)信息检索语言信息检索的基本原理布尔逻辑运算中的各种符号的含意图书馆各种数据库的检索途径计算机检索系统的构成计算机信息检索常用的检索技术四大权威检索数据库是哪些?专利及分类试比较分类语言与主题词语言按信息加工形式分,信息源分为一次文献、二次文献和三次文献,请简述它们及其之间的关系什么是查全率和查准率?影响查全率和查准率的因素有哪些?常用的布尔逻辑算符有几种?并简述各自的作用文献综述学位论文的含义及分类参考文献的著录格式1. 知识:知识是人们通过实践对客观事物及其运动过程和规律的认识。

主观知识、客观知识。

2. 检索工具:检索工具是指用以报导、存贮和查找文献线索的工具。

它是附有检索标识的某一范围文献条目的集合,是二次文献。

3.信息检索:广义的,包括信息的存储和检索两个过程,信息存储——指工作人员将大量无序的信息集中起来,根据信息源的外表特征和内容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的工具或检索系统,供人们检索和利用。

信息检索——指运用编制好的检索工具或检索系统,查找出满足用户要求的特定信息。

狭义信息检索:仅指信息的检索过程。

从某一信息集合中找出所需的信息的过程,即信息查询。

4. 信息:信息是人们通过感觉器官与外界进行交换的一切内容。

1. 知识:知识是人们通过实践对客观事物及其运动过程和规律的认识。

主观知识、客观知识2. 信息:信息是人们通过感觉器官与外界进行交换的一切内容。

3.信息检索:广义的,包括信息的存储和检索两个过程,信息存储——指工作人员将大量无序的信息集中起来,根据信息源的外表特征和内容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的工具或检索系统,供人们检索和利用。

15春西电《信息存储与检索》在线作业答案

15春西电《信息存储与检索》在线作业答案

西电《信息存储与检索》在线作业
一、单选题(共20 道试题,共100 分。


1. 在整个数据库中查找含有特定信息的过程,称之为
A. 检索
B. 指令
C. 标引
D. 分类
正确答案:A
2. ISBN7-302-02372-7是
A. 标准号
B. 专利号
C. 国际标准刊号
D. 国际标准书号
正确答案:D
3. 当检索词必须紧挨着,且词序可变时,应使用算符
A. (1W)
B. (W)或()
C. (N)
D. ?
正确答案:C
4. 检索出具有同一词干的所有形式的词,应使用()
A. 复数形式
B. 概念词
C. 同义词
D. 截词符
正确答案:D
5. 感光材料为载体,利用光学技术将文字、图形、影像等信息符号按比例缩小的文献形式是()
A. 印刷型
B. 缩微型
C. 声像型
D. 计算机存储型
正确答案:B
6. 记录在非正式传播媒体上未经任何加工处理的信息是
A. 零次信息
B. 一次信息。

信息存储与检索试卷A

信息存储与检索试卷A

河北经贸大学2013-2014学年第二学期《信息存储与检索》试卷A系别:班级:学号:姓名:(所有答案写到答题纸上,否则无效)一、填空:(每空1分,共15分)1,按文献的加工深度,可将纸质文献划分为______、______、______和______。

2,信息存取模型的信息浏览模型可分为______、________和_______。

3,计算机检索常用的方法有菜单检索、_______、______、_______。

4,计算机信息存取系统按文档组织方式划分有_____和_____。

5,_____、_____和______是搜索引擎的三大支柱技术。

二、选择题(每题1分,共15分)1、利用选定的检索工具由近及远地逐年查找,直到查到所需文献为止的检索方法是()A、逆查法B、顺查法C、追溯法D、抽查法2、下面哪项不是规范检索语言?()A、单元词语言B、关键词语言C、标题词语言D、叙词语言3、下列哪个途径是从文献的内部特征进行检索的?()A、刊名途径B、号码途径C、作者途径D、分类途径4、如果需要检索某位作者的文摘被引用的情况,应该检索:()A、分类索引B、作者索引C、引文索引D、主题索引5、用google检索题目含有“清华大学”、“研究生”的doc格式的文件,应该输入:A、intitle:清华大学研究生site: filetype:docB、ti=清华大学研究生site: filetype:docC、intitle=清华大学* 研究生*site=*filetype=docD、intitle:(清华大学研究生) site: filetype:doc6、下列哪种图书不属于工具类图书?A、科技专著B、字典C、手册D、年鉴7、下列属于信息检索的是()A、在班级中填写家庭情况登记表B、用电子邮件预定宾馆C、到携程网查询航班起飞时间D、用Excel处理成绩统计表8、下列哪个数据库是开放式的数字图书馆?A、万方数据B、超星C、维普D、ELSEVIER9、在机检中,当检索结果太少,查全率较低时,检索式可做如下调整()。

存储与检索复习题.doc

存储与检索复习题.doc

-A-A- ^*7*-弟一早:1、信息检索就是对信息项进行表示、存储、组织与存取的全过程。

信息存储是指将有用信息按照一定方式组织和存放起来,信息检索是指当用户需要这些信息时,再把它们从存放的地方查找和提取出来。

2、信息检索的原理:参见书上图1-1理解3、信息检索的一致性匹配机理:提取机理、表示机理、比较机理、判断机理、选择机理。

4、信息检索的类型:(1)按照检索对象的性质分为文献检索、数值检索、事实检索;(2)按照计算机检索技术分为脱机检索、联机检索、光盘检索、网络检索。

5、在手工检索阶段,人们常用的概念是检索工具,在计算机检索阶段,人们使用数据库,在网络检索阶段。

人们使用搜索引擎。

6、信息检索系统物理结构组成,逻辑结构的组成和原理。

7、信息检索产生于美国,其发展经历了起步期(以单词检索为特征)、成长期(以脱机检索为特征)、发展期(以联机检索为主)、成熟期(检索转向个人终端)、开放期(以网络检索为主)。

8、信息检索的趋势:跨语言检索、多媒体检索、信息检索可视化、信息检索智能化、信息检索个性化、信息检索多样化。

-A-A- --------- --- ^*7*一弟一早:1、检索策略一般都包含文档集的逻辑表示、查询的表示、相似性匹配及其排序三个要素。

2、经典的检索模型:布尔模型、向量空间模型、概率模型。

要求了解三种模型的思想和原理,重点掌握矢量模型的计算过程。

3、TF-IDF加权策略:对特征项计算权重的方法,该策略由簇内相似性和簇间不相似性两种效果来衡量。

4、将文本内容中的信息与文档结构信息结合起来进行检索的模型叫做结构化检索模型。

包括费重叠链表模型、邻近节点模型、平坦模型(扁平浏览模型)、结构导向模型、超文本模型。

弟二早:1、记录是作为一个单位来处理的有关数据的集合,它是对某一实体的属性进行描述的结果。

常见的书目记录是MARC记录结构,不同的国家有不同的记录格式,但为了进行不同机构间的目录交换,机读目录必须在物理结构、内容标识符、内容数据方面做到统一。

《信息存储与检索》复习题目

《信息存储与检索》复习题目

一、名词解释1.信息检索(广义)信息检索是指将信息按一定的方式组织、存储起来,并针对用户的需要查找所需信息的过程。

因此,信息检索包含了信息的存储和检索两个不可分的部分。

2. 著录著录是把文献信息的各种内部、外部特征记录下来的过程,其结果就是形成一条目录信息。

文献信息被著录后能有利于被识别、交流和传播;通过著录的目录信息能方便地指向原始信息。

3. 二次文献二次文献是为了控制文献,便于人们查找,将分散无序的一次文献经过筛选、分析、整理、按其内容特征和外部特征进行提炼、浓缩,编制而成的有检索功能的文献。

4.参考数据库参考数据库指存放某一学科领域原始文献的来源和属性的一类数据库;为用户指出获取原始信息的线索。

数据库中的记录是通过对原始文献的来源和属性的再加工和过滤(如编目、索引、文摘等),记录内容包括文献的题目、著者、主题词、文摘、出处等。

5.元搜索引擎元搜索引擎是对搜索引擎进行搜索的搜索引擎,是对多个独立搜索引擎的整合、调用、控制和优化利用,也被称为“搜索引擎之母”。

6. 检索语言检索语言是信息检索系统存储和检索时使用的共同语言,即:文献存储时,文献的内容特征和外部特征按照检索语言来描述;检索文献时的提问也按照检索语言来加以表达。

7. 搜索引擎搜索引擎是根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,并将处理后的信息显示给用户,是为用户提供检索服务的系统。

8. 源数据库源数据库是能够直接为用户提供原始资料或具体数据的一类数据库。

源数据库可以提供的数据信息包括数值、事实和原文,能够直接满足用户的信息需求,而不必转查其他的信息源。

9. 追溯法追溯法是利用已有文献后面的参考文献作为检索入口,依据文献之间的引证和被引证关系进行检索的方法。

10. RSSRSS:Really Simple Syndication,真正简易聚合,是站点之间共享内容的一种简易方式,通常在时效性比较强的内容上使用RSS订阅能更快速获取信息,例如Blog、新闻。

信息存储与检索复习资料答案

信息存储与检索复习资料答案

一、单项选择题1. 以下哪个数据库提供同名作者检索功能:(D )A.万方数据库 B.中国期刊全文数据库C.复印报刊资料全文数据库 D.中文科技期刊全文数据库2. _______提供一次文献的线索。

(B)A.文摘、索引等B.图书C.百科全书D.手册3. 以下属于特种文献的是( B)。

A.图书 B.科技报告 C.报纸D.期刊4. 用主题词检索只可以检索出对应的()5. 我国制定专利法的主要目的就是为了保护发明创造的(D )A.著作权 B.发明权 C.发现权 D.专利权6. 利用分类途径进行检索,其检索标识为( C )A.主题词B.关键词C.分类号D.分子式7. 在一般的著录格式中可以通过_______来判断该文献为会议文献(C )A.Journal B.Report C.Conference D.Patent8. 下列选项中,不属于信息能力的有( B ) A.鉴别 B.传递 C.评价 D.有效利用9. 从狭义上说专利文献就是指(专利注明书)10. Google搜索引擎的首页面上有一个“手气不错”的按钮,这个按钮的作用是什么?(D)A.测试你当天的手气B.提供最相关的一组检索结果列表C.提供最相关的一个检索结果的链接 D.直接跳转到系统认为是最相关的页面11. 利用___索引,我们可以检索任一知名专家的文献被引用的情况(D)A、Citation Index;B、Corporate Index;C、Permuterm Subject Index;D、Source Index;12. 文献信息检索的全过程包括文献信息的______两个过程(C )A.存贮和检索B.存贮和编排C.标引和编排D.存贮和标引13. 利用分类途径进行检索,其检索标识为( C )。

A.主题词 B.关键词 C.分类号 D.分子式14. 已知名叫孙钱章的作者99年出版了一本书,若想找到书名及其他信息,应在下列哪个数据库中查找?( C. )A.中文科技期刊全文数据库B.复印报刊资料全文数据库C. 超星数字图书馆D.万方数据资源系统15. 利用搜索引擎检索有关知识管理方面的学术论文,其检索式采用哪种比较好?(C)A.关键词摘要intitle:知识管理B.论文知识管理PDFC.学术论文知识管理D.学术论文intitle:知识管理16.在中国知网提供的检索服务中,(检索词扩展)起到扩展检索的作用。

济南大学信息存储与检索期末考试题库 期末考试试题复习备考

济南大学信息存储与检索期末考试题库 期末考试试题复习备考

信息检索复习题一、单项选择题1.报道范围主要为能源方面的科技报告为(D)。

A、ADB、PBC、NASAD、DOE2.(C)是出版周期最短的定期连续出版物。

A、图书B、期刊C、报纸D、学位论文3.(A )是高校或科研机构的毕业生为获取学位而撰写的。

A、学位论文B、科技报告C、会议文献D、档案文献4.了解各个国家政治、经济、科技发展政策的重要信息源是(C)A、科技报告B、政府出版物C、标准文献D、档案文献5.年鉴属于下列哪一类别(D)A、零次信息B、一次信息C、二次信息D、三次信息6.(D)是指未检出的相关信息量与检索系统中实际与课题相关的信息总量的比率。

A、查全率B、查准率C、误检率D、漏检率7.《四级英语阅读与完型填空》这本图书在中图法体系中的分类号可能是(D)。

A、G636.33B、G216.2C、I247.4D、H3198.布尔逻辑表达式:在职人员NOT(中年AND教师)的检索结果是(A)A、检索出除了中年教师以外的在职人员的数据B、中年教师的数据C、中年和教师的数据D、在职人员的数据9.布尔逻辑检索中检索符号“OR”的主要作用在于(C)。

A、提高查准率B、提高查全率C、排除不必要信息D、减少文献输出量10.根据一定的需要,将特定范围内的某些文献中的有关知识单元或款目按照一定的方法编排,并指明出处,为用户提供文献线索的一种检索工具是(C)。

A、目录B、题录C、索引D、文摘11.知识是指人类对客观世界的认识。

知识可分为(C)A.有用知识和无用知识B.基础知识和高级知识C.感性知识和理性知识D.理论知识和实践知识12.文献按载体形式可分为:印刷型、缩微型、声像型和(D)A.甲骨型B金石型C.电脑型D.机读型13.信息检索系统的功能为:报道文献信息、存储文献信息和(B)A.揭示文献信息B.检索文献信息C.宣传文献信息D.介绍文献信息14.检索系统的结构由几个部分组成:编辑使用说明、索引、附录、词表和(D)A.目次B.题录C.附图D.正文(主文档)15.为便于计算机识别记录的各个字段,每个字段都设有字段标识符,下列哪个字段的标识叙述是正确的(A)A.TI是题名的标识符B.AB是关键词的标识符C.AU是摘要的标识符D.AF是著者的标识符16.以下不是布尔逻辑算符的是(B)A.ANDB.NearC.ORD.NOT17.布尔逻辑算符通常的运算顺序是(A)A.有括号时,括号内的先执行;无括号时 NOT > AND > ORB.有括号时,括号内的先执行;无括号时 NOT > OR >ANDC.有括号时,括号内的先执行;无括号时 AND >NOT > ORD.有括号时,括号内的先执行;无括号时 AND > OR > NOT18.限定词“in”是为了缩小检索范围,提高检索速度和命中率的。

湖北汽车工业学院信息存储与检索复习题

湖北汽车工业学院信息存储与检索复习题

1.信息资源:(1)信息资源是信息的集合(2)信息资源是经过人类的选择,获取的有用信息集合(3)信息资源是经过人类组织序化的信息集合2.文献半衰期:某一学科文献从出版到50%的文献内容老化,而是去参考价值所经历的时间3.信息:信息是以生物以及其具有自动控制功能的系统,通过感觉器官和相应的设备与外界进行交换的一切内容4.核心期刊:核心期刊指的是刊载以某一科学(或专业)有关的信息较多,且水平较高,能够反映该学科最新成果和前沿动态,受到该科学读者特别关注的那些期刊5.SCI :《社会科学引文索引》是由美国科学信息研究所(ISI)编辑出版。

它是世界上最早综合性科技引文索引刊物,被公认为世界范围最权威的科学技术文献的索引工具6.影响因子:是国际通行的衡量期刊质量的一个定量指标。

通常期刊的影响因子越大,它的学术影响力和作用力也就越大7.信息检索:是信息用户为处理解决各种问题而(查找、识别、获取)相关的(事实、数据、知识)的活动及过程。

8.SSCI :是目前世界上可以用来对不同国家和地区的社会科学论文的数量进行统计分析的大型检索工具9,一次文献:是人们直接以自己的生产,科研,社会活动等实践经验为依据,经公开发表或交流后的文献。

10,EI :《工程检索》是工程技术领域的综合性检索工具,所报道的文献包括全部工程科学和工程活动。

11.ISTP :科学技术会议索引。

是ISI(美国科学信息所)是一种综合性的检索会后正式发表的会议记录。

出版社的会议记录索引数据库,列入“四大文献索引”之一。

12.信息素质:利用现有的信息解决问题的能力。

1.计算机检索常用的检索技术(技巧)有那些?答:布尔逻辑检索、位置检索、截词检索、加权检索、聚类检索、字段检索。

2.试说明文献老化的几种原因。

答:(1)科技文献产生后随着时间的移动,其流通和使用情况会发生变化(2)有些文献后来被证明是不可靠的或错误的(3)有些文献的内容是正确,但被新文献所替代而导致文献逐渐很少被人使用3.专利一般分为几种?专利文献有哪些?答:(1)专利一般分为三种:发明专利、实用新型专利、外观设计专利。

云计算在数字内容存储与检索中的应用考核试卷

云计算在数字内容存储与检索中的应用考核试卷
A.微软
B.谷歌
C.亚马逊
D. IBM
2.以下哪项不是云计算的基本服务模式?()
A. IaaS
B. PaaS
C. SaaS
D. DaaS
3.在云计算中,SaaS指的是什么?()
A.软件即服务
B.硬件即服务
C.平台即服务
D.数据即服务
4.以下哪个不是云计算的主要优势?()
A.成本效益
B.可扩展性
C.安全性
A.数据备份
B.多因素认证
C.网络隔离
D.定期安全审计
8.以下哪些是云计算在处理大数据时的优势?()
A.高度可扩展的计算资源
B.低成本的数据存储
C.快速的数据处理能力
D.简化的数据管理
9.以下哪些技术或工具常用于云计算中的数据分析和挖掘?()
A. MapReduce
B. Spark
C. RDBMS
D. NoSQL databases
10.以下哪些是云计算中的虚拟化技术?()
A. KVM
B. VMware
C. Hyper-V
D. Docker
11.以下哪些是云计算中的自动化和编排工具?()
A. Puppet
B. Chef
C. Ansible
D. Kubernetes
12.以下哪些是云计算服务模式中的共同特点?()
A.自助服务
B.广泛的网络接入
A. SSL/TLS
B. AES
C. RSA
D. SHA-1
4.以下哪些是云计算在数字内容检索中的挑战?()
A.数据隐私保护
B.数据的实时更新
C.语义理解
D.数据碎片化
5.以下哪些是云存储服务的例子?()
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1、信息检索就是对信息项进行表示、存储、组织与存取的全过程。

信息存储是指将有用信息按照一定方式组织和存放起来,信息检索是指当用户需要这些信息时,再把它们从存放的地方查找和提取出来。

2、信息检索的原理:参见书上图1-1理解
3、信息检索的一致性匹配机理:提取机理、表示机理、比较机理、判断机理、选择机理。

4、信息检索的类型:(1)按照检索对象的性质分为文献检索、数值检索、事实检索;(2)按照计算机检索技术分为脱机检索、联机检索、光盘检索、网络检索。

5、在手工检索阶段,人们常用的概念是检索工具,在计算机检索阶段,人们使用数据库,在网络检索阶段。

人们使用搜索引擎。

6、信息检索系统物理结构组成,逻辑结构的组成和原理。

7、信息检索产生于美国,其发展经历了起步期(以单词检索为特征)、成长期(以脱机检索为特征)、发展期(以联机检索为主)、成熟期(检索转向个人终端)、开放期(以网络检索为主)。

8、信息检索的趋势:跨语言检索、多媒体检索、信息检索可视化、信息检索智能化、信息检索个性化、信息检索多样化。

第二章:
1、检索策略一般都包含文档集的逻辑表示、查询的表示、相似性匹配及其排序三个要素。

2、经典的检索模型:布尔模型、向量空间模型、概率模型。

要求了解三种模型的思想和原理,重点掌握矢量模型的计算过程。

3、TF-IDF加权策略:对特征项计算权重的方法,该策略由簇内相似性和簇间不相似性两种效果来衡量。

4、将文本内容中的信息与文档结构信息结合起来进行检索的模型叫做结构化检索模型。

包括费重叠链表模型、邻近节点模型、平坦模型(扁平浏览模型)、结构导向模型、超文本模型。

第三章:
1、记录是作为一个单位来处理的有关数据的集合,它是对某一实体的属性进行描述的结果。

常见的书目记录是MARC记录结构,不同的国家有不同的记录格式,但为了进行不同机构间的目录交换,机读目录必须在物理结构、内容标识符、内容数据方面做到统一。

2、对文本信息进行检索的主要技术是顺排文档和倒排文档。

顺排文档检索方法主要有表展开法和逻辑树法两种,其中表展开法的处理过程是
3、倒排表是面向单词的一种索引数据结构,包括单词表和事件表(置入表)组成,了解倒排表和后缀数组的区别。

4、签名文件的生成和检索过程要掌握。

5、其他一些文本检索技术主要有:布尔检索、截词检索、限制检索、加权检索等。

6、文本聚类是利用同类文档相似度大、不同文档相似度小的原理对文本信息进行有效组织和分类的技术。

7、信息熵表示文本信息量的大小,用公式E=∑Pi*log2Pi计算。

8、文本聚类的方法主要有等级聚类法、动态聚类法和启发式聚类法。

9、全文检索的技术指标:索引膨胀系数、检索速度。

全文检索包括邻接检索、同句检索、同字段检索、同记录检索等方式。

第四章:
1、多媒体对象的表示和存储是尤为重要的,数据建模既要体现多媒体数据的特性又要保证在这种数据上的各种操作的灵活可靠。

2、多媒体一词含义很多,但在计算机领域中主要有两层含义:一是指信息的物理载体,二是指信息的表现或传播形式。

多媒体的关键特征主要有:多样性、集成性、交互性、实时性和互补性。

3、多媒体数据模型要能揭示多媒体数据的内容特征和语义特征,因此一个完整的多媒体数据模型要能描述多媒体的三种层次:应用层、信息员层、数据元层,多个数据元组成信息元,多个信息元组成应用中的信息集合。

目前常用的多媒体数据模型是HCM层次模型。

4、图像数据模型中物理特征主要有颜色、纹理、形状、轮廓等视觉信息,音频数据模型的底层特征主要有音强、音色、音调、响度、过零率、带宽等,视频数据模型主要分为帧、镜头、场景和故事情节四个层次。

5、数据压缩是以一定的质量损失为容限,按照某种方法从给定的信息源中推出简化的数据表述,通过减少信号空间容量,使信号能安排到给定的信息集或样本中。

多媒体数据之所以能够被压缩是因为原始的多媒体数据存在很大的冗余。

6、多媒体压缩的基本要求:可还原、压缩比高、重现质量好、成本低、实时性好。

7、多媒体压缩的分类:(1)有损压缩和无损压缩;(2)预测编码、变换编码、统计编码、分析-合成编码、混合编码。

8、图像、音频、视频的压缩标准
9、基于内容的多媒体检索就是从媒体数据中提取特定的信息线索,然
后根据这些线索从大量的多媒体数据库中找寻需要的多媒体信息。

10、多媒体信息检索系统的结构:数据插入子系统、信息查询子系统、媒体处理子系统、多媒体数据库。

第五章:
1、Web资源检索方法主要有三种:基于超文本/超媒体的浏览方式、基于目录的信息查询、基于搜索引擎的信息检索。

2、Web信息组织主要包括:超文本、标记语言
(SGML/HTML/XML)、超文本传输协议、超文本浏览器。

3、元数据是关于数据的组织、数据域及其关系的信息,简言之就是关于数据的数据主要包含四种元数据类型。

4、搜索引擎的概念、功能、组成结构、原理和类型,
第六章:
1、并行信息检索和分布式信息检索是信息检索理论与应用的提高,并行处理是指把计算机任务划分为更小的子任务,然后利用多个处理器处理同一个任务的不同子任务,各处理器采用并行工作方式,从而提高检索效率。

2、根据指令流和数据流的不同将计算机分为四种体系结构:SISD、SIMD、MISD、MIMD。

3、并行检索技术分为数据并行和功能并行。

在数据并行技术中,利用倒排表进行并行检索又分为数据集(文档集)分割和项分割两种,其中文档集分割又分为物理文档分割和逻辑文档分割,了解两者之间的区别与联系。

4、分布式检索主要是指在分布式的环境中,利用分布式计算机和移动代理技术从大量的、异构的信息资源中检索出对用户有用信息的过程,分布式检索典型的特征就是具有异构性。

一个简单的分布式信息检索系统由多个数据集服务器和一个和多个代理处理器两大部分组成。

5、分布式检索模式:基于元搜索引擎的分布式检索、基于Z39.50的分布式检索、基于XML的分布式检索、基于Web服务的分布式渐叟。

6、数据集选择就是指怎样选择最合适的信息资源库的子集,并保证这些子集可能包含与提问式相关的文献的数量最大。

7、异构数据库是指结构相异的数据库,这里的异构包含系统级异构和语义级异构。

8、跨库检索是指以多个异构数据库的数据源为对象的检索。

第七章:
1、人工智能与自然语言检索是信息检索发展的前沿领域,也是信息检索发展的主要趋势和方向。

人工智能检索技术主要包括专家系统、数据挖掘、知识发现和信息抽取。

2、自然语言从用户角度讲就是用自然语句作为提问的输入,这就涉及到文本的语言结构和语义分析等技术,将信息处理深入到了文本的内容,而非仅仅是依据文本中提取的索引词的信息。

所以自然语言处理设计语言学、心理学、认知学、人工智能等多领域学科。

2、自然语言理解的层次包括六个方面:语音学、词形学、词汇学、句法、语义学、语用学。

第八章:
1、用户界面是信息检索者与信息检索系统之家的交流媒介,包含两层含义:一是系统给用户的视觉呈现,二是用户使用计算机检索系统的综合操作环境。

2、用户类型按照用户使用计算机的频度分为新手用户、平均用户、专家用户、偶然用户四种。

3、用户检索行为是指用户为获取所需信息,在与计算机交互过程中的一系列身体活动和心理活动,从本质上说用户检索行为时一种试验和探索的过程。

4、构成信息检索的主要因素有:用户行为、检索任务、系统性能、检索结果。

5、用户界面设计的原则和种类。

7、人机交互的一个重要方面就是用户界面技术的评价方法,除了查准率和查全率外,还有其他一些标准如用户学习系统的时间、实现基准任务所需的时间、出错率和界面使用的一致性等。

8、信息可视化的含义及作用。

第九章:
1、信息检索评价就是指运用科学的方法,按照设定的检索指标体系对信息检索结果进行评价的过程。

2、信息检索评价的内容包括资源的收录状况、数据的质量、检索的功能与效率、系统的功能及检索结果的反馈。

3、相关性是指信息检索的结果具有不确定性,不像数据检索一样具有精确性,他只能检索与用户提问最接近的文档。

4、相关性概念具有关系、直觉、多维和动态的特点。

5、信息检索的系统性能指标通常包含查全率、查准率和响应时间三个主要要素。


6、信息检索系统的评价指标体系包含:系统性能指标、系统效益指标、费用/效果指标、费用/效益指标等。

7、信息检索评价的过程与方法:确定评价对象及目标、选择评价方式、设计评价方案、实施评价方案。

8、经典的检索评价实验:MEDLARS系统评价实验、SMART检索实验等。

9、信息检索评价实验平台:TREC。

相关文档
最新文档