信息检索复习资料

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
因此,为了达到较高的查准率和查全率,如果检索工具提供了主题词这一检索途径的话就应该选择主题词来进行检索,而不应该选择关键词。选用主题词途径检索,既能满足较高的查准率、查全率,又能提高检索速度。关键词它适合于检索新近出现的信息,或者实施查全率要求不高的检索。
14简述二次文献的类型?
二次文献分为目录、题录、索引、文摘四种。目录是一批相关文献信息的著录集合,它以报道文献出版或收藏信息为主要功能的工具。
22什么是位置算符?它在文献检索中起什么作用?
位置算符又称邻接算符,适用于两个检索词以指定间隔距离或者指定的顺序出现的场合。位置算符是提高检索查准率的一种重要手段。
23需要扩大检索范围时,如何调整检索策略?
需要扩大检索范围,调整策略的方法有:①减少“与(AND)”算符,增加同义词或同族相关词用逻辑或(OR)将它们连接起来;②在词干相同的单词后使用截词符“?”;③去除已有的字段限制、位置算符限制(或者改用限制程度较小的位置算符)。
内容特征和外表特征的区别是:与文献信息内容特征的关系密切的是内容特征,反之是外表特征。
10国内通用的分类法有哪两种?它们的类号设置有什么主要区别?
国内通用两种分类法是《中国图书馆分类法》和《中国科学院图书分类法》。它们的类号设置的区别是《中国图书馆分类法》混合使用字母和数字,而《中国科学院图书分类法》使用纯数字作为类号。
17什么是数据库,它的结构由哪几部分组成?
按照国际标准组织标准ISO/DIS5127规定,数据库是指至少由一种文档(file)组成,能满足特定目的或特定功能数据处理系统需要的数据集合。
从使用者观点观察,数据库主要由“文档——记录——字段”三个层次构成。
18什么场合可以使用截词方法?(举例说明)
当某些英语检索词词干相同、词义相近,但词尾或词中间有变化时(多数英语单词的单复数变化和英美不同拼写形式),可以采用截词符,或称通配符扩展检索词。截词检索可以扩大检索结果。
9什么是文献的内容特征和外表特征?这两者有何区别?
与文献信息主题内容没有关系或关系不大的信息称为文献信息的外表特征,例如,著者、著者单位、期刊名称、专利说明书的专利号、政府报告的报告号等。与文献信息主题内容密切相关的信息称为文献信息的内容特征。文献信息内容特征主要有各种形式的主题词和分类号。文献的标题因常常能够反映文献的主题,常被归入内容特征的范畴。
24需要缩小检索范围时,如何调整检索策略?
缩小检索范围,调整策略的方法有:①减少同义词或同族相关词;②增加限制概念,用逻辑与(AND)将它们连接起来;③使用字段限制,或者限制检索词在指定的基本字段出现,或者指定辅助字段,限制结果的文献类型、语种、出版国家;④使用适当的位置算符;⑤使用逻辑非(NOT)算符,排除无关概念。
索引与目录的根本区别就在于著录的对象不同,目录所著录的是一个完整的出版单位,如一种图书、一种期刊等,而索引所著录的则是完整的出版物的某一部分、某一观点、某一知识单元,因此,索引能解决目录只对文献作整体的宏观著录的不足,满足读者对文献内容单元的微观揭示和检索的要求,提高文献检索的深度和检索效率。
目录:按次序编排供查考的图书或篇章的名目
20什么是布尔逻辑算符?布尔逻辑算符一般有哪几种?
规定检索词之间的逻辑关系的算符,称为布尔逻辑算符。布尔逻辑算符包括逻辑或(OR)、逻辑与(AND)和逻辑非(NOT)。
21优先算符“( )”有什么作用?
优先算符“( )”的作用是在多个逻辑符号混合使用时,改变它们的运算顺序。布尔逻辑运算符的优先级顺序:()〉NOT〉AND〉OR.
报纸:人民日报
特种文献:科技报告、会议文献、专利文献、学位论文、政府出版物、标准文献、产品资料、科技档案
美国政府的四大报告1、国防部的AD报告2、商业部的PB报告3、国家航空及宇航局的NASA报告4、能源部的DOE报告。
2现代科技文献具有的特点哪些?
答:(1)数量多、增长快,(2)出版形式多、文种多,(3)文献异常分散,(4)文献失效加快,(5)报道内容重复交叉,(6)文献总体质量下降
检索时间范围、分析用户的检索评价要求
(2)选择检索工具:根据检索课题的要求,选择最能满足检索要求的检索工具书,不同
的资料类型就应该选用不同的数据库
(3)确定检索策略:确定检索途径、制定检索策略
(4)调整检索方案:确定了具体的检索方法之后,就要利用所用数据库,在一定的年代
范围内具体查找,以获得文献线索。用户对每次检索结果在作出判断,并对检索策略做
25 CNKI中国期刊全文数据库共有几种基本的检索方法?
共有三种,它们是:
分类导航。利用系统提供的专辑栏目及其展开的分类导航树查找相关文献,适用于对一个学科的文献做全面调查的场合。
初级检索。是利用检索项对某个指定字段进行的检索。
高级检索。是指设置多个检索条件和逻辑组合关系,查找同时满足这些条件和逻辑关系的文献。
28 CNKI期刊全文及博硕士论文数据库、CNKI中国期刊全文数据库用的是什么浏览器?此全文浏览器有什么作用?万方数据资源系统阅读全文使用的是什么格式浏览器?超星电子图书使用什么阅读器?
6如何针对不同时间要求的文献信息,选用不同的文献信息源?
答:以信息利用者的观点,针对不同时间要求的文献信息应该使用不同的文献信息类型。例如,查找当前最新的信息(一、两个月之内的信息),应该通过互联网以及当前最新的报纸、期刊、广播、电视等媒体;两个月之前到十年之内的信息应主要通过网上图书、期刊类的数据库解决;5~20年前的信息应除了期刊之外,还可以通过印刷版的图书和手册性工具书来查找。
19使用截词检索应注意的哪些问题?
使用截词方法时需注意四个问题:一是截词符要紧接在词干后面,截词符和词干之间不能有空格。二是避免将检索词的词干截得过短,一般应在三个字母以上。三是截词应该合理使用。一般不可能出现词尾变化的单词其后不必再使用截词。四是从希望出现的单词中取尽可能多的公共字母作为词干,以提高查准率。
出相应的修改和调整,知道得到满意的结果
(5)获取原文:利用全文数据库直接获取,利用文献传递系统获取、利用文摘数据库的
原文服务、利用OPAC检索系统,进行馆际互借。
16什么是追溯法?它有什么优缺点?
追溯法又称回溯法,它是从已有的文献后面所附的参考文献入手,逐一追查原文的方法。其优点是:在没有检索工具或检查工具不齐全的情况下,借助此种方法,也可以查得一批有关文献信息。其缺点是:原文作者引用的参考文献是有限的,不可能列出全部有关文献,而且有的引用文献又与原文关系并不密切,参考价值不大。因此用此法查找文献比较费时,漏检和误检的可能性较大。
3什么是核心文献、相关文献和边缘文献?
答:核心文献通常是指与本学科发展水平、发展动向密切相关的一些文献。如核心期刊等。相关文献和边缘文献是指内容与学科的关系相对疏远一些的文献。相关文献和边缘文献是本学科和其它学科相互渗透、互相结合的结果。
4什么是文献?构成文献的有哪四个要素?
答:文献的定义是记录有知识的一切载体称为文献。构成文献的四要素是:知识内容,信息符号,载体材料,记录方式。
题录是将图书、报刊等文献中论文的篇目按照一定的排检方法编排而成的,供人们查找ຫໍສະໝຸດ Baidu目出处的工具。
索引是将书刊内容中所论及的篇名、语词、主题等项目,按照一定的排检方法加以编制,注明出处,供读者查检使用的检索工具。索引是对文献内容较深人的揭示。
文摘是以精练的语言把文献信息的重要内容、学术观点、数据及结构准确地摘录下来,并按一定的著录规则与排列方式编排起来,供读者查阅使用的一种检索工具。
题录:只含著录事项而无摘要的文献款目。如果含摘要,则一般称为文摘。
文摘:又摘要,对文献的主要内容所做的简略而确切的叙述,一般不加评论、补充或解释。
索引:索引侧重于让你找到要找的文章,目录侧重于显示整篇文章的结构
15.论述信息检索的步骤?
(1)分析研究课题,明确检索要求:分析课题的主要内容、确定课题的文献类型、确定
11分类法中的上位类、下位类和同位类?
在《中图法》以及任何类似的分类表中,被区分的类称为上位类。相对地说,区分出来的类就是下位类。处于同一上位类下的同一层次的下位类称为同位类。
12多概念主题的文献如何确定分类号?
给多概念课题确定分类号的方法,首先需要应用单概念课题分类方法,其次要区分属于并列概念课题还是应用性课题。如果是并列概念课题,凡是有主次者,应取其重点或主要研究对象归类;凡是无主次的,课题所涉及的类别都应该查找。如果属于应用性课题,应用于一个领域的应在所应用或受影响的类目中查找。应用于多个领域的则在该理论、方法、工艺等本身所属的类目中查找。
5电子文献的主要类型和文件格式是什么?
答:
(1)按照载体的形态,电子文献可以有软磁盘(FD)、只读光盘(CD-ROM)、可擦写光盘(CD-RW )等之分;
(2)按照文献的电子格式,电子文献有文本格式的txt文件、doc文件、pdf文件,图像格式的gif文件、jpg文件以及标记文件格式的html文件和xml文件之分;
7什么是ISSN和ISBN?
答:ISSN是国际标准连续出版物号(International Standard Serial Number,简称ISSN)。
ISBN是国际标准书号(International Standard Book Number,简称ISBN)。
8信息索原理是什么?
信息检索的原理可以表述为将检索提问标识与存贮在检索工具中的标引标识进行比较,含有两者一致或信息标引的标识包含着检索提问标识的信息就是检索命中的信息。
27 CNKI中国期刊全文数据库初级检索和高级检索的区别在那里?
区别在二个方面:
1)检索的字段数量不同。初级检索的字段数量只有一个,因此,它每次只能检索对一个检索字段的检索词进行检索。高级检索的字段有两个,它可以同时对两个不同的检索字段的检索词进行检索。
2)检索的布尔逻辑算符不同。初级检索的字段数量只有一个,即利用二次检索对前一次检索结果的"与"检索。在高级检索中除了可以利用的字段有两个,利用二次检索对前一次检索结果的"与"检索之外,它可以同时对两个不同的检索字段的检索词进行"或"和检索。
26简述CNKI中国期刊全文数据库的二次检索?它是否只能检索二次?
二次检索是在前次检索结果的范围内再次进行查找,以达到缩小检索范围,使检索结果逐步接近课题要求的目的。其作用相当于在前后两次检索之间做逻辑与(AND)运算。不管是初级还是高级检索界面,只要检索结果的篇数允许,二次检索可以反复做,直到满足课题要求为止。
(3)按照出版周期和内容特点,电子文献可以有电子期刊,电子图书,电子报纸以及数据库等之分;
(4)按照内容的性质和时效性,电子文献可以有论文文献和动态消息之分;
(5)按照版权状况,电子文献又可分为有版权电子文献和无版权电子文献两类;
(6)从文献信息利用的角度来看,可分为有版权的电子期刊、电子图书、报告的学术价值相对较高,而单篇论文和动态性的电子文献有时虽然没有注明版权,也有相当的参考价值。
13什么是关键词?什么是主题词?简述它的特征和适用场合?
关键词,属于自然语言的范畴,未经规范化处理,也不受主题词表的控制,只从字面抽
取,直接以作者在文献中的用词作检索,基本上不对词语加以控制。如:对于“电子计算机”这一概念,可有电脑、计算机、微机、PC等不同形式来表达。
主题词,是规范化的检索语言,它对文献中出现的同义词、近义词、多义词以及同一概念的不同书写形式等进行严格的控制和规范,使每个主题词都含义明确,以便准确检索,防止误检、漏检。如:对于电子计算机、电脑、计算机、微机、PC等表达同一概念的不同书写形式规范为“计算机”。主题词表是对主题词进行规范化处理的依据,也是文献处理者和检索者共同参照的依据。
第一部分:基本常识
1.文献按照出版形式可分为哪几种类型?举例。
图书、期刊、报纸、特种文献。
图书:专著、文集、教科书、普及读物、百科全书、年鉴、手册、词典等
期刊:化学学报、煤炭学报、电工技术学报、高等教育研究、建筑工程与科学在CNKI期刊全文数据库中检到共209条记录:国际城市规划、建筑结构学报、交通运输工程学报、建筑经济、土木工程学报、岩土工程学报、岩土力学、空间结构、地震工程与工程振动、中国给水排水、工程力学世界建筑工业建筑工程勘察中外建筑工程建设等。
相关文档
最新文档