文献检索 资料
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§第1章数字资源的检索原理与检索检索策略
1.数字文献及其检索的基本概况
文献定义:记录有知识的一切载体
数字文献检索:是指通过检索系统,采用一定的技术手段,根据一定的原则,在数
据库或其他形式的数字文献中自动找出用户所需相关信息的过程。
广义的检索包括:信息的存储和检索两个过程
狭义的检索仅包括:用户的信息检索过程。
文献构成:由知识、载体和记录方式3个要素构成
2.数字文献的检索技术
(1)布尔逻辑检索技术
通过标准的布尔逻辑关系符来表达检索词与检索词间逻辑关系的检索方法。主要的布尔逻辑关系符有三种:逻辑与、逻辑或、逻辑非。在数据库检索式中,可以对检索字段进行逻辑组配,也可以对检索词进行逻辑组配。但在不同的数据库和搜索引擎中,所使用的逻辑符号可能有所不同,中文数据库一般使用“*”、“+”、“-”,外文数据库和搜索引擎一般使用“and”、“or ”、“not”,中文搜索引擎一般使用“”(空格)、“+”、“-”。
(2)截词检索技术
是指在检索式中用专门的符号(截词符号)表示检索词的某一部分允许有一定的词形变化。在检索中,常会遇到一些词干相同、词义相近的检索词或有英、美不同拼写法的词,为了减少检索词输入量,节省机时,同时又扩大检索范围,保证查全率,可使用截词检索。截词符一般用“?”或“*”表示,一般应用在外文数据库和外文搜索引擎中的检索中。不同系统,不同数据库,其代表的含义可能有所不同。
按截词位置可分前截词(左截词、后方一致)、后截词(右截词、前方一致)、前后截词和中间截词。
(3)邻近检索技术(位置检索技术)
邻近检索又称位置检索,指通过检索式中的专门符号来规定检索词在结果中的相对位置。广泛使用的主要有相邻位置算符(W)、(nW)、(N),(nN)等。
①(W)与(nW)算符
(W)算符:表示此算符两侧的检索词必须按此前后顺序相邻排列,词序不可变,且两词之间不许有其他的词或字母,但允许有一空格或标点符号。如biological (W) control相当于检索biological control,CD (W) ROM相当于检索CD ROM或CD-ROM。
(nW) 算符:表示此算符两侧的检索词之间允许插入最多n个词,且词序不可变。如wear (1W) material相当于检索wear materials、wear of materials等词。
②(N)和(nN)算符
(N)是near的缩写,表示此算符两侧的检索词必须紧密相连,词序可变,词间不允许插入其他词或字母,但允许有一空格或标点符号。(nN)表示两词间可插入最多n个词,词序可变,如检索式environment (2N) protection 就可检索出包含“environment protection”、“environment of the protection ”、“environment of water protection”、“protection of forest environment”
等内容的结果。
邻近检索对提高检索的查准率和查全率有重要作用,但网络检索中基本上只支持(W)和(N)检索式,主要应用于外文数据库和外文搜索引擎中。
(4)字段检索技术
字段检索是限定检索词在记录中出现的字段范围,检索时,计算机只对限定字段进行查找。
检索字段主要有:如题名、主题词、关键词、文摘、著者、语种、刊名、来源、时间、号码等。
常用字段代码:题名(Ti)、著者(Au)、文摘(Ab)、关键词(Kw、Ky)、刊名(So、Jn)
常用“=、:、/、in”等连接检索字段与检索词。注意:不同的数据库其字段代码可能不同
3.检索效果评价的指标?
选择数据库可借鉴国外称之为“4C”的原则:
①内容(Content)。
②范围(Coverago)。
③时效(Currency)。
④费用(Cost),了解所选数据库的收费标准。
在前一次检索结果的基础上的再次检索,在初级检索、高级检索和专业检索中都可以进行二次检索。
只需“在结果中检索”框中点击,并且选择不同的逻辑关系(并且、或者、不包含),然后重新选择检索项,输入相关检索词或直接输入检索式,点击“检索”按钮,便可得到新的检索结果。
二次检索可以多次使用,从而实现复杂的检索。
二次检索功能:在上一次检索的基础上,可进行重新检索或二次检索。(①在结果中检索,相当于使用逻辑与;②在结果中添加,相当于使用逻辑或;③在结果中去除,相当于使用逻辑非。)
文献具有外部特征和内容特征。外部特征有题名(书名、篇名和刊名)、著者(个人、团体)、号码(专利号、标准号、国际标准书号ISBN和国际标准刊号ISSN等)、机构名(责任者所属机构、出版发表机构)以及时间等;内容特征指文献内容所属的学科和文献内容的研究对象。注意著者与机构名的区别。
中文:三大数据库厂商
同方知网(CNKI):期刊论文、学位论文、报纸全文重庆维普:期刊论文
万方数据:期刊论文、学位论文、会议论文、科技信息、商务信息、法律法规
人大书报资料中心:人大报刊复印资料数据库
§第2章中文文献数据库
1. 《中国期刊全文数据库》概况:CNKI产品
中国期刊全文数据库(以前称《中国期刊网》)(1994--)中国期刊全文数据库(世纪期刊)(1979--1993)中国优秀博硕士学位论文数据库(1999-- )中国博士学位论文全文数据库
中国优秀硕士学位论文全文数据库中国重要报纸全文数据库(2000-- )
中国重要会议论文全文数据库(2000-- )中国引文数据库
厂商:中国知网
数据库名称:中国期刊全文数据库
数据库起始年代:1978 -- 1993 ; 1994 –
文献类型:国内期刊论文
学科范围:包括社会科学、自然科学各学科的综合性数据库
数据库类型:全文数据库
检索方式(途径):初级检索简单检索多项单词逻辑组合检索:多项是指可选择多个检索项,通过点击“逻辑”下方的“+”增加一逻辑检索行;单词是指每个检索项中只可输入一个词;逻辑是指每一检索项之间可使用逻辑与、逻辑或和逻辑非进行项间组合。、高级检索、(运用逻辑组配关系,对检索条件进行组配。提供两种方式:向导式检索、直接输入检索式检索。)专业检索通过检索式进行检索,编制检索式时要注意以下几点: 1)字段名称。必须用正规名称,不要用括号内的名称。
2)多个字段:用and、or、not组配,并用“()”改变运算顺序。
3)所有符号和英文字母(包括所示操作符),都必须使用英文半角字符。
4)逻辑关系符(and、or、not)及运算符(#、%)前后要空一个字节,运算符($、/SUB、/NEAR、/PREV、/SEN)必须大写。
使用“同句”、“同段”、“词频”时,请注意:用一组西文单引号将多个检索词及其运算符括起,如‘流体 # 力学’。
、分类检索检索导航体系将各学科、各门类的知识分成十大专辑。
展开某专辑,类目名称有“√”图标,表示有下位类,没有这个“√”图标表示类目已是最后一级。
进行分类检索时,点击最后一级类目名称,将检索出此类目的所有文献。
而点击某类目后的“”图标则能检索任意一级类目所属的文献。
、刊名导航提供:刊名首字母导航、专辑、数据库刊源、刊期、出版地、主办单位、发行系统、期刊荣誉榜、世纪期刊以及核心期刊等导航。
检索:按刊名、ISSN和CN等
浏览或检索到相应的期刊后,再逐渐点击某一刊物名称、选择刊期,即可获得该刊物该年度该期所发表文献的文献记录。
检索字段:篇名、作者、关键词、机构、中文摘要、引文、基金、全文、中文刊名、ISSN、主题词、第一作者等
文件格式:CAJ、PDF
浏览器:Cajviewer、Adobe reader
CNKI知识搜索:
特别要求:熟练掌握初级检索、高级检索方式,会实际检索。
2.《中文科技期刊数据库》
厂商:重庆维普
数据库名称:中文科技期刊数据库
数据库起始年代:1989年以来