《文献检索》第二章文献信息检索基础知识1
2第二章 文献检索基础(正式版)

第二章文献信息检索基础第一节文献信息检索的概念与过程一、文献信息检索的作用文献信息检索的作用主要体现在以下两方面。
1.充分利用文献信息资源,避免重复劳动科学研究具有继承和创造两重性,科学研究的两重性要求科研人员在探索未知或从事研究工作之前,应该尽可能地占有与之相关的文献信息,即利用文献检索的方法,充分了解国内、国外,前人和他人对拟探索或研究的问题已做过哪些工作?取得了什么成就?发展动向如何?等等。
这样才能做到心中有数,防止重复研究,将有限的时间和精力用于创造性的研究中。
因此,文献信息检索是科学研究必不可少的前期工作。
2.为人们更新知识,实现终生学习提供门径在当代社会,人们需要终生学习,不断更新知识,才能适应社会发展的需求。
美国工程教育协会曾估计,学校教育只能赋予人们所需知识的20%~25%,而75%~80%的知识是走出学校后,在研究实践和生产实践中根据需要,不断再学习而获得的。
因此,掌握文献信息检索的方法与技能,是形成合理知识和更新知识的重要手段,是做到无师自通、不断进取的主要途径。
二、文献信息检索的概念1.信息检索的概念:信息具有共享性。
信息资源共享(information resource sharing)是当今社会的一个发展趋势。
为了分享人类共同的知识财富、研究成果,人们必须通过一种科学的方法从取之不尽的信息资源中去识别和获取所需要的那部分信息,这个过程就是信息检索(information searching)。
信息检索在信息处理和增值中具有重要意义。
信息的检索、利用和创造是一个循环和增值的过程,人们通过检索获得信息,经过处理筛选出自己需要的部分,在利用信息的过程中又创出新的信息,这些信息经过核准后又被标引、组织进检索工具,再提供人们使用,信息在这个循环的处理过程中不断得到扩充,它的增长是没有穷尽的。
如下图所示:保留/信息检索的概念有狭义和广义之分。
从广义上讲,信息检索应该包括信息的存贮与检索两方面的含义。
文献信息检索基础知识

文献信息检索基础知识第一节概论科学技术的发展,具有连续性和继承性,科学技术的发明创造,需要依靠经验、材料和理论的不断积累,没有科学上的继承和借鉴,就没有提高。
任何一个科技工作者,都有赖于在前人已经取得成就的基础上进行不断的研究和探索。
在科研选题过程中,要首先了解所研究的学科领域发展现状与趋势,对自己挑选的课题进行查新,以免重复别人的劳动。
在课题研究过程中,要借鉴别人已有的成果,比如一些统计、实验数据,可以直接利用,没有必要自己再做一次,节省研究经费与时间;对别人研究没有取得成功的地方,要分析原因,可以避免研究走入歧途。
要完成这一切,都离不开科技文献的检索与利用。
科技文献是科学技术研究成果的记录,积累了许多有用的事实、数据、理论、方法和科学假设,反映了科学技术研究的进展和水平,是科技信息的主要来源。
科技文献数量急剧增长,可以说是“知识爆炸”,在浩如烟海的文献面前,盲目地查找自己所需要的文献很困难,对信息污染难以分辨;专业文献出版分散,如果只注意查找本专业的核心期刊,已看不到专业文献的全貌,仅能了解其中的一小部分而已,因为大量的专业文献分散出版在其它刊物里。
文献老化加快,出版种类繁多,我们如果想了解某一数据、某一事件或事实,更如大海捞针,无从下手。
要快速、全面、准确地获得所需要的文献信息,就必须掌握科学的文献查找方法,因此就必须学习科技文献检索知识。
掌握了科技文献检索的方法,首先可以节省查找文献的时间,据调查统计,一个科技工作者在其科学研究生涯中花在查找文献上的时间占整个科研时间的40~50%,如果掌握正确的文献检索方法,将缩短查找文献时间,从而延长科研寿命。
其次有利于专题文献查全,由于专题文献出版分散特点,使得只从核心期刊上获取专题文献很难查全,掌握文献检索方法,在检索工具或数据库中去检索,就能克服这一不足。
再者可以克服自然语言和学科专业语言障碍,由于当今文献语种很多,而一般科技工作者除母语之外仅掌握1~2门外语,这就为了解世界先进技术带来困难。
文献检索第二章

A
7
数据检索 :指以数值或图表表示的数据为检索对象。在检索 工具中存贮着大量的数值型数据,如各种统计数据、人口数据、 气象数据、企业或财政数据、科学技术常数等,并提供一定的 运算推导能力。它是一种确定性检索,用户通过检索可获取经 过核实、整理的数据信息。可以借此进行定量分析。而该种检 索工具系指有关参考工具书。
A
4
二、文献信息检索的基本原理
文献信息检索原理,简言之,就是检索提问标识与存贮在 检索工具中文献的标引、标识进行比较,如果两者一致,或者 工具中文献的标引标识包括了检索提问的标识,那么包含标引 标识的工具中的文献线索、数据或文献等就输出(即检索出) 这种文献信息表明为命中或切题的。
早期的文献信息检索,主要根据文献的外表和内容的特征,
采用手工方式实现检索。随着计算机技术迅猛发展,引进
了文献信息的检索,文献检索逐渐进入机械化、计算机化
新阶段,提高了检索速度,拓展了检索领域。
A
5
三、文献信息检索的类型
1.按其存贮内容与检索的对象划分
文献信息 线索检索
按其存贮内 容与检索的
对象划分
事实检索
数据检索 全文检索
A
6
文献信息线索检索 :检索工具中存贮的是目录、题录、文 摘、索引等二次文献信息,用户通过检索所得到的是有关课题 的一系列文献信息线索 。
根据一定方法,从已经存贮好的有关大量文献信息
集合中,查出特定的相关文献信息的全过程。具体而言,
就是依据特定课题的要求,利用各种检索工具如目录、
文献检索-第二章 文献检索基本知识(100829)(包括第三章)

二、检索语言的种类
1、按表达文献特征划分
描述文献外部特征 检索语言 描述文献内容特征
学科分类—分类索引
描述 文献 内容 特征
研究对象—主题索引
所包含的关键词—关键词索引
分析单元性概念—叙词索引、单元词索引 分子式、结构式—分子式索引、结构 式索引 地理位置等特种内容—经纬度索引等 特种索引
2、按结构划分 分为分类语言、主题语言、代码语 言、引文语言。
第二节 检索语言
一、检索语言的定义:
从上节“检索原理”可以看出, 必须有同样的检索标识系统(即检索 语言)来标引文献特征和检索提问, 这是文献检索成败的关键。这就要求 信息标引人员和信息用户应当具有必 要的检索语言的基本知识。
文献检索时,检索标识和用户提 问都需要用一定的语言来表达,这种 标引人员表达检索标识和信息用户(检 索者)表达检索提问所共同采用、共同 理解的语言,就是信息检索语言。
②叙词语言 它是以叙词作为文献内容标识和检 索依据的一种主题语言。叙词是从文献 的题目,摘要或正文中抽取出来,用以 表达文献基本内容的概念单元。叙词受 词表控制,词表中词与词之间无从属关 系,都是相互独立的概念单元。检索时, 利用这些概念单元组配起来,表达一个 复杂的概念。叙词语言特别适用于计算 机检索。
③关键词语言 它是以关键词作为文献内容标识和检 索依据的一种主题语言。关键词是从文献 的题目、正文或摘要中直接抽取出来,未 经规范化处理的自由词汇。关键词不受词 表控制,标引文献时根据文献内容选择恰 当的词汇进行组配,以表达文献的内容特 征。
第三节
检索工具基础知识
一、什么是检索工具? 检索工具是积累和查找文献线索的 工具。它报导文献的存在,揭示文献 的内容,帮助科技人员鉴定和选择文 献、开发和利用文献资源。检索工具 具有存贮和检索两方面的功能。
文献信息检索第2章 习题与答案

第2章文献信息检索基础知识1.简述文献信息检索的定义和类型。
答:1)定义:文献信息检索就是检索者根据特定的需求,借助于某种检索工具(检索系统),采用一定检索策略、方法和步骤,从信息集合中查找所需文献信息的过程。
2)类型:按文献信息检索的内容划分:文献检索、事实检索和数据检索按信息资源检索技术划分:全文文本检索、多媒体检索、超文本检索和网络信息资源检索。
根据检索手段划分:可分为手工检索和计算机检索。
2.概述按文献不同特征的文献信息检索语言的分类。
答:(1)描述文献外部特征的检索语言可简要概述为:题名——题名索引著者——作者索引、团体著者索引报告号索引外部特征的检索语言文献编号合同号索引存取号索引其他——人名索引用文献目录等(2)描述信息资源内部特征的检索语言可概述为:分类语言内容特征的检索语言标题词语言主题语言叙词语言单元词语言关键词语言3.了解和掌握《中国图书馆图书分类法》的分类体系。
分几大部类和几个大类?计算机网路方面的图书,按《中图法》分类属哪一大类?分类号是什么?答:《中国图书馆图书分类法》的分类体系共分五大部类22大类;计算机网络方面的图书属于TP类,分类号是TP393。
4.文献信息检索工具的类型有哪些?答:1) 按文献信息的著录形式划分:目录、题录、文摘、索引;搜索引擎。
2)按文献信息存储介质划分:手工检索工具、计算机检索工具5.运用布尔逻辑检索技术编写“信息素养对大学生终身学习、自学和创新能力的影响”课题的布尔逻辑检索式。
答:检索式为:信息素养AND(大学生AND(终身学习AND自学AND创新))6.文献信息检索的方法、途径分别有哪些?分析课题“自动冲床进料机构的机电一体化技术研究”应选哪种检索方法和检索途径。
答:文献信息检索方法有:直接检索法和间接检索法----循环法、追溯法、常用法(抽查法、逆查法、顺查法)文献信息检索途径有:分类检索途径、作者检索途径、主题检索途径、题名检索途径、号码途径、引文途径等。
第二章 文献信息检索基础知识

这类文献特点是体积小、信息密度高、 轻便,易于传递,保存容易。但使用时必须 借助于放大设备。
电子型文献(Electronic Document)
原称机读型文献。是指以数字化技术将文献
存储在光、磁载体上,通过计算机或网络进行阅
2、学术期刊 (Periodicals,Journal,Magazine):
指有固定名称和统一的出版形式,按一定规律定
期或不定期连续出版的文献载体,与报纸属于称
连续性出版物。
(1)期刊的特征:
统一的刊名,有连续的年、卷、期及页码;
有国际标准连续出版物刊号ISSN (International Series Standard Number) ISSN由8位数字分两段组成,如1000-0135,前7 位是期刊代号,末位是校验号。
(3)期刊著录格式:
作者(多作者用逗号分开,超过3个者用“等或 et al”). 文章题目[J].刊物名称,年代,卷数(期 数):页数 如: Porter MF, Zhang J. An algorithm for suffix stripping. Program, 1980, 14(3):130~137
P:专利文献类别代码
(2)专利文献著录格式
专利申请者.
专利题名:专利国别(或地区), 专利号[P].出版日期. TACHIBANA R, SHIMIZU S, KOBAYSHI S, et al. Electronic watermaking method and system: US, 6,915,001[P]. 2002-04-25.
(1)图书的特征
图书没有统一的开本
第二章文献信息检索基本知识

运算符
1、布尔逻辑运算符(Boolean Operators) 2、通配符和截词符 3、字段限制符
、
1、布尔逻辑运算符 Boolean Operators
名 称
逻辑 与
逻辑 或
逻辑 非
运算符
AND * OR +
NOT -
逻辑关 系
举例
作用
限定 A AND B 缩小
需求分析
信息源
检索工具 检索方法
检索途径 检索标识
确定学 科范围、
主题概 念。
确定信 息源类 型、 语
种、时 间和空 间范围。
选择数据 库及其文 档、搜索 引擎及网 站。
选择检索 途径
及其检索 标识
制定检索 策略
调整检索 策略
查找文献 线索
索取原始 文献
检索提 问表达 式
根据检索 结果,扩 大或缩小 检索范围, 提高查全 率和查准 率。
以工程索引EI为例,通配符和截词符的检索 表达式及检索结果如下:
算符 *
$
含义
结果
利用它可以输入检索词的起始部分,而 实现一簇词的检索
自动取词根运算符
Alter*可命中 alter,alternando,altern ant,alternate,alternati ve等
$alter可命中 alter,alternate,alterna tive
用检索 工具查 找到文 献线索
馆藏文献借阅、 复制 全文数据库 网上获取 向作者索取
检索提问表达式=检索词+运算符
检索词
分为两类: 字词类:名词术语(如叙词或关键词),或者是个
人或机构名称。 如:行政管理、王平、西安邮电大学等。
文献检索(第二章 )

特种文献
(1)图书
国际上通常把48页以上,不定期出版的印刷品称 为图书。我国国家标准对图书的定义是:“以印刷方 式单本刊行的出版物”。 特点: 内容比较系统、全面、成熟、可靠,有一定的 新颖性,但编辑出版时间过长,传递信息的速 度太慢,时间上难以满足获取最新科技信息的 要求。 图书一般分为两类: 阅读型:教科书、专著等 工具型: 字典、百科全书、年鉴、手册
(9)技术档案
指生产建设、科技部门和企事业单位针对具体的工 程或项目形成的技术文件、设计图纸、图表、照片等 各种原始记录原件及复制件。包括任务书、协议书、 技术指标、审批文件、研究计划、研究方案、试验记 录等。 技术档案是生产领域、科学实践中用以积累经验、 吸取教训和提高质量的重要文献。 技术档案具有保密和内部使用的特点,一般不易获 取,但它是一种重要的信息来源。
(6)标准文献
是为产品质量标准化、产品规格化和系列化、零 部件通用化而制订的技术规定、规范和准则。一个国 家的标准反映着这个国家的经济政策、技术水平、加 工工艺及标准化水平,它是一种重要的技术信息来源。 技术标准的制订工作一般是由主管部门完成的。 标准的新陈代谢十分频繁,随着技术水平的不断提 高,标准也需不断补充、修改,国际经济贸易的发展 又促使标准日趋国际化,因而标准文献体现了本技术 领域的发展水平,科技人员可以从中获取大量有价值 的信息。 标准文献的特点是:具有独立完整性和法律约束性。
(4)会议文献
是指在各种学术会议上发表的论文、报 告、讲演等文献,经编辑整理后的正式出版 物。 学术会议历来是人们交流研究成果的重要 场所。目前全世界每年大约要召开数千个学 术会议。会议种类繁多,有大会、会议、学 术讨论会、研讨会、讲习会、座谈会等。由 此产生了大量的会议文献。 会议文献是传播科技信息的重要渠道,许 多新的发现或发明往往最先披露于会议或会 议文献中。一些定期举行的学术讨论会往往 成为对前一时期研究成果的一次大检阅。某 些会议文献常常不在公开出版物上发表。 特点:学术性很强,代表了某一学科或专业领域的最新研究成果及 国内外的水平发展趋势
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二次检索
排序:指检索结果输出时的排列顺序。
检索词匹配:一般表示为前方一致、后方
一致、完全一致(精确匹配)、任意一致
(模糊匹配)等。
本课小结:
1、信息检索的概念
2、信息检索的发展沿革
3、文献信息检索工具 4、机检中的概念
讨论1: 我馆书目查询系统共有多少种检索方式?其基 本检索有多少个检索字段?
文献信息渠道 实物信息(物化信息)渠道 口头信息渠道 体语信息渠道 通过查阅文献资料以获取所需信息、 知识的过程就叫做文献信息检索。
2.1.2 信息检索的类型
1)按检索对象分: 数据检索 事实检索 文献检索
数据检索是以特定数据作为检索对
象和检索目的的信息检索,包括数据图
标,某物质材料成份、性能、图谱、市
哈佛大学图书馆自习室墙上的训言
学习时的痛苦是暂时的, 未学到的痛苦是终生的。
第二章 信息检索基础知识
主要内容
文献检索基本概念
检索工具
检索策略和方法
效果评价
2.1 信息检索的概念与类型
2.1.1 信息检索的概念
广义的信息检索(Information Retrieval) 是指将信息按照一定的方式组织和存储起来, 并根据信息用户的需要找出有关的信息的过 程。其全称是“信息存储与检索”
网络检索特点:
检索范围广
界面友好
响应速度快 具有多媒体信息采集、存储、加
工、检索、传递功能
2.3 文献信息检索的工具
2.3.1文献信息检索工具概述
检索工具是将大量分散无序的文献资 料经过加工整理,按照一定的规则和方法 编制起来,用来报道、存储和查找文献的 工具,是附有检索标识的某一范围文献条
目的集合。
(4)帮助科技人员消除了语言文字的
障碍。目前世界上出版的科技文献所使用的语言有60-70
种之多,科技人员直接查阅文献时,常常受到语种的限制而
漏查一些有重要参考价值的文献。一种检索工具可用
一种语言来收录和报道不同文种的文献,检 索者只要掌握少数几种语言,就能查阅多种 文字的文献资料。
2.3.3检索工具的类型
(1)检索工具能将不同类型、不同语 种的文献按学科或主题加以集中、组织在
一起,避免了直接检索的分散性、盲目性
和偶然性。 (2)借助于检索工具检索文献可以缩 短检索过程,节省读者的时间。
(3)检索工具中的标识(分类号、主
题词等)是按照一定的检索语言来编排的, 因此,它可以提供有规律的检索途径,使检 索者得以根据需要灵活地从多种角度进行检 索。
索引与目录的根本区别就在于著录的对象不同, 目录所著录的是一个完整的出版单位,索引所著录 的则是完整的出版物的某一部分、某一观点、某一 知识单元,提高文献检索的深度和检索效率。
索引类型 1)篇名索引:《全国报刊索引》
2)内容索引: 主题索引 《马克思恩格斯全集主题索引》 字句索引 人名索引 地名索引 《毛诗引得》《十三经索引》 《史记人名索引》 《中国地名索引》
现普遍采用的光盘网络检索系统,是有光盘服务 器、计算机局域网、光盘库或光盘塔、检索软件等组 成。
光盘检索的特点:
采用菜单驱动方式,直接检索,易操作 存储能力强 介质成本低 数据可靠性高 便于携带
网络检索
网络检索是指通过Internet检索和获取 网上的电子信息。
网络检索系统是通过Internet提供网络 数据库、出版物、书目、动态信息等网上信 息资源查询和利用的检索系统。一般由计算 机服务器、通信网络、通信协议、网络信息 检索服务器、用户终端等构成。
传统的检索工具有各类字典、词典、
目录、百科全书、名录、类书、政书、表 谱、图录等人们利用手工方法编制的工具
书。这些工具书是人们对日渐增多的知识
进行的分析、归类、释义和总结,是最早
的信息检索工具。
基于计算机和网络的检索工具主要 是题录数据库、索引数据库、文摘数据 库和搜索引擎等。
2.3.2 文献信息检索工具的作用
著录是指在编制文献目录时,对文献内容和形式特征进行 分析、选择和记录的过程。
书目
国家图书书目: 《全国总书目》、《中国国家书目》、 《全国新书目》;《国际在版书目》、 《英国国家书目》 国家报刊书目: 《中国报刊名录》、《中国报刊大全》 馆藏书目: 联合书目:CALIS联合目录、全国期刊联合目录
书目内容示例
的时间、地点、经过等。
事实检索是从文献中抽取的事项为检索内容,包括事务的 基本概念、基本情况,事务发生的事件、地点、相关事实与 过程等。针对查询要求,其结果需经检索系统或人工分析、 比较、评价、推理后再得出,是一种不确定的检索。
例如:查找 1)美国9.11事件发生的经过与结果处理 2)清华大学的发展现状 3)国内最大的商务站是哪一个?
按处理手段分类有:手工检索工具和 计算机检索工具
按收录范围分类有:综合性检索工具 和专科性检索工具
按文献信息载体划分有:书本式检索 工具、卡片式检索工具、缩微式检索工具 和计算机数据库检索工具 按照文献信息揭示方式划分,可以分 为:目录、题录、索引、文摘
(1)目录(书目) 目录又称书目,是著录一批相关文献并 按照一定的次序编排而成的一种揭示与报导 文献的工具。 目录对文献的描述比较简单,每一个条 目的著录项有:书(刊名)、卷(期)数、 作者、出版年月、出版地及书(刊)收藏情 况等。
手工检索
手工检索是相对于现代计算机检索方式而 言的传统检索方式,检索者通过翻阅、查找印 刷型检索工具进行检索。
20世纪80年代以前,手工检索一直占据着 重要的地位。国内的《中文科技资料目录》、 《国外科技资料目录》,国外的《化学文摘》、 《生物学文摘》、《科学引文索引》等等都是 重要的检索工具。
讨论其优缺点
光盘检索
光盘检索是利用计算机和光盘 驱动器,对光盘数据库进行文献信息 检索。
光盘是20世纪80年代出现的一种新的信息载 体,最初是由荷兰飞利浦公司和日技术实现信息存储的数字化。
按存储内容及读写功能可分为: 只读光盘 可读写光盘 可擦写光盘 目前应用于信息检索的主要是只读光盘
馆藏书目内容示例
联合目录内容示例
(2)题录 题录是将图书和报刊中论文的篇目按 照一定的排检方法编排,供人们查找篇目 出处的工具。 著录项:篇名、著者(或含其所在单 位)和来源出处。无内容摘要。 特点 :广、全、快
题录示例
(3)索引(引得) 索引是将书刊内容中所论及的篇名、语 词、主题等项目,按照一定的排检方法加以 编制,注明出处,供读者查检使用的检索工 具。
(Information Storage and Retrieval)。
存储过程
文献 信息
文献 分析 信息 特征
标引 著录
检索 课题
分析 检索 选用 提问 信息
检索 语言 和 名称 规范
形成
文献信息 输入 标识 (检索点)
检索 系统 输出 (标识 分配)
检 索 结 果
形成 检索提问 检索 标识 (检索词)
索引示例
索引示例:革命人物志索引
教育学文集 · 索引
(4)文摘
文摘是一种摘录文献内容要点来报道 文献的检索工具。著录项目比题录多了一 个文摘项。
例: 《化学文摘》、《历史文摘》 《经济学文摘》、《中国农业文摘》
2.4.1计算机信息检索过程中的概念
数据库:至少由一个文档组成,并能满足 某一特定目的或某一特定处理系统需要的一种 数据集合。 根据载体不同,可分为: 联机数据库(online-database)
检索获取过程
狭义信息检索是指从信息集合中找出
所需要的信息的过程,相当于人们通常所 说的信息查寻(Information Search)或信
息获取(Information Access)。
广义:存
狭义:取 信息检索的本质
取
(信息存储与检索)
信息用户的需求和信息集合的比较
与选择,即匹配的过程。
获取所需信息的渠道一般包括:
文献检索:以文献作为检索对象, 查找含有用户所需信息内容的文献。检
索对象是包含特定信息的各类文献。
2)按检索手段分:
手工检索
计算机检索
2.2 信息检索的发展沿革
四个阶段:
手工检索 ------ 80年代以前
联机检索 ------ 80年代初期
光盘检索 ------ 80年代末 网络检索 ------ 90年代
讨论2: “中国学术期刊网络出版总库”有哪些检索方式?
场行情,物质的物理与化学特性,设备 的型号与规格等,是一种确定性检索。
例如:查找
“大众公司新款汽车发动机的型号与性能 参数”
“北京今冬大白菜的最新价格行情”
“今日各大股市股票和黄金市场升跌指数”
事实检索:以事实作为检索对象,查找
用户所需要的描述性事实。检索对象包括机 构、企业或人物的基本情况、某一事件发生
手工检索的特点: 检索过程灵活 检索结果准确 检索不易查全
检索速度不快
联机检索
联机信息检索,是指信息用户利用终
端设备,通过国际通讯网络与世界上的信 息检索系统,进行直接的人机对话,从检
索系统的数据库中查找出用户所需信息的
全过程。
联机检索的主要特点:
检索速度快,检索效率高
信息资源丰富且质量较高
可及时提供最新信息 费用较高
光盘数据库(CD-ROM-database) 网络数据库(networked-database)
检索方式
检索词 检索途径 中国科技期刊数据库初级检索界面
限制条件
中文科技期刊数据库高级检索界面
二次检索:
在前一次检索结果的基础上,进一步
限定检索条件所进行的再次检索。二次
检索可多次使用,逐步缩小检索范围。