《文献检索》第二章文献信息检索基础知识2
第二章 文献信息检索基本知识(2).概要

(2)截词检索表达式
用截词符号“*”、“?”或“$”加在检索词 的前后或中间,以检索一组概念相关或同一词根 的词。 按截断的位置可分为:
前截断、中间截断、后截断 按截断的字符数量可分为: 有限截断(?)、无限截断(*)
如:输入检索式“Comput*”,将检出包含 Computer、Computing、Computed、 Computerization 等词汇的结果。
第二章 信息检索基础知识
2.3 文献信息检索的工具
1、文献信息检索工具概述 检索工具是将大量分散无序的文献资料经过加 工整理,按照一定的规则和方法编制起来,用来 报道、存储和查找文献的工具,是附有检索标识
的某一范围文献条目的集合。
传统的检索工具是人们利用手工方法编制的
工具书,有字典、词典、目录、百科全书、名录、 类书、政书、表谱、图录等。这些工具书是人们
题录示例
(3)索引(引得) 索引是将书刊内容中所论及的篇名、语词、主 题等项目,按照一定的排检方法加以编制,注明出 处,供读者查检使用的检索工具。 索引与目录的根本区别就在于著录的对象不同, 目录所著录的是一个完整的出版单位,索引所著录 的则是完整的出版物的某一部分、某一观点、某一 知识单元,提高文献检索的深度和检索效率。
完全一致(精确匹配)、任意一致(模糊匹配)
等。
讨论1: 我馆书目查询系统共有多少种检索方式?其基 本检索有多少个检索字段?
讨论2: “中国学术期刊网络出版总库”有哪些检索方式?
?
? ? 中国科技期刊数据库初级检索界面
2、 信息检索方法
(1)常用法 ①顺查法 ②倒查法 ③抽查法 (2)回溯法 (3)循环法
2第二章 文献检索基础(正式版)

第二章文献信息检索基础第一节文献信息检索的概念与过程一、文献信息检索的作用文献信息检索的作用主要体现在以下两方面。
1.充分利用文献信息资源,避免重复劳动科学研究具有继承和创造两重性,科学研究的两重性要求科研人员在探索未知或从事研究工作之前,应该尽可能地占有与之相关的文献信息,即利用文献检索的方法,充分了解国内、国外,前人和他人对拟探索或研究的问题已做过哪些工作?取得了什么成就?发展动向如何?等等。
这样才能做到心中有数,防止重复研究,将有限的时间和精力用于创造性的研究中。
因此,文献信息检索是科学研究必不可少的前期工作。
2.为人们更新知识,实现终生学习提供门径在当代社会,人们需要终生学习,不断更新知识,才能适应社会发展的需求。
美国工程教育协会曾估计,学校教育只能赋予人们所需知识的20%~25%,而75%~80%的知识是走出学校后,在研究实践和生产实践中根据需要,不断再学习而获得的。
因此,掌握文献信息检索的方法与技能,是形成合理知识和更新知识的重要手段,是做到无师自通、不断进取的主要途径。
二、文献信息检索的概念1.信息检索的概念:信息具有共享性。
信息资源共享(information resource sharing)是当今社会的一个发展趋势。
为了分享人类共同的知识财富、研究成果,人们必须通过一种科学的方法从取之不尽的信息资源中去识别和获取所需要的那部分信息,这个过程就是信息检索(information searching)。
信息检索在信息处理和增值中具有重要意义。
信息的检索、利用和创造是一个循环和增值的过程,人们通过检索获得信息,经过处理筛选出自己需要的部分,在利用信息的过程中又创出新的信息,这些信息经过核准后又被标引、组织进检索工具,再提供人们使用,信息在这个循环的处理过程中不断得到扩充,它的增长是没有穷尽的。
如下图所示:保留/信息检索的概念有狭义和广义之分。
从广义上讲,信息检索应该包括信息的存贮与检索两方面的含义。
文献检索-第二章 文献检索基本知识(100829)(包括第三章)

二、检索语言的种类
1、按表达文献特征划分
描述文献外部特征 检索语言 描述文献内容特征
学科分类—分类索引
描述 文献 内容 特征
研究对象—主题索引
所包含的关键词—关键词索引
分析单元性概念—叙词索引、单元词索引 分子式、结构式—分子式索引、结构 式索引 地理位置等特种内容—经纬度索引等 特种索引
2、按结构划分 分为分类语言、主题语言、代码语 言、引文语言。
第二节 检索语言
一、检索语言的定义:
从上节“检索原理”可以看出, 必须有同样的检索标识系统(即检索 语言)来标引文献特征和检索提问, 这是文献检索成败的关键。这就要求 信息标引人员和信息用户应当具有必 要的检索语言的基本知识。
文献检索时,检索标识和用户提 问都需要用一定的语言来表达,这种 标引人员表达检索标识和信息用户(检 索者)表达检索提问所共同采用、共同 理解的语言,就是信息检索语言。
②叙词语言 它是以叙词作为文献内容标识和检 索依据的一种主题语言。叙词是从文献 的题目,摘要或正文中抽取出来,用以 表达文献基本内容的概念单元。叙词受 词表控制,词表中词与词之间无从属关 系,都是相互独立的概念单元。检索时, 利用这些概念单元组配起来,表达一个 复杂的概念。叙词语言特别适用于计算 机检索。
③关键词语言 它是以关键词作为文献内容标识和检 索依据的一种主题语言。关键词是从文献 的题目、正文或摘要中直接抽取出来,未 经规范化处理的自由词汇。关键词不受词 表控制,标引文献时根据文献内容选择恰 当的词汇进行组配,以表达文献的内容特 征。
第三节
检索工具基础知识
一、什么是检索工具? 检索工具是积累和查找文献线索的 工具。它报导文献的存在,揭示文献 的内容,帮助科技人员鉴定和选择文 献、开发和利用文献资源。检索工具 具有存贮和检索两方面的功能。
第二章 文献信息检索基础

理的名词术语,具有单一性、组配性好的特 点。
(2)分类语言:直接体现知识分类的等
级制概念标识系统;如中图分类号、杜威 十进制分类法等。
《中国图书馆图书分类法》即《中图法》
《中国图书馆图书分类法》
体现学科的系统性,反映事物的从属、 派生关系,并从上至下、从总体到局部 层层划分,展开,是一种等级分明的语 言。分为五大部类,22个大类,分别用 22个大写字母表示(其中除掉L、M、W、 Y)。
1.前方一致
也叫后截断,将截词符置于一个字符串的后面,以表示其后的有限或无 限个字符的检索。
无限截词
如: ? Physic? 可检出physic、physical、physican、physicalism
有限截词
截断两个字符
中间有 空格
如:? physic?? 可检出physic、physical、physican 截断一个字符 如:? cat? ? 可检出cat、cats
2.3 综合法
综合法又称为循环法,它是把上述两种方法
加以综合运用的方法。综合法既要利用检索 工具进行常规检索,又要利用文献后所附参 考文献进行追溯检索,分期分段地交替使用 这两种方法。即先利用检索工具(系统)检 到一批文献,再以这些文献末尾的参考目录 为线索进行查找,如此循环进行,直到满足 要求时为止。 综合法兼有常用法和追溯法的优点,可以查 得较为全面而准确的文献,是实际中采用较 多的方法。
能包含特征B。可以缩小检索范围,有利于提高查 准率。 A – B(逻辑非)
例:自由分配方面的文献(排除海南大学师生的著作) 提问式::(关键词=‘自由分配’) not (单位=‘海南大学')
三、位置算符
也叫邻近检索, 在检索词之间使用, 规定算符两边的检索词出现在记录中
第二章 文献信息检索基础知识

这类文献特点是体积小、信息密度高、 轻便,易于传递,保存容易。但使用时必须 借助于放大设备。
电子型文献(Electronic Document)
原称机读型文献。是指以数字化技术将文献
存储在光、磁载体上,通过计算机或网络进行阅
2、学术期刊 (Periodicals,Journal,Magazine):
指有固定名称和统一的出版形式,按一定规律定
期或不定期连续出版的文献载体,与报纸属于称
连续性出版物。
(1)期刊的特征:
统一的刊名,有连续的年、卷、期及页码;
有国际标准连续出版物刊号ISSN (International Series Standard Number) ISSN由8位数字分两段组成,如1000-0135,前7 位是期刊代号,末位是校验号。
(3)期刊著录格式:
作者(多作者用逗号分开,超过3个者用“等或 et al”). 文章题目[J].刊物名称,年代,卷数(期 数):页数 如: Porter MF, Zhang J. An algorithm for suffix stripping. Program, 1980, 14(3):130~137
P:专利文献类别代码
(2)专利文献著录格式
专利申请者.
专利题名:专利国别(或地区), 专利号[P].出版日期. TACHIBANA R, SHIMIZU S, KOBAYSHI S, et al. Electronic watermaking method and system: US, 6,915,001[P]. 2002-04-25.
(1)图书的特征
图书没有统一的开本
第二章文献信息检索基本知识

运算符
1、布尔逻辑运算符(Boolean Operators) 2、通配符和截词符 3、字段限制符
、
1、布尔逻辑运算符 Boolean Operators
名 称
逻辑 与
逻辑 或
逻辑 非
运算符
AND * OR +
NOT -
逻辑关 系
举例
作用
限定 A AND B 缩小
需求分析
信息源
检索工具 检索方法
检索途径 检索标识
确定学 科范围、
主题概 念。
确定信 息源类 型、 语
种、时 间和空 间范围。
选择数据 库及其文 档、搜索 引擎及网 站。
选择检索 途径
及其检索 标识
制定检索 策略
调整检索 策略
查找文献 线索
索取原始 文献
检索提 问表达 式
根据检索 结果,扩 大或缩小 检索范围, 提高查全 率和查准 率。
以工程索引EI为例,通配符和截词符的检索 表达式及检索结果如下:
算符 *
$
含义
结果
利用它可以输入检索词的起始部分,而 实现一簇词的检索
自动取词根运算符
Alter*可命中 alter,alternando,altern ant,alternate,alternati ve等
$alter可命中 alter,alternate,alterna tive
用检索 工具查 找到文 献线索
馆藏文献借阅、 复制 全文数据库 网上获取 向作者索取
检索提问表达式=检索词+运算符
检索词
分为两类: 字词类:名词术语(如叙词或关键词),或者是个
人或机构名称。 如:行政管理、王平、西安邮电大学等。
2第二章文献检索基础知识

种概念按学科性质进行分类和排列。
特点:强调知识的系统性,方便人们按学科、专业系统存储
和检索文献。
世界著名分类法: 《国际专利分类法》、《美国国会图书馆分类法》、 《杜威十进分类法》
我国应用较广的分类法:
《中国图书馆图书分类法》、《中国科学院图书馆图书分类法》、 《人民大学图书馆图书分类法》
12
I 文学
6、检索结果评价
评价文献检索质量的两个最重要的指标是查全率和查准
率。
查全率
它反映该系统文献库中实有的相关文献量在多大程度上 被检索出来。
查全率 = 检出相关文献量 / 文献库内相关文献总量× 100%
பைடு நூலகம்
28
查准率
是衡量信息检索系统检出文献准确度的尺度。
查准率 = 检出的相关文献篇数/检出的全部文献篇数× 100%。
检索字段的选择
检索途径的确定是通过限定检索字段来完成的。 主题检索有多个可选字段:
标题 关键词 文摘 复合字段:可同时对标题、关键词、文摘字段进行检索
著者检索可选字段:著者、第一作者、被引著者 著者单位检索可选字段:著者单位、著者地址(SCI)、 机构、被引著者单位
4、 文献检索的过程与步骤
第二章
文献检索基础知识
1. 文献信息的存储 2. 检索语言 3. 检索途径
4. 文献检索的基本步骤
5. 检索结果评价
1、文献信息的存储
文献信息的有序存储是实现文献检索的前提条件。
文献存储是对大量的原始文献进行选择、收集、归 类、整理,把有关文献的特征信息著录下来,成为 一条条的文献线索,在广泛积累的基础上,根据实 际需要,编制成检索工具或数据库。
文献检索与利用_02文献检索基础知识教材

信息检索类型划分示意图
文献线索检索 文献信息检索 依检索结果内容 划分 信 息 检 索 类 型 依信息存储与 检索方式划分 数据信息检索 全文检索
事实信息检索
手工检索
计算机检索
二、检索工具类型
文献检索工具
题录(Title) 索引(Index) 文摘(Abstract) 文献数据库(Database)
代码语言
Code 代表某种意义的符号标识系统
规范化的人工语言
规范化的人工语言
主题语言--叙词 Descriptors
对概念进行严格的词义限 定、词形规范、词类规范, 具有概念组配和词间语义 关系显示功能。
主题语言--关键词
Key Words
直接从文题、文摘中抽取 出的具有实质意义,表达 主要内容、起关键作用的 词语。
检索语言类型
描述文献 外表特征
•
描述文献 内容特征
•
• • • • •
题名 作者(地址) 出处 序号 文献类型 原文语种
检索语言
•
分类语言 主题语言
• •
叙词 关键词
•
代码语言
描述文献内容特征检索语言
分类语言
Classification
按文献内容所属学科分门别 类进行 组织,由总到分、由一般到 具体。 由简单到复杂一个大类产生 许多子 类目,子类目向上层层隶属, 向下 级级派生,形成一个严谨有 序的直 线型等级分类体系。
3、数据库的利用:是存贮的逆过程。
计算机检索基本方法
计算机检索的查寻过程实际上就是将用户的 检索提问与数据库的检索标识相比较决定取舍的 过程,两者比较结果相一致者即为命中。命中的 中间结果可以再次与新的提问式相比较匹配。一 个检索课题通常经过如此多次的修饰匹配检索, 直至最终命中检出的文献符合用户的需求。
文献检索,信息检索(2)第二章 信息检索原理

缺点:常常落后于当前研究现状,分类表相对呆板的 学科关系,使得确定前沿概念、跨学科概念或非常具 体概念的分类,较困难。用户差异性。
分类语言
中国图书馆图书分类法 美国国会图书馆分类法 杜威十进位分类法 IPC国际专利分类法
基本部类 马列毛邓 哲学
(2)多概念课题
并列概念课题,如“新闻宣传研究”
“计算机在人文社会科学方面的应用” 上位类分类方法,如“灰色系统理论”
应用性课题,如“计算机在人口预测方面的应用”、
2.主题语言
是直接以代表信息内容特征和科学概念的概 念词作为检索标识,并按字顺组织的一种检索语 言。 是以表达文献主 是从文献的内容 是从文献的题目
一、检索算符 逻辑与
(一)布尔逻辑算符
布尔逻辑组配运算是采用布尔代数中的 逻辑“与”逻辑“或”、逻辑“非”等算符,
将检索提问式转换成逻辑表达式,限定检索
词在记录中必须存在的条件或不能出现的条 件。凡符合布尔逻辑所规定的条件的文献, 既为命中文献。
布尔逻辑运算符
————————————
1、逻辑“或” 2、逻辑“与” 3、逻辑“非”
2、逻辑“与”
————————————————
Chinese AND litera0,000 网络100,000,000) 用符号“and”或“*”表示,其逻辑表达式为: A * B 或 A and B 其意义为检索记录中必须同时含有检索词A和B 的文献,才算命中文献。
4、记录级
检索词在数据库的同一记录中。
(C)—citation
表示两侧的检索词(或检索项)必须出现在同一记录中,词
序不限,中间词数量不限,其作用与布尔逻辑算符AND相同。
2文献检索基础知识

文献信息检索基 础知识
1
所谓文献信息检索就是根据课题的需要,利 用检索工具和检索系统,按照一定的检索方法和 程序去查找文献信息的过程。 检索原理: 检索就是将“检索提问标识”与存储在检索系 统中的“文献特征标识”进行比较,两种标识基 本相符的,即完成检索过程。
2
•文献检索的概念
检索途径
汉语拼音音节索引 用拼音著录汉字
12
2.按照检索语言所描述的文献信息特征的内容 可分为描述文献内容特征的语言和描述文献 外部特征的语言: 其中前者又可分为分类语言、代码语言、 主题语言(包括关键词、单元词、标题词、 叙词语言等); 后者又可分为书/刊/篇名、著者/团体 著者、引文、代码/序号。
13
(1)分类语言:是一种直接体现知识分类的 等级制概念标识系统,是按照学科范畴划分 而构成的一种语言体系。它能集中体现学科 的系统性,反映事物的从属、派生关系,并 从上至下、从总体到局部层层划分、展开, 是一种等级分明的语言。 分类检索语言通过分类表来体现,一部完 整的分类表大体可由:编制说明、大纲、简 表、详表、辅助表、索引、附录等组成。
6
• 数据和事实检索是要检索出包含在文 献中的具体情报; • 文献检索则是要检索出包含所需要情 报的文献。 • 文献检索是最典型和最重要也是最常 利用的情报检索
7
• 2、根据检索方式 • 手工检索系统由手工检索设备(如书本式目录、文摘、 索引、卡片柜等)、检索语言、文献库等构成。 • 特点:它使用方便,成本低廉,但检索效率和响应时间 均较差。 • 机器检索系统可以分为机械检索系统和计算机检索系统。 • 机械检索系统主要由穿孔卡片、选卡机、机械探针、编 码规则、文献库等构成。 • 计算机检索系统主要由计算机检索设备(光盘检索设备、 微机(脱机)检索设备、联机检索设备、缩微品机检设 备等)、检索语言、文献库等构成。 • 特点:检索效率高,响应速度快等特点,但是成本和检 索费用较高。
第二章 文献信息检索

5、序号途径:以文献的编号为特征,并以编号作为检索文献的途径,
6. 其它途径:有些检索工具还附有一些特殊索引,可用以通过特殊途径找
到所需文献的线索。例如:《科学文摘》有“图书索引”、“会议索 引”等,可以用它们按文献类型途径,专门查找图书、会议文献等。
(二)信息检索的步骤(方法)(参见教材P29-32) 信息检索的步骤(方法)(参见教材 )(参见教材 )
1.课题分析 课题分析:分析课题的主要内容、所涉及到的学科、国内外研究的现状等。
2.选择相关信息资源:数字资源、印刷文献。 选择相关信息资源: 选择相关信息资源 3.构造检索式,选择检索入口:检索式由检索词和各种组配算符构成;组 构造检索式, 构造检索式 选择检索入口: 配算符(operator)通常由布尔逻辑算符(“AND”、“OR”、’not” )、 截词符*(通配符)、位置算符、嵌套算符(优先算符)几种;常用的检 索入口如题名、著者、主题词、关键词、引文、文摘、全文、出版年、 ISSN号与ISBN号、分类号以及一些其他专业用检索点。检索点正确与 否,决定着检索结果的数量与质量 . 4.对检索策略进行调整 对检索策略进行调整:对检索数量比较少时,可以进行扩检,提高查全率, 对检索策略进行调整 比如:增加一些检索词,或补充检索词的上位类词、近义词、调整组配 算符,如改“AND”为“OR”、使用截词检索 或放宽取消或放宽一些检 索限定等 ;如果检索数量过多则考虑进行缩减,提高查准率。 5.检索结果的评价:对检索效率(查全率、查准率、检索时间、检索成本 ) 检索结果的评价: 检索结果的评价 的评价。
附录:中国图书馆图书分类法
五大部类, 大类, 个总论复分表, 多个专 由五大部类,22大类,6个总论复分表,30多个专 类复分表组成。部类的设置采取五分的方法:即马 类复分表组成。部类的设置采取五分的方法: 组成 列主义,毛泽东思想作为一个基本的部类(A)列 作为一个基本的部类( ) 列主义, 于首位, 于首位,以体现整部分类法的指导思想;对于一些 的文献统归于“ 内容涉及广泛,类无专属的文献统归于“综合性图 ),作为一个基本部类列于最后 书”(Z),作为一个基本部类列于最后;哲学、 ),作为一个基本部类列于最后;哲学、 社会科学和自然科学按其逻辑的关系列为 大部类 列为3大部类 予以排列。 标记制度:采用字母与阿拉伯数字相结合的混合小 采用 数层累制,以字母顺序反映大类序列。如:《英语 以字母顺序反映大类序列。 备考精要》 索书号是H310.5/S22,H代表语言、文 代表语言、 备考精要》,索书号是 代表语言 表示常用外国语; 表示英语 表示英语; 字;3表示常用外国语;31表示英语;310.5表示外 表示常用外国语 表示外 来语。 来语。
第二章信息检索基础知识

字段检索
限定提问关键词在数据库记录中出现的区域, 以控制检索结果的相关性。搜索引擎 中常用字段有: Title(或t); URL(或u); Link; Host(主机); Text。
自然语言检索 Please find for me something about automobile sale in New York State. 系统会检索出“New York State”和 “ automobile sale” 方面的信息。 概念检索 检索: “automobile”能同时检索出包含: “automobile”、“car”、“truck”、“bus”I21 I211 I212 I213 I22 I221 I222 I223 I23 I231 ……. I3 I31 I311 …… I4 ……
文学作品
中国文学作品
中国诗歌作品 中国古代诗歌 中国近代诗歌 中国现代诗歌 中国戏剧作品 中国古代戏剧 中国近代戏剧 中国现代戏剧 中国小说作品 中国古代小说 ………
按网络信息传播范围分:光盘信息源、联机 检索信息源、Internet信息源 按网络信息加工层次分:网络资源指南、搜 索引擎
2.2 信息检索语言及信息检索技术
2.2.1 . 信息检索语言:把信息的存储和检索联 系起来,把标引人员与检索人员联系起来以便取 得共同理解的语言,称为检索语言。类型: 按描述文献信息的特征划分:描述文献信息外表特
(2)图书馆的电子信息服务
图书馆提供的上网服务 图书馆的检索服务 图书馆提供的电子信息服务 图书馆提供的电子信息服务 图书馆提供的书籍全文在线阅读 图书馆举办的用户培训
(3)图书馆的信息资源借阅与查找
图书借阅 古籍善本书、线装书的阅览 期刊查阅 个人发表论文的查找 快速借阅所需图书 图书馆的图书逾期罚款制度 借阅查询 代书牌的使用
第二章文献检索基本知识

检索工具的形式:
书本式检索工具
期刊式:连续性,具有期刊的出版特点 单卷式:独立性,以一定的专题为内容 附录式:不单独出版,附于书刊之后
卡片式检索工具:(很少用)
缩微式检索工具:(很少用)
机读式的检索工具:(磁带等已很少用)现在常用的检索 工具如
网络、光盘数据库等
检索工具的类型:
、目录型检索工具:按一定次序编排,仅提供检索线索
是否有一部优秀的综合性的百科全书,常常是 衡量一个国家科学文化发展水平的尺度
百科全书由若干条目组成。条目是百科全书的基本知识 单元,是独立的概念或完整的知识主题。也是基本的检 索单元。
条目一般包括条头、释文、参考书目
此外还有前言、插图、附录(如大事年表)和索引等
现代百科全书的特点:
、概述知识条目化
例如:
马、列、毛、邓
哲学、宗教
农业科学
工业技术
无线电电子学电信技术
半导体技术
中国图书馆分类法(中图法)
基本大类 马 列哲
…
工业技术
…
综 合
毛学
性
邓宗
图
教 一般工业技术
矿
石
水
书
业油
利
工
程
工程 工程 工程 … 测
基础 设计 材料
量
科学 与绘 学
学
测
天 然
…
工 程
气
工
业
工程材料一 金属材 … 耐腐蚀材
般性问题
常见的几种目录型检索工具 )国家书目:是一种不加选择地记载一个国家出版的全部图书的目
录,可反映一个国家的出版业水平 )馆藏目录:同图书馆、情报所等单位自己编制的本馆藏书、资料
文献检索基础知识

UDC LC CC
(比)英特勒等
美ห้องสมุดไป่ตู้国会图书馆 编目组
(印)阮冈纳赞
混合 体系 组配
书目分类法
BC
(美)布利斯
混合
9
体系分类法
定义:以学科分类为基础,依据概念的划分与概括原理 ,把概括文献内容与事物的各种类目组成一个层层隶属 、详细列举的等级结构体系的一种分类法。
分类法
编制说明 分类表 复分表
10
《杜威十进分类法》(DDC)
000 总论 100 哲学 200 宗教 300 社会科学 400 语言 500 自然科学 600 应用科学 700 艺术 800 文学 900 历史、地理
510 数学 520 天文学 530 物理学 540 化学 550 地球科学 560 古生物学 570 生命科学 580 植物学 590 动物学
中国图书馆
《中国科学院图书馆图 书分类法》
《中国人民大学图书馆 图书分类法》
科图法 人大法
中国科学院图书馆
中国人民大学图书 馆
体系 体系 体系
《中国档案分类法》 中档法
国家档案局
体系
8
国际常用分类法
分类法名称
简称
主编
体系结构
杜威十进分类法
DDC
(美)杜威
体系
国际十进分类法 美国国会图书馆分类法
冒号分类法
东思想
50 自然科学(总论)72 能源学、动力工程
10 哲学
51 数学
73 电技术、电子技术
20 社会科学(总论)52 力学
74 矿业工程
21 历史、历史学 53 物理学
75 金属学(物理冶金)
27 经济、经济学 54 化学
第二章、文献检索基础知识

(2)树状结构表: 树状结构表将字顺表中的主题词按照每个 词的词义范畴和学科属性,分别归入15个大类之中,多数 大类又进一步细分多达9 级。每一级类目用一组号码标明, 级与级之间用“.”号隔开。主题词上、下级之间采用逐级 缩进格式表现主题之间的隶属关系,每个主题词都有一个 或两个以上的树状结构号,该号是联系字顺表和树状结构 表的纽带。现摘录片段如下: Nervous System A8 Central Nervous System A8.186 Brain A8.186.211 Prosencephalon A8.186.211.730 Telencephalon A8.186.211.730.885 Basal Ganglia A8.186.211.730.885.105 Corpus Striatum A8.186.211.730.885.105.487 Neostriatum A8.186.211.730.885.105.487.550 Putamen A8.186.211.730.885.105.487.550.784
文献检索包括两方面的内容
一方面是文献线索 文献线索的查找,即如何利用检 文献线索 利用检 索工具的问题; 索工具 另一方面是特定原始文献 特定原始文献的查找,即在查 特定原始文献 找特定的文献线索后,找出原始文献 找出原始文献的过 找出原始文献 程。
文献检索的一般意义
促进素质教育,培养信息意识 避免低水平的重复劳动,全面掌握必要的文献 信息; 节省时间和费用,提高信息利用效率,促进信 息资源的开发; 促进专业学习,加速成才。
书名目录(Title Catalogue) 著者目录(Author Catalogue ) 分类目录(Classified Catalogue) 主题目录(Subject Catalogue )
第二章 文献信息基础知识(2)

特点:
a. 内容实用、新颖、报道及时; b. 代表某一领域的最高水平,实用性强; c. 具有法律效力。
7. 标
定义
准
文
献
是对各种产品、元件、工程建设质量、规 格、检验方法等作业技术规定。
主要是对工农业产品和工程建设的质量、 规格、检验方法等方面所制定的技术规定。
其主体是标准,还包括标准形成过程的各种 档案、宣传推广标准的手册及其它出版物。 标准:按规定程序制定,经权威机构公认或 主管部门批准的在特定范围内执行的规格、 规则、技术要求等规范性文件。
电子型 磁性 材料
打字、穿 孔,编码、 程序设计
电子图书、电子 期刊、计算机 文档、 光盘数据库
存储密度高、体积 需借助计算机 小、易保存和流通 存储和阅读
2.2.2 按出版形式的不同
按 出 版 形 式 的 不 同
图 书
连续出版物
期刊 报纸 年鉴
会议文献 专利文献 标准文献 学位论文 政府出版物 科技报告 产品样本 科技档案
⑴ 零次文献(灰色文献)
所谓“零次文献”是指非正式出版物 或非正式渠道交流的文献,未公开于社会 ,只为个人或某一团体使用。 如文章草稿,私人笔记,会议记录,未 经发表的名人手迹,甚至包括口头言论和 思想教育。
(2)一次文献(Primary Document) (原始文献) 是以著者本人的经验,研究或研制成 果为依据而撰写的原始文献,经公开发表 或交流后,称为一次文献。 一次文献是文献的主体,是最基本的 信息源,是文献检索的对象。如期刊论文 、会议文献,专利文献,学位论文。
缩微 型文献
手写型文献
古代各种非印刷型文献及现在尚未正式付印的手 稿。
印刷型文献
载体:纸张 实例:教科书 记录手段:油印、铅印、 胶印、复印 特点:可直接阅读,方便 使用;但难于实现机 械化和自动化;收藏 文献占用空间大。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
取;有的信息需要支付馆际互借的费);
b 确定搜集所需要的信息需要付出的时间 与精力; c 确定搜集所需要的信息和理解其内容是 否需要应用新的语种和技能(例如:信息是以 非中文/英文的语种表达信息内容的,要了解 其内容,则需要先学习一门新的语言;或是理 解信息内容需要应用到还未学过的学科知识)。
2.4.2 信息检索方法
5、在外文数据库中检索有关“儿童的天才教育” 方面的文献 (Infant or child or children) AND gifted education Gifted children AND Education
练习:计算查全率、查准率
相关信息 检出信息量 未检出信息量 20 10 非相关信息 30 1540
检索方法可以从已经掌握的一篇最新文献入手, 查找到它所引用的文献,再依据这些查出的文献, 查找到它们所引用的文献。如此反复,即可获得大 量的文献信息。
(3)循环法 是常用法与回溯法的结合,即先利用检索 工具查找出一批有用的文献,然后利用这些文 献所附的参考文献或原文中涉及的重要线索进 行追溯查找。
②倒查法 利用选定的检索工具, 由近及远地逐 年进行查找的检索方法。
特点: 以“查准”为主
宜于新的研究课题 较节省时间, 效率较高。
③抽查法 是在课题研究所处的发展高峰期的 若干年中进行查找。
特点: 快速检索的课题 较高的检索效率 前提是必须事先了解课题研究发展 的历史背景。
(2)回溯法
回溯法又称追溯法、引文法,是利用文 献末所附的参考文献或引用文献,由近及远 地进行追踪查找。
查全率
67%
查准率
40%
检索表达式主要有逻辑表达式、截词表达
式等 。
2.4.4.1逻辑表达式
逻辑表达式是指利用布尔逻辑算符, 对检索词的关系进行表达,又称布尔逻辑 表达式。
布尔算符: “逻辑与”(“AND”) “逻辑或”(“OR”) “逻辑非”(“NOT”)
(1)逻辑“与” 表示它所连接的两个检索词必须同时出现 在结果中,逻辑检索式可写为: A and B
如查找关于“研究生教育”的资料,但 要求不包括在职研究生,可将检索式写为: (研究生*教育)-在职研究生
研究生-在职研究生*教育
逻辑 “非”表示具有不包含某种概念关系的一
组组配,用来缩小检索范围。但在实际检索中要慎 重使用。
布尔逻辑算符示意图
A AND B 同时具有A和B
A OR B A或B,任何一个
2.5信息检索效果评价
检索效果指开展检索时产生的有效结பைடு நூலகம்
果。检索效果的评价主要根据以下几个指标
进行:查全率、查准率、响应时间、输出方
式等。
(1)查全率
查全率指检出的相关文献信息量与检索 系统相关文献信息量总量的比率,它反映出
信息检索系统检出相关文献信息的能力。具
体公式如下: 查全率=[检出相关文献信息量/检索系统中 相关文献信息总量] ×100%
2.4.3检索策略的含义和作用
所谓检索策略,即在分析检索课题内容 实质基础上,选择检索系统、检索途径、确 定检索词及其相互间的逻辑关系等的信息检 索方案。
关键:构造能够确切表达信息需求 的检索式。
2.4.4 检索表达式
简称检索式。检索式一般由检索词和各种
逻辑运算符组成。它是用检索系统规定的各种 算符将检索词之间的逻辑关系、位置关系等连 接起来,构成的计算机可以识别和执行的检索 命令式。
1、检索“中国高等教育的发展趋势”,检索式为:
中国*高等教育*发展趋势 (中国+我国)*高等教育*(发展趋势+发展态势) 2、检索有关“文献保护”的资料,检索式可为: 文献*保护
(文献+图书+档案+资料)*(保护+防潮+防虫+防 有害气体)
3、检索有关“欧洲专利”的文献。 检索式:
欧洲*专利
(欧洲+法国+德国+意大利+…)*专利 4、检索“除黄原胶外的微生物多糖”方面的文献, 检索式: 微生物多糖-黄原胶
1、积木型策略:
如:检索课题“轻金属的焊接” 检索式:
(轻金属 OR 镁 OR 铝)AND(焊接 OR 铜焊)
2、引文珠形增长型策略
如:“中国学者对哥德巴赫猜想的研究贡献”
从“陈景润”入手,找到他的论文,根据论 文内容和参考文献,发现相关资料。
3、逐次分馏型策略:
大范围的对象集合 较小的命中结果集 4、最专指面优先型策略 如:高等教育中学分制的由来及发展 提高专指度 最终结果
(2)查准率
查准率指检出的相关文献信息量与检
出文献信息总量的比率,它反映出信息检 索系统的精确度。具体公式如下: 查准率=(检出相关文献信息量 / 检出文 献信息总量)×100%
相关文献量 检出文献量 未检出文献量 45 45
非相关文献量 30 2980
查全率=50%
查准率=60%
练习:构造检索式
不同的数据库可能有不同的禁用词列表。
2.4.5检索策略的构造步骤
信息检索策略的构造一般包括分析信息 需求、选择检索系统、确定检索用词、构造 检索式、分析检索结果等。
具体过程如下:
分析信息需求,明确检索要求
选择检索系统
选择检索途径和方法,确定检索词或检索式
实施信息检索 获取原始文献
检索策略(不同的声音)
逻辑“或”主要用于表达检索词的近义词、同 义词、全称和缩写等,以便全面、完整地表达相关的
概念。
讨论:“高校学生”的逻辑表达式 大学生 or 本科生 or 研究生 or 大专生 or 高职生
(3)逻辑“非”
表示它所连接的两个检索词中,应从第一 个概念中排除第二个概念,检索式可写为:
A NOT B
A - B A 非 B
2.4.4.2截词检索表达式
用截词符号“*”、“?”或“$”加在 检索词的前后或中间,以检索一组概念相 关或同一词根的词。
按截断的位置可分为: 前截断、中间截断、后截断 按截断的字符数量可分为: 有限截断(?)、无限截断(*)
如:输入检索式“Comput*”,将检出
包含Computer、Computing、Computed、 Computerization 等词汇的结果。 输入“wom ?n”可同时检索到含有 woman和women的结果。
A * B
A 与 B
如要查找关于“计算机检索”方面的信
息,可表述为:“计算机AND检索”。
讨论:“大学生就业”用逻辑表达式如何表达 大学生 and 就业
(2)逻辑“或” 表示它所连接的两个检索词中任意一个 出现在结果中就满足检索条件,检索式可写 为:
A OR B
A + B A 或 B
如检索关于“计算机”的信息,可表达 为:计算机+电脑。
A NOT B 只有A,不包含B
一般运算顺序 ( ) * +
在网络运用中,有的“完全支持”此布尔逻辑 表达式,有的则“部分支持”
讨论
检索“高校学生就业”的信息,但要
求不包括大专生、高职生,用逻辑表达式 如何表达? 高校学生 and 就业
(大学生or本科生or研究生)-(大专生 or高职生)and 就业
a 分析信息需求,确定所需信息的学科范
围、时间跨度等;
b 在使用信息源的过程中增强对所需求信 息的深入了解程度; c d 通过与教师、图书馆员、合作者等人的 用明确的语言表达信息需求,并能够归
讨论,进一步认识和了解信息的需求; 纳描述信息需求的关键词。
指标3:具备信息素质的学生能够考虑到影 响信息获取的因素。 指标描述: a 确定所需信息的可获得性与所需要的 费用(例如:有的信息是保密的,无法获
(1)常用法 ①顺查法 ②倒查法 ③抽查法 (2)回溯法 (3)循环法
(1)常用法
利用检索工具或检索系统查找文献资 料的方法。
①顺查法: 从课题分析所得出的该课题研究的起始 年代起, 由远及近地进行逐年查找的检索方 法。 特点: 较高的查全率 在一定程度上反映出该课题研究发展的 全过程 耗时费力, 效率较低
哈佛大学图书馆自习室墙上的训言
幸福或许不排名次, 但成功必须排名次。
复 习
信息检索有广义和狭义之分,它们各 包括哪些过程? 请看这个页面,各栏目都表示什么意 思?
?
? ? 中国科技期刊数据库初级检索界面
北京地区高校信息素质能力指标体系(续)
维度二:具备信息素质的学生能够确定所需信
息的性质与范围。 指标2:具备信息素质的学生能够明确地表达信 息需求。 指标描述:
检索禁用词
检索系统一般将出现频率特别高的词规
定为禁用词,它们不能在检索式中出现,除
非是用于“ ”标示的词组里。这种规定是为 了提高检索效率。
常见的英文禁用词有: a 、 about 、 all 、 also 、 an 、 are 、 as 、 been 、 both 、 but 、 by 、 each、from、has、have、in、into、of、on、 some、such、than、that、the、their、them、 there、these、they、this、those、through、to、 was 、 were 、 when 、 where 、 which 、 with 、 would等。