第二章文献信息检索基本知识
文献检索基本知识
第二章文献检索基本知识一、文献检索的基本概念信息检索:广义:将信息按照一定的方式组织和存储起来,并根据用户的需求找出有关信息的过程。
狭义:指用户找出有关信息的过程。
信息检索的类型(根据不同的检索对象):数据检索:检索的结果是数据。
如某种材料的电阻;某变压器的参数;化学分子式、数据图表等<手册>事实检索:检索的结果是事实结论。
查询某一事物(事件)的性质、定义、原理以及发生的时间、地点过程等。
如某产品是哪个厂家生产,哪个牌子的最好;第一颗人造卫星是什么时候升空的<年鉴>文献检索:检索的结果是文献资料。
查找相关文献的内容、出处、收藏单位等。
如系统地查找水压伺服控制阀原理方面的相关文献<论文>自然语言:自然表达某一概念的语言,没有强制性的规定。
通俗地说,就是对于一个概念你想怎么表达就怎么表达。
在文献检索中,关键词(key words)等用的就是自然语言.人工语言:人为规定的概念表达语言。
通俗地说就是对于一个概念你必须使用规定的语言来表达。
在文献检索中,主题词(subject)通常用的就是人工语言图书分类号1、中国图书馆图书分类法(中图法)为全国公共图书馆和信息研究所等机构所采用,是我国通用的综合性书资料分类法。
1973年试用版,1975年第一版,1980年第二版,1990年第三版,1999年第四版。
共分22个大类例如:A马、列、毛、邓B哲学、宗教S农业科学T工业技术TN无线电电子学电信技术TN.3半导体技术中国图书馆分类法(中图法)2、中国科学院图书馆分类法(科图法)目前中科院系统和部分高等院校采用。
1958年第一版,1980年第二版、1994年第三版。
例如:00 马、毛10 哲学20 社会科学总论21 历史历史学73 电技术、电子技术76 冶金学3、中国人民大学图书馆分类法(人大法)部分图书馆和信息资料机构使用该分类法1953年第一版,1980年第五版,1989年第版增订本,1996年第六版例如:1马、列、毛2哲学11工程技术15历史4、国外主要分类法:杜威十进制分类法(Decimal Classification,简称《杜威法》或DC,DDC)国际十进制法(Universal Decimal Classification,简称或UDC)美国国会图书馆图书分类法(Library of CongressClassification,简称《国会法》或LC)概念匹配:计算机计算机电脑微机PC 机文字匹配:计算机计算机电脑电脑微机微机输入输出使用人工语言通常为概念匹配使用自然语言通常为文字匹配四、检索工具定义:是人们用来存储、报道和查找文献的工具。
第二章 文献信息基础知识(3)
文献信息资源检索的含义 22.1 )数据检索
以文献中的数据、公式或图表为对象 的一种确定性检索。 例:物质临界值、公式、化学分子式等。 典型的提问式: 如何查找MS培养基的配方?
41
3)事实检索
2.1文献信息资源检索的含义
以查找数值与非数值混合情报为对象的 一种确定性检索。 例:某事实发生的时间、地点或过程等。
如《纽约时报》、《泰晤士报》、《读卖 新闻》等既有印刷版,又有缩微版;《中国大 百科全书》、《不列颠百科全书》、《工程索 引》、《科学文摘》、《科学引文索引》等既 有印刷版,又有电子版
5.4 在激烈的商业竞争中许多畅销书内 容雷同,选题重复; 5.5 再版、改版文献数量不断增多,如 1998年我国出版图书130613种,其 中新版书74719种仅占57%。
国外有人统计各类文献的平均寿命为:
图书 期刊 学位论文 10-20年 3- 5年 5- 7年 科技报告 标准文献 产品样本 10年 5年 3- 5年
2.2 文献的半衰期:
是指某学科领域目前尚在使用的全部文 献中,较新的一半所出版的年限。
国外有人统计不同学科文献的半衰期为: 地理学16.1年 地质学11.8年 数学10.5年 植物学10年 化学8.1年 生理学7.2年 机械工程5.2年 社会科学5年 化工4.8年 物理学4.6年 冶金学3.9年 生物医学3年
特种文献
1. 图
定义
书
特点:主题突出,内容系统、 指对某一领域的知 全面、可靠; 识进行系统阐述或对 出版的周期长、知识的新颖 已有研究成果、技术、 性不够,传递信息速度 慢。 经验等进行归纳、概 括的出版物。包括专 著、教科书、词典、 丛书等。
2. 期
刊
A、多数是原始文献,能够 及时显示出科学研究的新成 定义 果、新水品、新动向; 期刊又称杂志,它是指 B、出版时间短,报道文献 定期或不定期连续出版的、 速度快,内容新颖、及时、 有统一的名称、固定的开本、 广泛; 版式、有连续的序号、汇集 C、定期出版,有半月刊、 月刊等。 了多位作者分别撰写的多篇 文章,并由专门的机构编辑 出版的连续性出版物。
第二章 信息检索基本知识
(二)按出版形式划分:
原始文献
图书
特种文献
期刊
会 议 文 献
科 技 报 告
专 利 文 献
学 位 论 文
政 府 出 版 物
其 标 准
食品标准网
它
7-111-17892-0
《发票报文》GB/T 17303.2-1998 第二部分:国际贸易商业发票报 文
……
(三)按信息的加工程度来分: 1、一次文献信息 (原始文献):
一、检索工具的作用 1、报道作用 2、存储作用 3、检索作用
二、检索工具的特点
1、详细而又完整地记录了文献的外部特征和内部特征。
2、对所著录的文献,标引了可供检索的检索标识。 3、提供必要的检索手段,配备各种体系的索引。
三、检索工具的类型
按著录信息的特征划分:
1、目录 2、题录 3、文摘 4、索引
检索途径-分类途径 分类途径的缺点是新兴学科、边缘学科在 分类时往往难于处理,查找不便。另外, 从分类途径检索必须了解学科体系,否 则在将概念变换为分类号的过程中常易 发生错误,造成漏检或误检。
检索途径-主题途径
• 主题途径是一种按照文献的主题内容查找文献 的途径。使用的语言是主题语言。使用的检索 工具有“主题索引”、“关键词索引”、“叙 词索引”等。 • 主题法打破了传统的学科分类的框框,把分散 于各个学科的有关文献集中于同一主题词之下, 以文字作检索标识,索引按照资料内容的主题 词或关键词的字顺排列,检索时就象查字典一 样,不必考虑学科体系。
更多……
• 按检索方式,可分为印刷型检索工具和机器检 索工具; • 按出版形式,可分为期刊式检索工具、书本式 检索工具、卡片式检索工具、缩微式检索工具、 机读式检索工具等; • 按收录范围,可分为综合性检索工具、专题性 检索工具; • 按语种,可分为中文检索工具和外文检索工具;
第二章 文献信息检索基础
理的名词术语,具有单一性、组配性好的特 点。
(2)分类语言:直接体现知识分类的等
级制概念标识系统;如中图分类号、杜威 十进制分类法等。
《中国图书馆图书分类法》即《中图法》
《中国图书馆图书分类法》
体现学科的系统性,反映事物的从属、 派生关系,并从上至下、从总体到局部 层层划分,展开,是一种等级分明的语 言。分为五大部类,22个大类,分别用 22个大写字母表示(其中除掉L、M、W、 Y)。
1.前方一致
也叫后截断,将截词符置于一个字符串的后面,以表示其后的有限或无 限个字符的检索。
无限截词
如: ? Physic? 可检出physic、physical、physican、physicalism
有限截词
截断两个字符
中间有 空格
如:? physic?? 可检出physic、physical、physican 截断一个字符 如:? cat? ? 可检出cat、cats
2.3 综合法
综合法又称为循环法,它是把上述两种方法
加以综合运用的方法。综合法既要利用检索 工具进行常规检索,又要利用文献后所附参 考文献进行追溯检索,分期分段地交替使用 这两种方法。即先利用检索工具(系统)检 到一批文献,再以这些文献末尾的参考目录 为线索进行查找,如此循环进行,直到满足 要求时为止。 综合法兼有常用法和追溯法的优点,可以查 得较为全面而准确的文献,是实际中采用较 多的方法。
能包含特征B。可以缩小检索范围,有利于提高查 准率。 A – B(逻辑非)
例:自由分配方面的文献(排除海南大学师生的著作) 提问式::(关键词=‘自由分配’) not (单位=‘海南大学')
三、位置算符
也叫邻近检索, 在检索词之间使用, 规定算符两边的检索词出现在记录中
第二章 文献信息检索基础知识
这类文献特点是体积小、信息密度高、 轻便,易于传递,保存容易。但使用时必须 借助于放大设备。
电子型文献(Electronic Document)
原称机读型文献。是指以数字化技术将文献
存储在光、磁载体上,通过计算机或网络进行阅
2、学术期刊 (Periodicals,Journal,Magazine):
指有固定名称和统一的出版形式,按一定规律定
期或不定期连续出版的文献载体,与报纸属于称
连续性出版物。
(1)期刊的特征:
统一的刊名,有连续的年、卷、期及页码;
有国际标准连续出版物刊号ISSN (International Series Standard Number) ISSN由8位数字分两段组成,如1000-0135,前7 位是期刊代号,末位是校验号。
(3)期刊著录格式:
作者(多作者用逗号分开,超过3个者用“等或 et al”). 文章题目[J].刊物名称,年代,卷数(期 数):页数 如: Porter MF, Zhang J. An algorithm for suffix stripping. Program, 1980, 14(3):130~137
P:专利文献类别代码
(2)专利文献著录格式
专利申请者.
专利题名:专利国别(或地区), 专利号[P].出版日期. TACHIBANA R, SHIMIZU S, KOBAYSHI S, et al. Electronic watermaking method and system: US, 6,915,001[P]. 2002-04-25.
(1)图书的特征
图书没有统一的开本
文献检索-第二章__文献检索基本知识
Z——综合性图书
O 数理科学和化学 (一级类目) O1 数学 (二级类目) O3 力学 O4 物理学 O6 化学 O61 无机化学(三级类目) O611 化学元素与无机化合物 (四级类目)
图书馆图书的排架与查询:
图书是按索书号排列在书架上的 图书查询先确定索书号 索书号:由图书分类号和书次号组成;分类号在上,书 次号在下。
⑶事实检索
事实检索以特定客观事实为检索对象,检索结果是某一具体 的、客观存在的事实。 如:查找“前事不忘、后事之师”最早的出处。
信息检索的类型
按照检索方式的不同,分为手工检索和计算机检索。
手工检索:用人工来处理和查找所需信息的检索过程。主要 依靠印刷型的二次文献,如文摘、目录等。
计算机检索:利用计算机和一定的通信设备查找所需的信息。 如联机检索和网络检索。
(2)主题途径
从文献中抽选出来的,代表文献内容实质词 汇——主题词,包括关键词、标题词、叙词等作 为检索标识,进行文献检索的一种途径。
(3)著者途径
根据已知文献著者(作者)的姓名来查找 文献的途径。
(4)名称途径
根据文献的名称来查找文献的途径。如: “书名目录”、“刊名目录”。
(5)序号途径
以文献的编号为特征编排和检索文献的途 径。如:“专利号索引”、“报告号索引”等。
(6)其他途径
有些检索工具还附有一些特殊索引,可提 供从特殊途径查找所需文献的线索。如《CA 》中的分子式途径、环结构式途径等。
3、文献的检索步骤
(1)分析研究待查课题
检索的目的是什么? 课题属于什么学科专业? 需要什么类型的文献?(中文,外文文献) 所需文献的年代范围等 另外,还需要了解与检索课题相关的专业背景知 识、有关的专业名词、术语等。
第二章 信息检索的基本知识
应用举例:
利用《中图法》在《全国报刊索引》中查找 有关“建筑抗震设计”方面的相关文献。 第一步:分析课题,按学科属性属于“T工业技术” 中的“TU建筑科学”大类。 第二步:查《中图法》确定分类号为:T工业技 术—TU建筑科学—TU3建筑结构—TU352.11抗震结 构。 第三步:根据《全国报刊索引》(科技版)的分 类目录给出的TU3建筑结构的页次,得到相关文献。 第四步:根据的出处索取原始文献。
第二章 信息检索的基本知识
主要内容
1.信息检索概述 2.信息检索原理及检索语言 3.信息检索系统与检索工具 4.信息检索的一般程序
2.1 信息检索概述
2.1.1信息检索的含义
信息检索(Information Retrieval)是指 将信息按一定的方式组织和存储起来,并根据用 户的需要找出有关信息的过程,又叫信息储存与 检索(Information storage and Retrieval), 这是广义的信息检索,如图2-1所示。狭义的信息 检索则是仅指该过程的后半部分,即从信息集合 中找出所需信息的过程。
内容特征 标题词 主题语言 关键词 叙词 描述文献外表特征的检索语言,例如篇名、著者姓名、文 献号等作为文献标识与检索依据直接明了,使用时较为简单。 而文献内容特征的语言,也就是分类语言和主题语言的原理和 使用方法是下面主要介绍的内容。
一条中文书目记录:
题名: 信息检索 作者: 徐天秀 出版项:北京:科学出版社,2006 页码: 320页 价格: CNY23.00 主题: 情报检索 索取号: G252.7/101 内容提要:本书是一本工具型书籍,提供的信息检索学科 范围广,内容尽量以最新版本为主,是一本适用性强的学 习信息检索方法和技巧的专著,尤其是本书配制的多媒体 光盘,为本课程的学习提供了便捷。 分类: G252.7
文献检索,信息检索(2)第二章 信息检索原理
缺点:常常落后于当前研究现状,分类表相对呆板的 学科关系,使得确定前沿概念、跨学科概念或非常具 体概念的分类,较困难。用户差异性。
分类语言
中国图书馆图书分类法 美国国会图书馆分类法 杜威十进位分类法 IPC国际专利分类法
基本部类 马列毛邓 哲学
(2)多概念课题
并列概念课题,如“新闻宣传研究”
“计算机在人文社会科学方面的应用” 上位类分类方法,如“灰色系统理论”
应用性课题,如“计算机在人口预测方面的应用”、
2.主题语言
是直接以代表信息内容特征和科学概念的概 念词作为检索标识,并按字顺组织的一种检索语 言。 是以表达文献主 是从文献的内容 是从文献的题目
一、检索算符 逻辑与
(一)布尔逻辑算符
布尔逻辑组配运算是采用布尔代数中的 逻辑“与”逻辑“或”、逻辑“非”等算符,
将检索提问式转换成逻辑表达式,限定检索
词在记录中必须存在的条件或不能出现的条 件。凡符合布尔逻辑所规定的条件的文献, 既为命中文献。
布尔逻辑运算符
————————————
1、逻辑“或” 2、逻辑“与” 3、逻辑“非”
2、逻辑“与”
————————————————
Chinese AND litera0,000 网络100,000,000) 用符号“and”或“*”表示,其逻辑表达式为: A * B 或 A and B 其意义为检索记录中必须同时含有检索词A和B 的文献,才算命中文献。
4、记录级
检索词在数据库的同一记录中。
(C)—citation
表示两侧的检索词(或检索项)必须出现在同一记录中,词
序不限,中间词数量不限,其作用与布尔逻辑算符AND相同。
2文献检索基础知识
文献信息检索基 础知识
1
所谓文献信息检索就是根据课题的需要,利 用检索工具和检索系统,按照一定的检索方法和 程序去查找文献信息的过程。 检索原理: 检索就是将“检索提问标识”与存储在检索系 统中的“文献特征标识”进行比较,两种标识基 本相符的,即完成检索过程。
2
•文献检索的概念
检索途径
汉语拼音音节索引 用拼音著录汉字
12
2.按照检索语言所描述的文献信息特征的内容 可分为描述文献内容特征的语言和描述文献 外部特征的语言: 其中前者又可分为分类语言、代码语言、 主题语言(包括关键词、单元词、标题词、 叙词语言等); 后者又可分为书/刊/篇名、著者/团体 著者、引文、代码/序号。
13
(1)分类语言:是一种直接体现知识分类的 等级制概念标识系统,是按照学科范畴划分 而构成的一种语言体系。它能集中体现学科 的系统性,反映事物的从属、派生关系,并 从上至下、从总体到局部层层划分、展开, 是一种等级分明的语言。 分类检索语言通过分类表来体现,一部完 整的分类表大体可由:编制说明、大纲、简 表、详表、辅助表、索引、附录等组成。
6
• 数据和事实检索是要检索出包含在文 献中的具体情报; • 文献检索则是要检索出包含所需要情 报的文献。 • 文献检索是最典型和最重要也是最常 利用的情报检索
7
• 2、根据检索方式 • 手工检索系统由手工检索设备(如书本式目录、文摘、 索引、卡片柜等)、检索语言、文献库等构成。 • 特点:它使用方便,成本低廉,但检索效率和响应时间 均较差。 • 机器检索系统可以分为机械检索系统和计算机检索系统。 • 机械检索系统主要由穿孔卡片、选卡机、机械探针、编 码规则、文献库等构成。 • 计算机检索系统主要由计算机检索设备(光盘检索设备、 微机(脱机)检索设备、联机检索设备、缩微品机检设 备等)、检索语言、文献库等构成。 • 特点:检索效率高,响应速度快等特点,但是成本和检 索费用较高。
文献检索2
1、书名途径
• 书名途径是根据书刊资料的名称来着手查找的途径。 • 使用工具:图书书名目录、期刊书名目录等。 • 按书刊资料的名称字顺来排列。 • : 1)由于文献篇名较长,检索者难于记忆; 2)书名按名称字顺编排,造成相同内容文献分散,不 能满足族性检索的要求。
20
2、著者途径
• • • • • •
6
四、检索语言
检索语言的重要性: • 在存储和检索过程中,检索语言起着重要的语言保 障作用。它沟通文献存储和检索两过程,沟通标引 人员和检索人员双方思路,既是编制检索工具的依 据,也是计算机信息存储及检索系统用以表达文献 主题概念的人工语言。 • 如果没有检索语言作为标引人员与检索人员的共同 语言,就很难使得标引人员对文献主题内容的表达 (文献标引)与检索人员对相同内容的课题文献需 求(课题标引)取得一致,文献检索也就不可能顺 利实现,甚至根本无法实现。
16
二、检索工具的作用
• 将不同类型、不同语种的文献按学科或主题加以集 中、组织在一起,避免了直接检索的分散性、盲目 性和偶然性,提高查全率和查准率。 • 缩短检索过程、节省读者的时间。 • 检索工具中的标识(分类号、主题词等)是按照一 定的检索语言来编排的,因此,它可以提供有规律的 检索途径,使检索者得以根据需要灵活地从多种角 度进行检索。 • 帮助科技人员消除了语言文字的障碍。
著者途径是根据已知文献著者姓名查找文献的途径。 文献著者包括个人著者、共著者和团体著者。 索引工具:著者索引、机构索引 按著者姓名字顺排列和检索。 :编辑简单、出版快速、内容集中、使用方便。 :某一个人或团体著者,发表的文献是有很大 局限性的,不能满足全面检索某一课题文献的需要。
21
3、序号途径
• 序号途径是以文献号码为特征,按号码大小顺序 编排和检索的途径。 • 检索工具:报告号检索、合同号检索、入藏号检 索、专利号检索等。 • 特点:编制简单、查找方便迅速,但事先必须掌 握文献号码。 • :从序号途径查找资料受到很大的限制, 不能把它作为文献检索的主要途径。
第三节课 第二章 文献检索原理与方法
思考题
1.《中国图书法》(简称《中图法》)将图书分为() A. 5大部类,22个大类 B. 5大部类,26个大类 C. 6大部类,22个大类 D. 6大部类,26个大类 2.《中国图书法》(简称《中图法》)是我国常用的分类法,要 检索农业方面的图书,需要在( )类目下查找。 A. S类目 B. Q类目 C. T类目 D. R类目
第一步,《全国新书目》的新书是安排在"新书视窗"专栏,在 2000年第3期《全国新书目》的目录中寻找到"新书视窗"专栏, 在第41~77页。 第二步,在第41~77页的"新书视窗"专栏里,我们可以看到, 该专栏是按照出版社的顺序排列的。高等教育出版社在第45页, 广东经济出版社第46页,教育科学出版社在第52页。 第三步,在第45、46、52页,你可以看到这几个出版社最 近所出版的新书目录。 如广东经济出版社的目录中有以下记载: 知识经济与改革创新 黄铁苗主编 2000 20cm 25.00元 本书围绕改革开放中的热点、难点问题进行探索,具体内容 包括:所有制问财政金融问题、农村经济问题、就业问题、地方 经济问题和其他问题。
2.检索工具-类型
目录 (bibliography,catalogue) 文摘(abstract) 索引(index)
2.1 目录
目录是一批相关文献信息的著录集合,是以报道文献 出版信息为主要功能的工具。 特点:以单位出版物为著录对象,反映馆藏情况,主 要揭示文献外部特征 目录的著录项目:出版名称、责任者、出版项和稽核 项 目录的类型:《全国总书目》《全国新书目》《全国 西文期刊联合目录》
主题词法与分类法的比较
主题词法 分类法
文献检索基础知识
UDC LC CC
(比)英特勒等
美ห้องสมุดไป่ตู้国会图书馆 编目组
(印)阮冈纳赞
混合 体系 组配
书目分类法
BC
(美)布利斯
混合
9
体系分类法
定义:以学科分类为基础,依据概念的划分与概括原理 ,把概括文献内容与事物的各种类目组成一个层层隶属 、详细列举的等级结构体系的一种分类法。
分类法
编制说明 分类表 复分表
10
《杜威十进分类法》(DDC)
000 总论 100 哲学 200 宗教 300 社会科学 400 语言 500 自然科学 600 应用科学 700 艺术 800 文学 900 历史、地理
510 数学 520 天文学 530 物理学 540 化学 550 地球科学 560 古生物学 570 生命科学 580 植物学 590 动物学
中国图书馆
《中国科学院图书馆图 书分类法》
《中国人民大学图书馆 图书分类法》
科图法 人大法
中国科学院图书馆
中国人民大学图书 馆
体系 体系 体系
《中国档案分类法》 中档法
国家档案局
体系
8
国际常用分类法
分类法名称
简称
主编
体系结构
杜威十进分类法
DDC
(美)杜威
体系
国际十进分类法 美国国会图书馆分类法
冒号分类法
东思想
50 自然科学(总论)72 能源学、动力工程
10 哲学
51 数学
73 电技术、电子技术
20 社会科学(总论)52 力学
74 矿业工程
21 历史、历史学 53 物理学
75 金属学(物理冶金)
27 经济、经济学 54 化学
第二章 文献信息基础知识(2)
特点:
a. 内容实用、新颖、报道及时; b. 代表某一领域的最高水平,实用性强; c. 具有法律效力。
7. 标
定义
准
文
献
是对各种产品、元件、工程建设质量、规 格、检验方法等作业技术规定。
主要是对工农业产品和工程建设的质量、 规格、检验方法等方面所制定的技术规定。
其主体是标准,还包括标准形成过程的各种 档案、宣传推广标准的手册及其它出版物。 标准:按规定程序制定,经权威机构公认或 主管部门批准的在特定范围内执行的规格、 规则、技术要求等规范性文件。
电子型 磁性 材料
打字、穿 孔,编码、 程序设计
电子图书、电子 期刊、计算机 文档、 光盘数据库
存储密度高、体积 需借助计算机 小、易保存和流通 存储和阅读
2.2.2 按出版形式的不同
按 出 版 形 式 的 不 同
图 书
连续出版物
期刊 报纸 年鉴
会议文献 专利文献 标准文献 学位论文 政府出版物 科技报告 产品样本 科技档案
⑴ 零次文献(灰色文献)
所谓“零次文献”是指非正式出版物 或非正式渠道交流的文献,未公开于社会 ,只为个人或某一团体使用。 如文章草稿,私人笔记,会议记录,未 经发表的名人手迹,甚至包括口头言论和 思想教育。
(2)一次文献(Primary Document) (原始文献) 是以著者本人的经验,研究或研制成 果为依据而撰写的原始文献,经公开发表 或交流后,称为一次文献。 一次文献是文献的主体,是最基本的 信息源,是文献检索的对象。如期刊论文 、会议文献,专利文献,学位论文。
缩微 型文献
手写型文献
古代各种非印刷型文献及现在尚未正式付印的手 稿。
印刷型文献
载体:纸张 实例:教科书 记录手段:油印、铅印、 胶印、复印 特点:可直接阅读,方便 使用;但难于实现机 械化和自动化;收藏 文献占用空间大。
文献信息检索基础
从上表看出分类号的变化体现了 各学科体系的从属关系,分类号位 数每增加一位,则分类级别便低一 级。
首创,它由大类、门、纲、目、子目等组成。 它将全部学科的书刊分为九大类,用1到9间的数 字表示,不属于这九类中的图书为第0类。每一大 类下再分1到9个子类,依此类分下去。
000 总类 001 知识问题 002 关于书籍 003 系统论 004 数据处理 ——计算机科学 005 计算机程序统计、程序、数据 006 专用计算机方法 011 综合性目录 540 化学与相关学科 541 物理化学与理论化学 542 技术、设备、材料 543 分析化学 544 定性分析 545 定量分析 546 无机化学 547 有机化学
TQ 化学工业 – TQ0 一般性问题 – TQ11 基本无机化学工业 – TQ2 基本有机化学工业 – TQ31 高分子化合物工业 – TQ314 原料与辅助材料 TQ314.2 合成高分子化合物 –TQ314.24 助剂 TQ314.24+1 引发剂 – TQ32 合成树脂与塑料工业 – TQ33 橡胶工业 – TQ34 化学纤维工业 – TQ35 纤维素质的化学加工工业
相关分类号
相关分类号
X 环境科学、安全科学 – X1 环境科学基础理论 X17 环境生物学 –X172环境微生物学 – X5环境污染及其防治 – X7废物处理与综合利用 X79 轻工业废物处理 –X792 食品工业废物处理
第二章信息检索基础知识
属后组式语言。
主题词
概念:通过文献所属学科的主题对文献进行检索, 是以主题词为检索标识,它是一种特性检索。 主题词是用来表达文献的主题概念的,经过规范化 主题词 处理的名词或词组。 如:出生缺陷-畸形 杵状指-骨关节病,继发肥大性
主题词表- 主题词表-单元词表
《WPI--规范化主题词表》
(WPI--LIST OF STANDARD THESAURUS TERMS)
是检索英国德温特公司专利文献的工具。按规范 词字顺排列。其著录格式见图
WPI-List of Standard Thesaurus Terms 1987 COBALT(3772)(1) COBALT@(3) CODON【87】(4) ELECTRIC(33892)(1) Electrical(2)
关键词 自然语言 单元词 标题词 叙词 语 言 言 语
分类语言
分类语言是运用概念划分的方 法,按文献内容所属学科、专 业性质的逻辑次序,以数字、 字母或数字与字母结合为基本 字符,以分类号为标识,用来 存储和检索文献的文献标识系 统。
分类语言的特点
主要特点就是按学科专业性质集中图书 区分不同性质的图书 集中性质相同的图书 相近的放在相近的位置 按照远近亲疏的关系把图书组成为一个 有条理的体系 提供从学科分类查找图书的途径
机械制造工艺系统学 / 张恩生,申铁固编著-上海交通 大学出版社 TH16/ Z31 机械设计学习指南 / 陶民华等编机械工业出版社 TH122-44/ T43 机械优化设计基础 / 张九明编著煤炭工业出版社 TH122/ Z32A 分类号+著者号TP393-62/J25
主题语言
主题语言是指以自然语言的字符为字符, 以名词性术语为基本词汇,用名词性术 语作为标识的一种信息标识系统。是主 题概念检索文献信息的检索语言。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
运算符
1、布尔逻辑运算符(Boolean Operators) 2、通配符和截词符 3、字段限制符
、
1、布尔逻辑运算符 Boolean Operators
名 称
逻辑 与
逻辑 或
逻辑 非
运算符
AND * OR +
NOT -
逻辑关 系
举例
作用
限定 A AND B 缩小
需求分析
信息源
检索工具 检索方法
检索途径 检索标识
确定学 科范围、
主题概 念。
确定信 息源类 型、 语
种、时 间和空 间范围。
选择数据 库及其文 档、搜索 引擎及网 站。
选择检索 途径
及其检索 标识
制定检索 策略
调整检索 策略
查找文献 线索
索取原始 文献
检索提 问表达 式
根据检索 结果,扩 大或缩小 检索范围, 提高查全 率和查准 率。
以工程索引EI为例,通配符和截词符的检索 表达式及检索结果如下:
算符 *
$
含义
结果
利用它可以输入检索词的起始部分,而 实现一簇词的检索
自动取词根运算符
Alter*可命中 alter,alternando,altern ant,alternate,alternati ve等
$alter可命中 alter,alternate,alterna tive
用检索 工具查 找到文 献线索
馆藏文献借阅、 复制 全文数据库 网上获取 向作者索取
检索提问表达式=检索词+运算符
检索词
分为两类: 字词类:名词术语(如叙词或关键词),或者是个
人或机构名称。 如:行政管理、王平、西安邮电大学等。
数码类:分类号,代码,年代,登记号等。 如:2010(年)、 TP391.41(分类号)
• 信息的检索、利用和创造是一个循环和增值的过程, 人们通过工具(数据库)检索获得信息,经过处理筛 选出需要的部分,在利用信息的过程中又创出新的信 息,这些信息经过核准后又被标引、组织进检索工具 (数据库),再提供人们使用,信息在这个循环的处 理过程中不断得到扩充,它的增长是没有穷尽的。
三、文献信息检索语言
主题法检索
• 优点
使检索具有直接性与直观性; 适合于从事物出发按专题进行特性检索,专制性强
• 缺点:
缺乏按学科进行族性检索的能力; 缺乏表述专指度较高的复杂概念的能力;
四、文献信息检索工具
文献检索工具
题录(Title) 索引(Index) 文摘(Abstract) 文献数据库
4.综合法:也称循环法,是指将直查法、追溯法、 工具法综合运用的检索方法。综合法适用于历史 悠久、文献信息需求量较大的课题。在具体应用 时可分为交替检索、分段检索和间隔检索三种。
七、文献信息检索步骤
信息检索是一项实践性很强的活动,它要求 我们善于思考,并通过经常性的实践,逐步掌握 文献检索的规律,从而迅速、准确地获得所需文 献。一般来说,文献检索可分为以下几个步骤。
需要一定的专门知识和技能
查找、搜索、 搜寻 Search 随机或更随意一些。
简单,任意词
用途 结果 效率
课题或专题 检索前通常不知道会有什么结果 迅速、准确
日常生活 通常知道结果 一般
如果不刻意区分:你完全可以认为它们没有区别!
二、文献信息检索
定义:
信息检索或情报检索,是指将文献信息按照一定的方 式组织和储存起来,并能根据用户的需要取出所需特定信 息的整个过程。它的全名为信息存储与检索。从广义上讲, 信息检索包括了信息的存储过程和检索过程,它不仅仅指 信息的具体检索程序和方法,同时也指信息库及其检索系 统的建立(即现代信息管理学里的信息组织).
F5交通运输经济
F72中国贸易经济
F6邮电经济
F73各国贸易经济
F7贸易经济
F74国际贸易
F8财政经济
F75各国对外贸易
F76商品学
F761一般性著作 F762农产品 F763医疗用品 F764重工业产品 F765建筑器材 F766交通运输器材 F767化学工业产品 F768轻工业产品
分类法的作用
等同 排斥
A OR B 扩大 缩小
A NOT B
逻辑与
A AND B A*B
A
B
缩小检索范围,提高检准率。
逻辑或
A OR B A+B
A
B
扩大检索范围,提高查全率。
逻辑非
A NOT B A-B
A
B
缩小检索范围,提高查准率。 使用不当,会发生信息漏检。
逻辑运算次序
布尔逻辑运算次序 布尔逻辑的运算就象数学中的四则运算的“先乘除后
信息检索语言的类型:
1、按描述学术文献的出版特征可划分为内容特征语言和外表特 征语言。
描述文献 外表特征
• 题名 • 作者(地址 ) • 出处 • 序号 • 文献类型 • 原文语种
检索语言
描述文献 内容特征
• 分类语言 • 主题语言
• 叙词 • 关键词
• 代码语言
2、按构成原理可划分为分类语言和主题语言。
2.追溯法:是指利用引文关系获取所需文献信息的 检索方法。在具体操作时可以分为由新及旧的追 溯法和由旧及新的追溯法两种,由新及旧的追溯 法是指利用文献后所附的参考文献以扩大检索范 围的追溯方法。其检索结果越来越旧;由旧及新 的追溯法主要是指利用各类引文索引进行跟踪检 索,所检索出的文献越来越新。
3.工具法:是指利用一定的检索工具和系统工具, 是一种科学的正规的文献信息检索方法,它节约 检索时间,获取文献准确全面。根据具体操作方 式的不同可以分为顺查法、倒查法、抽查法三种 类型,分别适用于不同的文献信息需求情况;
3、字段限制符
字段限制符是指限定检索字段,即指定检索 词出现在记录中的哪一个字段。检索时,机器只 在限定字段内进行搜索,这也是提高检索效率的 措施。
字段检索可分为两类:前缀式和后缀式。
1. 前缀式就是将检索词放在前缀字段代码之后, 对应辅助索引,反映文献的外部特征,一般用 “=”相连。
常用的有: AU=AUTHOR BN= ISBN CO=CODEN(代码) CD=Conference Date(会期) CL=Conference Location(会址) CY=Conference Year DT=Document Type LA=Language PY=Publication Year SN=ISSN
题名途径—标题中的关键词
参考文献
作者途径—作者姓名
外表特征 检索途径
号码途径—标准号、专 利号、合同号等。
出版物途径—出版物名称
出版年(卷、期)
叙词途径--主题词/副主题词
学科分类途径--类号、类名
内容特征 检索途径
关键词途径---自由词
信息检索方法
1.直查法:是指直接从有关的一次文献中获取所需 文献信息的检索方法。直查法主要用于平时浏览 和积累本专业的学科知识,便于较快地获取最新 文献信息。在实际使用过程中,直查法往往是使 用核心期刊。
八、文献信息检索效果评价
狭义的信息检索是指信息的查找,即从信息库中找出所 需要的信息的程序和方法。
检索的意义
• 信息具有共享性,信息资源共享(information resource sharing)是当今社会的一个热点问题。为 了分享人类共同的知识财富、研究成果,人们必须通 过一种科学的方法从取之不尽的信息源中去识别和获 取所需要的那部分信息,这个过程就是检索 (Retrival)。
2. 后缀式就是将检索词放在后缀字段代码前,对应
基本索引,反映文献的主题内容,通常用“/”分 隔。
常用的有:
/TI 表示Title /AB 表示Abstract /DE 表示Descriptors /ID 表示Identifiers 如:INFORMATION/TI,凡篇名中有INFORMATION的 文献将被检索出来。
分类语言
它是将表达文献信息内容和检索课题的大量概 念。按其所属的学科性质进行分类和排列,成为 基本反映通常科学知识分类体系的逻辑系统,并 用号码(分类号)来表示概念及其在系统中的位 置,甚至还表示概念与概念之间关系的检索语言。 《中国图书馆分类法》是我国最重要的一部图书 分类法,《中图法》把一切知识门类按“五分法” 分为马列、毛泽东思想;哲学;社会科学(9大 类);自然科学(10大类);综合性图书这五大 类。在此基础上建成由22个大类组成的体系系列。
第二章 文献信息检索基本知识
一、检索
1.含义:从信息集合中迅速、准确地查找出 所需信息的过程和方法。
信息集合是指有组织的信息资源整体, 可以是:馆藏目录、数据库、(印本)检 索工具等。
2.检索与查找的区别
英文
过程和方 法
技能
检索 Retrival 或 Retrieval 有一定的策略,是系统的查找资 料。
分类语言
它是将表达文献信息内容和检索课题的大量概 念。按其所属的学科性质进行分类和排列,成为基 本反映通常科学知识分类体系的逻辑系统,并用号 码(分类号)来表示概念及其在系统中的位置,甚 至还表示概念与概念之间关系的检索语言。《中国 图书馆分类法》是我国最重要的一部图书分类法, 《中图法》把一切知识门类按“五分法”分为马列、 毛泽东思想;哲学;社会科学(9大类);自然科 学(10大类);综合性图书这五大类。在此基础 上建成由22个大类组成的体系系列。
优点:
• 按学科分门别类地集中文献,揭示各个类目在内容上 的逻辑联系,提供从学科角度进行族性检索的途径;
• 便于随时放宽或缩小检索范围。
缺点:
• 无法反映新学科和新技术的内容; • 不能全面检索有关跨学科专业的某一事物的所有文献。