情报检索(第2章)
第二章 文献信息检索基本知识(2).概要
(2)截词检索表达式
用截词符号“*”、“?”或“$”加在检索词 的前后或中间,以检索一组概念相关或同一词根 的词。 按截断的位置可分为:
前截断、中间截断、后截断 按截断的字符数量可分为: 有限截断(?)、无限截断(*)
如:输入检索式“Comput*”,将检出包含 Computer、Computing、Computed、 Computerization 等词汇的结果。
第二章 信息检索基础知识
2.3 文献信息检索的工具
1、文献信息检索工具概述 检索工具是将大量分散无序的文献资料经过加 工整理,按照一定的规则和方法编制起来,用来 报道、存储和查找文献的工具,是附有检索标识
的某一范围文献条目的集合。
传统的检索工具是人们利用手工方法编制的
工具书,有字典、词典、目录、百科全书、名录、 类书、政书、表谱、图录等。这些工具书是人们
题录示例
(3)索引(引得) 索引是将书刊内容中所论及的篇名、语词、主 题等项目,按照一定的排检方法加以编制,注明出 处,供读者查检使用的检索工具。 索引与目录的根本区别就在于著录的对象不同, 目录所著录的是一个完整的出版单位,索引所著录 的则是完整的出版物的某一部分、某一观点、某一 知识单元,提高文献检索的深度和检索效率。
完全一致(精确匹配)、任意一致(模糊匹配)
等。
讨论1: 我馆书目查询系统共有多少种检索方式?其基 本检索有多少个检索字段?
讨论2: “中国学术期刊网络出版总库”有哪些检索方式?
?
? ? 中国科技期刊数据库初级检索界面
2、 信息检索方法
(1)常用法 ①顺查法 ②倒查法 ③抽查法 (2)回溯法 (3)循环法
文献检索 第2章自测
题目1下面哪项不是代查代检的服务项目?选择一项:a. 电子阅览服务b. 专题文献检索服务c. 论文发表快速通道检索证明d. 论文收录与引用情况报告正确答案是:电子阅览服务题目2以下哪项是情报调研的特点?选择一项:a. 针对性、综合性、及时性、多样性b. 针对性、综合性、预测性、主动性c. 针对性、综合性、及时性、连续性d. 针对性、综合性、预测性、科学性正确答案是:针对性、综合性、预测性、科学性题目3以下哪项是个性化导读服务的原则?选择一项:a. 综合性原则与及时性原则b. 选择性原则与针对性原则c. 主动性原则与双向性原则d. 预测性原则与科学性原则正确答案是:主动性原则与双向性原则题目4以下关于学科化服务的描述哪项是错误的?选择一项:a. 学科化服务是集电子型文献的阅览、检索、服务为一体的b. 学科化服务是为用户主动地、有针对性地收集和提供文献信息的服务c. 图书馆开展学科化服务可以提高图书馆的综合业务水平d. 学科化服务又称学科馆员服务正确答案是:学科化服务是集电子型文献的阅览、检索、服务为一体的题目5下面关于馆际互借服务的说法哪项是正确的?选择一项:a. 图书馆之间通过馆际互借的方式互通有无b. 馆际互借是一种非返还式的文献提供服务c. 馆际互借具有快速、高效、简便的特点d. 馆际互借是在信息技术的支撑下从文献传递发展而来的正确答案是:图书馆之间通过馆际互借的方式互通有无题目6以下哪项是文献传递的另一名称?选择一项:a. 原文传递c. 馆际互借d. 原文借阅正确答案是:原文传递题目7国际标准组织在哪年公布了馆际互借及文献传递系统的两个国际标准ISO10160和ISO10161?选择一项:a. 1993b. 1992c. 1995d. 1994正确答案是:1993题目8早期的OPAC系统是在何时由美国一些大学图书馆和公共图书馆共同开发的?选择一项:a. 20世纪70年代末b. 20世纪90年代中c. 20世纪70年代中d. 20世纪90年代末正确答案是:20世纪70年代末题目9以下哪种书刊通常是可以外借的?选择一项:a. 学位论文b. 期刊合订本c. 珍(善)本d. 工具书正确答案是:期刊合订本题目10以下哪项是图书馆为读者提供书刊外借服务的主要部门?选择一项:a. 参考咨询部b. 自动化部c. 采访编目部d. 书刊流通部题目11读者个人信息查询是OPAC系统的主要功能。
第二章 检索语言
(一)分类检索语言的类型
1.体系分类法 2.组配分类法
(二)分类检索语言的特点
分类检索语言是信息管理领域经典的 检索语言之一,以1876年《杜威十进分类法》 的问世为标志,已走过了一个多世纪的历 程,形成了自成体系的一套信息组织和检 索方法。
二、分类检索语言结构
(一)类目 1.类目的划分 2.引用次序 3.类目的排列 4.类名的确定 5.类目之间相互关系的处理
一、检索语言的概念 传统意义上的检索语言仅指根据信息
检索需要而创制的人工语言,又称情报语 言、情报存储与检索语言、文献语言、文 献工作语言、索引语言、标引语言、标引 符号、标识系统等。
二、检索语言的基础
(一)概念逻辑 概念逻辑,是一种科学思维方法,通
过明确各种概念及其相互关系而揭示事物 的本质属性及各种事物之间的联系与区别。
词为基础,以概念组配为基本原理,对文 献主题进行描述的后组式检索语言。
(二)叙词表的编制
叙词表是叙词法的核心体现。目前, 国内的叙词表已有七八十种之多。常用的 有《汉语主题词表》、《化工汉语主题词 表》、《机械工程主题词表》、《电子技 术汉语主题词表》、《国防科学技术叙词 表》等。
五、主要主题词表介绍
(一)《汉语主题词表》 《汉语主题词表》是我国第一部大型的
综合性的叙词表,由中国科技信息研究所 和北京图书馆负责主持,1975年开始编制, 1980年正式出版。
(二)《中国分类主题词表》
《中国分类主题词表》是在《中图法》 编委会主持下,经全国40个单位160位专家 学者的共同努力,历时8年编制而成的,于 1994年6月正式出版。
(二)单元词法
单元词又称元词,是从自然语言中选 取,经过规范化处理,表达主题最小的、 最基本的、字面上不能再分的名词术语。
第二章文献信息检索基本知识
运算符
1、布尔逻辑运算符(Boolean Operators) 2、通配符和截词符 3、字段限制符
、
1、布尔逻辑运算符 Boolean Operators
名 称
逻辑 与
逻辑 或
逻辑 非
运算符
AND * OR +
NOT -
逻辑关 系
举例
作用
限定 A AND B 缩小
需求分析
信息源
检索工具 检索方法
检索途径 检索标识
确定学 科范围、
主题概 念。
确定信 息源类 型、 语
种、时 间和空 间范围。
选择数据 库及其文 档、搜索 引擎及网 站。
选择检索 途径
及其检索 标识
制定检索 策略
调整检索 策略
查找文献 线索
索取原始 文献
检索提 问表达 式
根据检索 结果,扩 大或缩小 检索范围, 提高查全 率和查准 率。
以工程索引EI为例,通配符和截词符的检索 表达式及检索结果如下:
算符 *
$
含义
结果
利用它可以输入检索词的起始部分,而 实现一簇词的检索
自动取词根运算符
Alter*可命中 alter,alternando,altern ant,alternate,alternati ve等
$alter可命中 alter,alternate,alterna tive
用检索 工具查 找到文 献线索
馆藏文献借阅、 复制 全文数据库 网上获取 向作者索取
检索提问表达式=检索词+运算符
检索词
分为两类: 字词类:名词术语(如叙词或关键词),或者是个
人或机构名称。 如:行政管理、王平、西安邮电大学等。
文献检索,信息检索(2)第二章 信息检索原理
缺点:常常落后于当前研究现状,分类表相对呆板的 学科关系,使得确定前沿概念、跨学科概念或非常具 体概念的分类,较困难。用户差异性。
分类语言
中国图书馆图书分类法 美国国会图书馆分类法 杜威十进位分类法 IPC国际专利分类法
基本部类 马列毛邓 哲学
(2)多概念课题
并列概念课题,如“新闻宣传研究”
“计算机在人文社会科学方面的应用” 上位类分类方法,如“灰色系统理论”
应用性课题,如“计算机在人口预测方面的应用”、
2.主题语言
是直接以代表信息内容特征和科学概念的概 念词作为检索标识,并按字顺组织的一种检索语 言。 是以表达文献主 是从文献的内容 是从文献的题目
一、检索算符 逻辑与
(一)布尔逻辑算符
布尔逻辑组配运算是采用布尔代数中的 逻辑“与”逻辑“或”、逻辑“非”等算符,
将检索提问式转换成逻辑表达式,限定检索
词在记录中必须存在的条件或不能出现的条 件。凡符合布尔逻辑所规定的条件的文献, 既为命中文献。
布尔逻辑运算符
————————————
1、逻辑“或” 2、逻辑“与” 3、逻辑“非”
2、逻辑“与”
————————————————
Chinese AND litera0,000 网络100,000,000) 用符号“and”或“*”表示,其逻辑表达式为: A * B 或 A and B 其意义为检索记录中必须同时含有检索词A和B 的文献,才算命中文献。
4、记录级
检索词在数据库的同一记录中。
(C)—citation
表示两侧的检索词(或检索项)必须出现在同一记录中,词
序不限,中间词数量不限,其作用与布尔逻辑算符AND相同。
第2章 情报检索语言的类型
词汇控制: 词汇选择
叙词语言
• 选择原则:出现频率;单义;组配 • 词汇类型:名词 • 先组词选择:直接以复合概念的语词形式 收入词表的词,即词组 • 后组词选择:以单元概念的语词形式收入 词表的词,即单词
词形和词义控制 词间关系控制:等同;等级;相关
32
叙词表
我国标准化手册对叙词表的定义是:叙 词表(Thesuarus)也称主题词表( Subject headings)。它是将文献标引 人员或用户的自然语言转换成规范化名 词术语的一种术语控制工具;是概括各 门或某一门学科领域,并由语义相关、 族性相关的术语组成的规范化的动态词 典。
叙词语言
性质: 概念性:具体和抽象;属种;单一和复合 规范化:词形、词义 优选处理:使用频率 组配:用两个或多个主题词组合起来表达 某一复合概念 语义关系:等同、等级、相关 动态性
30
叙词语言
特点: 直接性(直观性) 专指性:揭示文献主题内容的深度 适应性 客观性 主题集中性
20
标题词语言
标题表结构:
• 编制说明 • 主表 • 副表:副标题词(限定词)
编制:
• 积累成表法 • 通常编表法
21
标题词语言
优点:
• 标题词的单义性 • 用参照系统显示标题词间的相互关系
不足:
• 词表收词量大 • 标引缺乏灵活性 • 先组式,无法多角度检索 • 不能族性检索
22
7
情报检索语言的种类
特点:按事物集中文献,用参照系统等 方法间接显示概念或事物之间的关系, 提供事物名称的字顺检索途径。 包括: 标题法、单元词法、叙词法、关键词法 用主题词表示知识因子,用参照系统来 表示知识关联,用语词标识系统作为组 织知识的基本方式。
第二章 信息检索原理
2013-11-4
2、主题语言 主题语言是直接以代表信息内容特征和科 学概念的概念词作为检索标识,并按字顺 组织起来的一种检索语言。 分为:规范主题语言和非规范主题语言
2013-11-4
23
1)、规范主题语言 • 以自然语言为基础,经过标准化、规范化处理 的词语,具有概念性、规范性、组配性、语义 性和动态性。
信息源 用户
信息分析、 著录、标引
检索语言 数据库
用户需求分析
信息的表示
存储
检索
检索提问式
匹配过程
输出检索结果
2013-11-4 4
信息检索的实质是一个匹配(match)的过程:
也就是信息用户的需求和信息集合的比较与选择,用户 根据检索需求,对一定的信息集合采用一定的技术手段, 根据一定的线索与准则找出相关的信息。
2013-11-4 27
第三节 检索途径
• 一、信息检索方法
• 二、信息检索途径
2013-11-4
28
1.信息检索的方法
顺查法:从过去某一时间起往现在检索
倒查法:从现在往过去逐年逐月地检索 用户注重新信息,如:写论文
常规法:
信 息 检 索 的 方 法
抽查法就是抽查某一时段的信息.在事 物发展的关键、鼎盛时期,用户注意的 是某些重要的、关键性信息资源
计算机检索简称“机检”,是利用计算机和一定的通信 设备查找所需信息的检索方式.
特点:速度快、效率高、查全较高,成本高,费用大,
查准率通常不尽人意, 现代信息检索即计算机信息检索,是指利用计算机和网 络来处理和查找文献信息的检索方式。目前广泛使用的 计算机检索系统包括光盘系统、联机检索系统和网络检 索系统。
2013-11-4 9
信息检索技术第2章中国知网简明教程PPT课件
第2章 中国知网(CNKI)
图2.12 CNKI跨库高级检索
第2章 中国知网(CNKI)
检索结果分析:
分析检索命中文献,数量偏多(114篇),不宜逐个阅读,若要得到更合 适的文献,即可以通过增加检索控制条件进行二次检索,还可通过分组浏 览的方式,有重点地查阅命中文献。 (1) 按照来源数据库浏览,可以在选定的数据库中查阅命中文献,如中 国博士学位论文全文数据库中命中文献有3篇,见图2.13-A。 (2) 按照学科浏览,可以根据检索者的研究学科需求,选择指定学科的 命中文献浏览,如交通运输经济学科的命中文献有15篇,见图2.13-B。 (3) 按照机构浏览,可以根据文献作者的所在机构,选择文献浏览,如 北京交通大学有命中文献9篇,见图2.13-C。 (4) 按照基金浏览,根据文献的支持基金情况,选择文献浏览,如国家 自然科学基金支持的命中文献有1篇,见图2.13-D。
第2章 中国知网(CNKI)
2.4.2 中国知网出版物检索 CNKI知识发现网络平台(简称KDN平台)的特 色之一就是统一了出版物导航检索,包括期刊导 航、博士学位授予单位导航、硕士学位授予单位 导航、会议论文集导航、报纸导航、年鉴导航和 工具书导航。统一导航页面中有字母导航和分类 导航,左侧文献分类目录帮助用户快速定位导航 的分类。分类导航检索可以采取鼠标滑动展现的 方式实现导航操作,读者可直接按照分类浏览基 本信息,按期查找出版物,见图。
检索控制 件
图2.11 CNKI 跨库高级检索
第2章 中国知网(CNKI)
【检索示例2.4】利用CNKI跨库高级检索模式,检索2013年发表的“城市交 通枢纽换乘客流预测”方面的文献。 检索步骤: (1) 检索分析,检索内容可以设定为:城市交通、交通枢纽、客运枢纽、 交通换乘、乘客换乘、客流预测、换乘客流等。 (2) “跨库选择”,选定期刊、特色期刊、博士学位论文、硕士学位论文 、国内会议论文、国际会议论文、学术辑刊、硕士_2013增刊和成果9种数据 库。 (3) 选择检索项为“主题”。 (4) 选择检索词:交通枢纽、客流预测、交通换乘、城市交通;设定“交 通枢纽”和“交通换乘”为“或含”关系;“客流预测”和“城市交通”为“ 或含”关系。 (5) 时间范围控制:2013年到2013年,或2013年1月1日到2013年12月31 日。 (6) 命中文献114篇。如图2.12所示。
第2章信息检索基本知识
2、引文法:又称为扩展法,追溯法。是指不
利用一般的检索工具,而是利用已经掌握的文 献末尾所列的参考文献和引用文献,进行逐一 查找的一种最简便的扩大情报来源的方法。一 般在没有适用的检索工具或已知的文献线索很 少的情况下使用。
“顺藤摸瓜”
3、循环法:又称分段法、交替法,它是把上
述两种方法加以综合运用的方法。
检索途径-分类途径
这是一种按学科分类体系来查找文献的途径,使用 的检索语言是分类语言。使用的检索工具有“分类目 录”、“分类索引”等。分类法反映事物之间的隶属、 派生和平行等关系,体现了知识的系统性,它能把同 一学科的文献集中在一起,能较好地满足族性检索的 要求。当研究课题较大,需要全面了解某一学科及其 相关知识的时候,或者难于判定研究课题所属主题范 围的时候,通常利用分类索引,从分类的途径来查找 文献。
2、三者提供的资料不同: 目录提供某一方面较成熟系统的知识,索引、文摘提供相对分散 的资料线索。
3、三者在使用方式上不同: 目录、索引不提供文献内容特征,文摘提供文献的内容特征。
• 按检索方式分: 印刷型检索工具和机器检索工具;
• 按出版形式分: 期刊式检索工具、书本式检索工具、卡片式 检索工具、缩微式检索工具、机读式检索工 具等;
2、现代信息检索
现代信息检索即计算机信息检索,是指利用计算机和 网络来处理和查找文献信息的检索方式。
三、 信息检索工具
检索工具:
是人们用来存储、报道和查找各类信息的工具。它 是通过对信息进行搜集整理、特征分析和组织加工后的 产物。
主要包括二次、三次印刷型手工检索工具,面向计 算机和网络的各种数据库检索系统以及搜索引擎等各种 网络检索工具。
选择输出(打印、拷贝或发送至电子邮箱)
第二章 图书信息检索
2. A or B
3.A not B
① 逻辑与(逻辑乘) 用关系词AND或“*”表示,表示它所连接的两 个检索词必须同时出现在结果中才满足检索条件。
逻辑与用来缩小文献检索范围,提高查准率,是具有 概念交叉和限定关系的一种组配。
② 逻辑或(逻辑加) 用关系词 OR 或“ +” 表示,表示它所连接的 两个检索词中任意一个出现在结果中就满足检索条件。
• Author(作者) • Publisher(出版者) • Artery(流通渠道) • Buyer(即购买者) • Internet(网络) 收录:相关专业教参书 年度:1973-2007年 完全数字化的出版。
矿业工程数字图书
• 中国煤炭工业协会科技 文献信息咨询专业委员 会 • 煤炭行业(中国矿大) • 超星数字图书馆合作 • 收录全面 收录年度:1949年至今
电子图书
• 发展历程:Electronic Book、E-Book、eBook 20世纪40年代,科幻小说; 1968年,松下电器开始了电子照片液体显影液的研究 电泳 液晶; 1971年,古腾堡工程: 迈克尔哈特(伊利诺伊大学) 扫描和光学文字识别 约翰内斯古腾堡,德国15世纪 印刷商 卡内基梅隆大学; 1997年Eink(电子墨水)公司 化学、电子和物理 麻省剑桥; 亚马逊Kindle、OPPO公司Enjoy、汉王公司 20世纪80年代 国内电子图书开始生产; 2000年10月,世界上第一台阅读不耗电电子图书在天津问世; 2009年,Barnes & Noble推出Nook:墨水电子屏+液晶触摸屏; 彩色显示问题 2010年开始,美国苹果公司IPad、IPad2.。。。。; 2011年Google iriver,外观和技术与Kindle相似。
文献信息检索第2章 习题与答案
第2章文献信息检索基础知识1.简述文献信息检索的定义和类型。
答:1)定义:文献信息检索就是检索者根据特定的需求,借助于某种检索工具(检索系统),采用一定检索策略、方法和步骤,从信息集合中查找所需文献信息的过程。
2)类型:按文献信息检索的内容划分:文献检索、事实检索和数据检索按信息资源检索技术划分:全文文本检索、多媒体检索、超文本检索和网络信息资源检索。
根据检索手段划分:可分为手工检索和计算机检索。
2.概述按文献不同特征的文献信息检索语言的分类。
答:(1)描述文献外部特征的检索语言可简要概述为:题名——题名索引著者——作者索引、团体著者索引报告号索引外部特征的检索语言文献编号合同号索引存取号索引其他——人名索引用文献目录等(2)描述信息资源内部特征的检索语言可概述为:分类语言内容特征的检索语言标题词语言主题语言叙词语言单元词语言关键词语言3.了解和掌握《中国图书馆图书分类法》的分类体系。
分几大部类和几个大类?计算机网路方面的图书,按《中图法》分类属哪一大类?分类号是什么?答:《中国图书馆图书分类法》的分类体系共分五大部类22大类;计算机网络方面的图书属于TP类,分类号是TP393。
4.文献信息检索工具的类型有哪些?答:1) 按文献信息的著录形式划分:目录、题录、文摘、索引;搜索引擎。
2)按文献信息存储介质划分:手工检索工具、计算机检索工具5.运用布尔逻辑检索技术编写“信息素养对大学生终身学习、自学和创新能力的影响”课题的布尔逻辑检索式。
答:检索式为:信息素养AND(大学生AND(终身学习AND自学AND创新))6.文献信息检索的方法、途径分别有哪些?分析课题“自动冲床进料机构的机电一体化技术研究”应选哪种检索方法和检索途径。
答:文献信息检索方法有:直接检索法和间接检索法----循环法、追溯法、常用法(抽查法、逆查法、顺查法)文献信息检索途径有:分类检索途径、作者检索途径、主题检索途径、题名检索途径、号码途径、引文途径等。
信息检索教程 第2章 信息检索系统
连续 出版物
学位论文
传统文献信息媒体——按文献信息媒体的内容形式划分
类型 释 义 标准文献 是指对工农业产品、卫生教育、行政机关和工程建设的质量、规格、检验方法及 管理等所做的技术规定,是人们从事管理、设计、生产和检验的一个共同技术依 据。标准作为一种规章性的技术文献,具有一定的法律约束力。 会议文献 一般是指国内外各个科学技术学会、协会及有关主管部门召开的学术会议或专业 会议上提交、宣读或交流的论文或报告。因此会议文献代表着一门学科或专业的 最新研究成果,反映着当时的发展水平或动态。会议文献通常有会前预印本,会 后会议录、论文集、期刊等出版形式。 专利文献 主要指专利说明书,也包括各种专利检索工具、专利公报及专利法律文件等。专 利文献具有新颖性、创造性和实用性的特点,并具有垄断性、地域性、时间性、 公开性和法定性的特征,因此专利文献是一种集技术与法律于一体的实用性很强 的文献信息媒体,但重复出版率很高。
2.1 信息源与信息媒体
2.1.2 信息媒体
2. 电子文献信息媒体 电子文献信息媒体是指以数字编码的形式,把文字、 图像、动画、声音、视频等信息存储在磁光等介质 上,通过计算机和其他辅助设备阅读使用的一种新
型文献信息媒体,实质是一种机读型信息媒体。电
子文献信息媒体是信息技术发展的产物,它的产生、 发展和应用给人们展示了一个全新的虚拟世界。电 子文献信息媒体种类繁多、划分多样。
二次文献
三次文献
传统文献信息媒体——按文献信息媒体的内容形式划分
类型 图书 释 义 是用于全面而系统地阐述某一方面或学科的科学理论或发展,传授科学技术以及 查阅某些知识的文献形式。一般来说,图书的内容比较系统、全面、成熟、可靠, 缺点是出版周期长、新颖性欠佳。图书按使用功能可分为以下两类。 阅读型图书:教科书、专著、科普读物 查阅型图书:参考工具书、检索工具书 采用统一名称定期或不定期连续性发行的出版物,主要指报纸、期刊和年度出 版物。连续出版物一般有连续的卷期或年月日顺序号,出版周期短、报道文献 快、内容新颖、信息量大,特别是报纸、期刊现已成为广大民众和科研人员阅 读量最大的信息媒体。 这是高等学校或研究机构的毕业生作为评定各级学位而撰写的论文。目前多数国 家的学位分为学士、硕士和博士三级。学位论文质量参差不齐,但带有一定的独 创性和新颖性,特别是博士论文具有较高的专业水准、参考价值较大。
情报检索语言的类型
元词法
叙词法 关键词法
自然语言
三、情报检索语言的种类*
(一)按规范化程度划分
1、非规范化语言 是直接从原始信息中抽取出自由词作为检索点的检索语言。对 主题概念中的同义词、多义词等不加处理,取其自然状态。 如:维生素C
2、 规范化语言
是人为对标引词或检索词加以控制和规范,使每个检索词只能 表达一个概念。排除了自然语言中同义词、多义词等现象。 如:分类法、主题词(叙词)
号表示。如:《中图法》
例如:《日本古代戏剧》 分类号:I313.32 主类号(I文学)+世界地区复分号(I313日本)+外国 文学类专用复分号(I313.3戏剧)+仿分号(I313.32
古代)
(2)组配分类法
用简单概念组成复合类目的方式。 例如:《外文社科期刊选订》
分类号:Ec=5c=615=653(藏书补充=社会科学= 期刊=外文)
4、引证关系追溯法(引文索引法)
是采用引文语言来标引文献和建立检索系统的一套技术
方法。
比如:SCI数据库
以上四种检索语言中,最常用的是分类检索语言和主题
检索语言。
四、主题法概述
一、主题法的概念
主题法,是直接以代表事物名称或概念的术语作 为表达文献主题内容的标识符号,并依据这些 标识符号的字顺,组织和编排文献检索工具的 一种方法。
示词间语义关系和动态性的词和词组。是用来
揭示文献主题内容,标引和检索文献的一种情 报检索语言词汇。 例:维生素C—抗坏血酸
4、叙词(主题词)的特点:
优点:主题词不一定是文献的篇名中出现的 词语,而是将文献的内容实质经过主题分 析之后,经过规范化和优选处理的,具有 组配功能的词,词和概念之间的关系是一 一对应的,保证了文献的查全率和查准率, 可以依据一定的组配规则,任意扩大或缩 小检索范围。
第三节课 第二章 文献检索原理与方法
思考题
1.《中国图书法》(简称《中图法》)将图书分为() A. 5大部类,22个大类 B. 5大部类,26个大类 C. 6大部类,22个大类 D. 6大部类,26个大类 2.《中国图书法》(简称《中图法》)是我国常用的分类法,要 检索农业方面的图书,需要在( )类目下查找。 A. S类目 B. Q类目 C. T类目 D. R类目
第一步,《全国新书目》的新书是安排在"新书视窗"专栏,在 2000年第3期《全国新书目》的目录中寻找到"新书视窗"专栏, 在第41~77页。 第二步,在第41~77页的"新书视窗"专栏里,我们可以看到, 该专栏是按照出版社的顺序排列的。高等教育出版社在第45页, 广东经济出版社第46页,教育科学出版社在第52页。 第三步,在第45、46、52页,你可以看到这几个出版社最 近所出版的新书目录。 如广东经济出版社的目录中有以下记载: 知识经济与改革创新 黄铁苗主编 2000 20cm 25.00元 本书围绕改革开放中的热点、难点问题进行探索,具体内容 包括:所有制问财政金融问题、农村经济问题、就业问题、地方 经济问题和其他问题。
2.检索工具-类型
目录 (bibliography,catalogue) 文摘(abstract) 索引(index)
2.1 目录
目录是一批相关文献信息的著录集合,是以报道文献 出版信息为主要功能的工具。 特点:以单位出版物为著录对象,反映馆藏情况,主 要揭示文献外部特征 目录的著录项目:出版名称、责任者、出版项和稽核 项 目录的类型:《全国总书目》《全国新书目》《全国 西文期刊联合目录》
主题词法与分类法的比较
主题词法 分类法
信息检索教程 第二章 检索语言
17
【例题】检索英语会话类辞典,例如《美国语会话百科》、 《英语会话大全》、《现代英汉生活用语图解词典》,请 选择,哪种检索途径才能够同时查出这3本书? 【选项】 A.用关键词“会话”和“词典” B.用中国图书分类号H319.9-61
C.用书名“英语会话”和“大全”
D.用书名“英语会话”和“词典” 【答案】B
2.1.3.3 按信息标识的组合使用方法,可分 为先组式语言、后组式语言和散组 式语言
2.1.3.4 按语言的规范程度,可分为人工语 言和自然语言
3
第2章 检索语言
2.2.1 概念逻辑
2.2 检索语言 的理论基础
2.2.1.1 概念间的关系 不相容 关系
相容关系
同一 属种
整体与 全面与 不相排斥 交叉 部分 某一方面 的并列
10
第2章 检索语言
2.3.2.3 主要体系分类法介绍 国内常见的体系分类法有:
《中国人民大学图书馆图书分类法》,简称《人大法》 《中国图书馆分类法》,简称《中图法》 《中国科学院图书馆图书分类法》,简称《科图法》 《中国档案分类法》
国外常见的体系分类法有:
《杜威十进分类法》(Dewey Decimal Classification)简称DC或DDC 《美国国会图书馆分类法》(Library of Congress Classification)简称LC 《国际十进制分类法》(Universal Decimal Classification)简称UDC
11
《中国图书馆分类法》 第2 章 检索语言
我国目前广泛使用的分类法是《中国图书馆分类法》。它是由国 家图书馆等单位组织全国力量,以学科分类为基础,并结合图书的特 性所编制的分类法。它将学科分五大部类,基本序列是:马克思主义 列宁主义毛泽东思想、哲学、社会科学、自然科学、综合性图书,由 5大部类、22个大类、6个总论复分表、30多个专类复分表、4万余条 类目组成了一个完善的分类体系。 标记制度采用拉丁字母与阿拉伯数字相结合的混合号码制,用一 个字母代表一个大类,以字母的顺序反映大类的序列,在字母后用数 字表示大类下类目的划分,数字的设置尽可能代表类的级位,并基本 上遵从层累制的原则。
第二章 信息检索的基本原理与方法
可见,信息检索的全过程应包括两个主要方面: 可见, 信息标引和存储过程。标引是用检索语言和分类号、 (1)、信息标引和存储过程。标引是用检索语言和分类号、主题词等标识符号 来表示信息,通过对大量无序的信息资源进行标引处理,使之有序化, 来表示信息,通过对大量无序的信息资源进行标引处理,使之有序化,并按 科学的方法存储起来,并组成检索工具或检索文档——组织检索系统的过程; 组织检索系统的过程; 科学的方法存储起来,并组成检索工具或检索文档 组织检索系统的过程 (2)、信息的需求分析和检索过程。分析用户的信息需求, (2)、信息的需求分析和检索过程。分析用户的信息需求,利用组织好的检索 系统,按照系统提供的检索方法和途径检索有关信息 系统,按照系统提供的检索方法和途径检索有关信息——检索系统的应用过 检索系统的应用过 程。
3、信息检索的类型 、
作或过程。
(一)、按检索对象划分,信息检索可以分为:文献检索 、数据检索 、事实检索 )、按检索对象划分,信息检索可以分为: 按检索对象划分 (1)、文献检索:文献检索的概念就是信息检索的概念。 )、文献检索: 文献检索
(2)、数据检索(data retrieval):是从文件、数据库或存储装置中查找和选取所需数据的操 (3)、事实检索:是情报检索的一种类型。广义的事实检索既包括数值数据的检索、算术运
计算机检索的特点: 检索方便快捷; 检索 功能强大; 获得信息类型多; 检索范围广 泛。 其中现在发展比较迅速的计算机检索是 “网络信息检索”,也即网络信息搜索,是 指互联网用户在网络终端,通过特定的网络 搜索工具或是通过浏览的方式,查找并获取 信息的行为。
4、检索的基本原理 、
信息检索基本原理的核心是用户信息需求与文献信息集合的 信息检索基本原理的核心是用户信息需求与文献信息集合的 比较和选择, 是两者匹配(match)的过程。 (match)的过程 比较和选择, 是两者匹配(match)的过程。 一方面是用户的信息需求, 一方面是组织有序的文献信息集 合,检索就是从用户特定的信息需求出发,对特定的信息集 合采用一定的方法、技术手段,根据一定的线索与规则从中 找出(search, locate, hit) 相关的信息。 匹配有其匹配标准,这里涉及到两者一致性、相关度等问题, 按一定的标准筛选出符合要求的信息。
第二章信息检索基础知识
属后组式语言。
主题词
概念:通过文献所属学科的主题对文献进行检索, 是以主题词为检索标识,它是一种特性检索。 主题词是用来表达文献的主题概念的,经过规范化 主题词 处理的名词或词组。 如:出生缺陷-畸形 杵状指-骨关节病,继发肥大性
主题词表- 主题词表-单元词表
《WPI--规范化主题词表》
(WPI--LIST OF STANDARD THESAURUS TERMS)
是检索英国德温特公司专利文献的工具。按规范 词字顺排列。其著录格式见图
WPI-List of Standard Thesaurus Terms 1987 COBALT(3772)(1) COBALT@(3) CODON【87】(4) ELECTRIC(33892)(1) Electrical(2)
关键词 自然语言 单元词 标题词 叙词 语 言 言 语
分类语言
分类语言是运用概念划分的方 法,按文献内容所属学科、专 业性质的逻辑次序,以数字、 字母或数字与字母结合为基本 字符,以分类号为标识,用来 存储和检索文献的文献标识系 统。
分类语言的特点
主要特点就是按学科专业性质集中图书 区分不同性质的图书 集中性质相同的图书 相近的放在相近的位置 按照远近亲疏的关系把图书组成为一个 有条理的体系 提供从学科分类查找图书的途径
机械制造工艺系统学 / 张恩生,申铁固编著-上海交通 大学出版社 TH16/ Z31 机械设计学习指南 / 陶民华等编机械工业出版社 TH122-44/ T43 机械优化设计基础 / 张九明编著煤炭工业出版社 TH122/ Z32A 分类号+著者号TP393-62/J25
主题语言
主题语言是指以自然语言的字符为字符, 以名词性术语为基本词汇,用名词性术 语作为标识的一种信息标识系统。是主 题概念检索文献信息的检索语言。
2 信息检索原理(课件PPT)
如:中图法的符号代码体系是拼音字母加数字1。4
第2章 信息检索原理
国内通用分类法有: 《中国图书馆图书分类法》(简称中图法) 《中国图书资料分类法》(简称资料法) 《中国科学院图书分类法》(简称科图法)
具体类号、类目展开情况如图所示:
检索标识即分类号,由拼音字母和数字组成
采用等级列举表达从属关系
上位类目与下位类目的关系:
上位类目一定包含各个下位类目,
下位类目一定带有上位类目的属性。
分类号越长,表示的学科范围越窄。
为了清楚醒目, 通常分类号的第三位数字后,隔以
. “ ” ,如F279.712,TQ032.4
16
马哲 列学
社会科学
自然科学
综
合
AB C D E F G H IJ K NO P QR S TUV X Z
马 哲社 政军 经文 语文艺 历
列 学会 治事 济教 言学术 史
主 科、
、、
、
义 学法
两个部分,两者又往往合并称为“信息存贮与检
索” 。
3
第2章 信息检索原理
2. 信息检索的一般原理 信息检索包括存储和检索两个过程。 信息检索过程的实质是将检索提问标
识与存储在检索系统(检索工具)中的检索
标识(标引标识)进行比较,含有两者一 致或信息存储的标识包含着检索提问标
识的信息就是检索命中的信息。这就是信 息检索原理。
2
1.信息检索的定义
狭义:是指根据特定课题的需要,运用科学的 方法,在大量信息(文献)集合中查获所需信息 (文献)的过程。
是指从任何信息集合中查找所需信息的活 动、过程与方法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2010-11-30 Yunnan Agricultural University 2009
S5820840@
11
Science Information Retrieval and Application
Take the next step
3. 位置算符检索法
位置算符( 位置算符(Proximate operator)表示二个检 ) 索词之间的位置邻近关系, 索词之间的位置邻近关系 , 它比布尔逻辑算符更 能表达准确的概念。 能表达准确的概念。 例1:细菌 and 染料 and 破坏 : 例2:细菌(w)染料(w)破坏 :细菌( )染料( )
2010-11-30 Yunnan Agricultural University 2009
S5820840@
17
Science Information Retrieval and Application
Take the next step
4. 字段检索法
字段( 字段 ( field) 检索法 , 是指检索词必须在限 ) 检索法, 定的检索字段中出现。 定的检索字段中出现。 篇名( ) 文摘( ) 主题词( ) 如 : 篇名 ( TI) 文摘 ( AB) 主题词 ( DE) 著者( 著者 ( AU) 文献类型 ( DT) 语种 ( LA) 年代 ) 文献类型( ) 语种( ) (PY)等。 ) 如:Tea and Breeding /TI AU = Zhou,G Z ,
Science Information Retrieval and Application
Take the next step
第二章 制定情报检索策略
一、计算机检索基本方法 二、聚类组合法的应用 三、逻辑检索提问式的编程
2010-11-30 Yunnan Agricultural University 2009
2010-11-30 Yunnan Agricultural University 2009
S5820840@
2
Science Information Retrieval and Application
Take the next step
逻辑与( ● 逻辑与(AND 或*) )
具有概念交叉和限定关系的 一种组配。 一种组配 。 检索结果中必须 出现所有的检索词。 出现所有的检索词。 例如: 例如:solar and energy 检索到的文献既包含A也包含 检索到的文献既包含 也包含 B。缩小检索范围,提高查准 。缩小检索范围, 率。 A AND B
两侧检索词必须出现在文献记录的同一字段 两侧检索词 必须出现在文献记录的同一字段 中(TI、AB、DE...),中间可加词,字段不限, 、 、 ) 中间可加词,字段不限, 词序不限。 词序不限。 如:electric(f)vehicles / TI ()
2010-11-30 Yunnan Agricultural University 2009
2010-11-30 Yunnan Agricultural University 2009
S5820840@
5
Science Information Retrieval and Application
Take the next step
提示: 提示:
在使用“逻辑非”进行组配时特别注意, 在使用 “ 逻辑非 ” 进行组配时特别注意 , 否 则会出现漏检。 则会出现漏检。 如上例是查找有关太阳能并排除核能方面的 文献,结果查到一篇: 文献 , 结果查到一篇: 一种替代核能燃料方面的 文献。 文献。
2010-11-30 Yunnan Agricultural University 2009
S5820840@
16
Science Information Retrieval and Application
Take the next step
为缩写) ⑤ Link(主从关系位置算符,L为缩写) (主从关系位置算符, 为缩写
如:A and B and C
A and B
2010-11-30 Yunnan Agricultural University 2009
S5820840@
8
Science Information Retrieval and Application
Take the next step
又如:一位女士择偶其条件是: 又如:一位女士择偶其条件是: 检索式: 检索式:帅 and 180cm and 钱 and 文凭 姓名 张三 李四 王二麻子 文凭 本科生 中专生 博士生 身高 170cm 180cm 185cm 家庭背景 小市民 资本家 高 干
Solar energy nuclear
A B
具有概念包含关系的一种组配。 具有概念包含关系的一种组配 。 检索结果中不应该出现包含某一 检索词的文章。 检索词的文章。 例如:solar energy not nuclear 例如: 检索到的文献包含A, 检索到的文献包含 , 但却不包 的文献。 含 B的文献 。 缩小检索范围 , 提 的文献 缩小检索范围, 高检索的专指性。 高检索的专指性。 A NOT B
Take the next step
提示: 提示:
在检索过程中,应根据课题的具体要求,选 在检索过程中,应根据课题的具体要求, 用不同的逻辑算符进行组配, 用不同的逻辑算符进行组配,通过改变检索项的 逻辑组配关系,可扩大和缩小检索范围。 逻辑组配关系,可扩大和缩小检索范围。 如,检索有关“汽轮机叶片制造”方面的文献 检索有关“汽轮机叶片制造” A-汽轮机 汽轮机 B-叶片 叶片 C-制造 制造 B and C
● 截词有多种用途
词尾截断可得到该单词所提及的所有词语( 词尾截断可得到该单词所提及的所有词语(单 数和复数) 数和复数) 词间切断或通配符: 词间切断或通配符:可找到该单词的所有变化 形式或不同拼法。 形式或不同拼法。
●
? = 一个字符 = 一个或多个字符
S5820840@
10
●*
2010-11-30 Yunnan Agricultural University 2009
具有概念并列关系的一种组配。 具有概念并列关系的一种组配 。 检索结果必须任一检索词, 检索结果必须任一检索词,当检 索词有多种拼法或有几个同义词 时,使用OR运算符。 运算符。 使用 运算符 例如:solar or sun 例如: 检索到的文献至少包含其中的一 个词。扩大检索范围, 个词。扩大检索范围,提高查全 率。
2010-11-30 Yunnan Agricultural University 2009
S5820840@
6
Science Information Retrieval and Application
Take the next step
提示: 提示:
布尔逻辑算符在使用时, 布尔逻辑算符在使用时 , 检索式中若含有 多个逻辑算符,计算机对其执行的顺序是: 多个逻辑算符,计算机对其执行的顺序是: NOT → AND → OR
Science Information Retrieval and Application
Take the next step
例如: 例如 检索单复数和不同拼法等词语
右端截断 Computer* Computer Computers Computerised Computerization 词间截断(通配符) 词间截断(通配符) Organi *ation Organization Organisation
●
加括号和位置算符可改变其运算顺序。 加括号和位置算符可改变其运算顺序。 如,(A or B or C)and D ( )
2010-11-30 Yunnan Agricultural University 2009
S5820840@
7
Science Information Retrieval and Application
S5820840@
1
Science Information Retrieval and Application
Take the next step
一、计算机检索基本方法
1. 布尔逻辑算符检索法 逻辑与” 布尔逻辑算符是用布尔代数中的 “逻辑与”、 “逻辑或”、“逻辑非”、来表示检索词之间的逻 逻辑或” 逻辑非” 辑关系,通过检索词的组配, 辑关系,通过检索词的组配,使其成为完整的布尔 逻辑检索提问式。 逻辑检索提问式。布尔逻辑检索是情报检索系统中 最常用的一种定性检索方法。 最常用的一种定性检索方法。
A B
solar
energy
2010-11-30 Yunnan Agricultural University 2009
S5820840@
3
Science Information Retrieval and Application
Take the next step
逻辑或( ● 逻辑或(OR 或 +) )
表示其两侧检索词之间有主从关系, 表示其两侧检索词之间有主从关系 , 前者为 后者为副。 可用来连接主 副标题词, 可用来连接主、 主 , 后者为副 。 L可用来连接主 、 副标题词 , 它 们被列在记录的规范词字段。 们被列在记录的规范词字段。 如:air pollution(L)control ( )
2010-11-30 Yunnan Agricultural University 2009
S5820840@
12
Science Information Retrieval and Application
Take the next step
为缩写) ① With(词间位置算符,W为缩写) (词间位置算符, 为缩写