第二章信息检索基础

合集下载

第2章--信息检索PPT课件

第2章--信息检索PPT课件

经济
文化、科学、教育、体育 语言、文字 文学 艺术 历史、地理
S
T U V X Z
农业科学
工业技术 交通运输 航空、航天 环境科学、安全科学 综合性图书
《中国图书馆分类法》
中国图书馆分类法分类表共分22个大类,再分17个 二级目录,医药卫生属于R大类。 《中图法》采用汉语拼音字母和阿拉伯数字组成的 混合制号码作类目标识,用一个字母标记一个基本
的问题;
另一方面是特定原始文献的查找,即在查找特定
的文献线索后,找出原始文献的过程。
第一节 信息检索基础
一、信息检索概念
(二)信息检索的意义和作用 信息检索 有助于知识更新 ,有助于同学们扩大视野 ,了解和把握有关学科中出现的新思想、新观点与 新知识。掌握信息检索技术是快速、准确地获取和 利用最新信息的有效途径。 信息检索有助于科学研究,了解和把握有关学科的 起源和发展过程。 有助于独立自主地解决自己在学习、生活和工作中 所遇到的疑难问题。 是接受终身教育的必要手段。 节省时间,提高效率。
第二节 信息检索语言
二、检索语言的种类
(一)分类检索语言 分类检索语言又称分类法,是用分类号(字母、数 字或它们的组合)来表达各种概念的,并将各种概 念按学科性质进行分类和系统排列的信息检索语言。 它以树状结构的形式,按知识门类的逻辑次序反映事物 的从属、派生关系,构成具有上位类和下位类隶属、同 位类并列的概念等级体系。 能较好体现概念的族性关系,从学科专业的角度检索资 料,比较方便,扩大、缩小检索范围方便。
(一)按信息检索的对象划分
数据信息检索 利用数据库、工具书等以数值或数据为对象的检 索,也称为数值检索。检索包含分子式、分子量 、公式 、图表等特定数据的信息。

第二章 信息检索基本知识

第二章 信息检索基本知识

(二)按出版形式划分:
原始文献
图书
特种文献
期刊
会 议 文 献
科 技 报 告
专 利 文 献
学 位 论 文
政 府 出 版 物
其 标 准
食品标准网

7-111-17892-0
《发票报文》GB/T 17303.2-1998 第二部分:国际贸易商业发票报 文
……
(三)按信息的加工程度来分: 1、一次文献信息 (原始文献):
一、检索工具的作用 1、报道作用 2、存储作用 3、检索作用
二、检索工具的特点
1、详细而又完整地记录了文献的外部特征和内部特征。
2、对所著录的文献,标引了可供检索的检索标识。 3、提供必要的检索手段,配备各种体系的索引。
三、检索工具的类型
按著录信息的特征划分:
1、目录 2、题录 3、文摘 4、索引
检索途径-分类途径 分类途径的缺点是新兴学科、边缘学科在 分类时往往难于处理,查找不便。另外, 从分类途径检索必须了解学科体系,否 则在将概念变换为分类号的过程中常易 发生错误,造成漏检或误检。
检索途径-主题途径
• 主题途径是一种按照文献的主题内容查找文献 的途径。使用的语言是主题语言。使用的检索 工具有“主题索引”、“关键词索引”、“叙 词索引”等。 • 主题法打破了传统的学科分类的框框,把分散 于各个学科的有关文献集中于同一主题词之下, 以文字作检索标识,索引按照资料内容的主题 词或关键词的字顺排列,检索时就象查字典一 样,不必考虑学科体系。
更多……
• 按检索方式,可分为印刷型检索工具和机器检 索工具; • 按出版形式,可分为期刊式检索工具、书本式 检索工具、卡片式检索工具、缩微式检索工具、 机读式检索工具等; • 按收录范围,可分为综合性检索工具、专题性 检索工具; • 按语种,可分为中文检索工具和外文检索工具;

第二章 文献信息检索基础

第二章 文献信息检索基础

理的名词术语,具有单一性、组配性好的特 点。
(2)分类语言:直接体现知识分类的等
级制概念标识系统;如中图分类号、杜威 十进制分类法等。
《中国图书馆图书分类法》即《中图法》
《中国图书馆图书分类法》
体现学科的系统性,反映事物的从属、 派生关系,并从上至下、从总体到局部 层层划分,展开,是一种等级分明的语 言。分为五大部类,22个大类,分别用 22个大写字母表示(其中除掉L、M、W、 Y)。
1.前方一致

也叫后截断,将截词符置于一个字符串的后面,以表示其后的有限或无 限个字符的检索。
无限截词
如: ? Physic? 可检出physic、physical、physican、physicalism
有限截词
截断两个字符
中间有 空格
如:? physic?? 可检出physic、physical、physican 截断一个字符 如:? cat? ? 可检出cat、cats
2.3 综合法
综合法又称为循环法,它是把上述两种方法
加以综合运用的方法。综合法既要利用检索 工具进行常规检索,又要利用文献后所附参 考文献进行追溯检索,分期分段地交替使用 这两种方法。即先利用检索工具(系统)检 到一批文献,再以这些文献末尾的参考目录 为线索进行查找,如此循环进行,直到满足 要求时为止。 综合法兼有常用法和追溯法的优点,可以查 得较为全面而准确的文献,是实际中采用较 多的方法。
能包含特征B。可以缩小检索范围,有利于提高查 准率。 A – B(逻辑非)
例:自由分配方面的文献(排除海南大学师生的著作) 提问式::(关键词=‘自由分配’) not (单位=‘海南大学')
三、位置算符
也叫邻近检索, 在检索词之间使用, 规定算符两边的检索词出现在记录中

第二章 信息检索的基本知识

第二章 信息检索的基本知识

应用举例:
利用《中图法》在《全国报刊索引》中查找 有关“建筑抗震设计”方面的相关文献。 第一步:分析课题,按学科属性属于“T工业技术” 中的“TU建筑科学”大类。 第二步:查《中图法》确定分类号为:T工业技 术—TU建筑科学—TU3建筑结构—TU352.11抗震结 构。 第三步:根据《全国报刊索引》(科技版)的分 类目录给出的TU3建筑结构的页次,得到相关文献。 第四步:根据的出处索取原始文献。
第二章 信息检索的基本知识
主要内容
1.信息检索概述 2.信息检索原理及检索语言 3.信息检索系统与检索工具 4.信息检索的一般程序
2.1 信息检索概述
2.1.1信息检索的含义
信息检索(Information Retrieval)是指 将信息按一定的方式组织和存储起来,并根据用 户的需要找出有关信息的过程,又叫信息储存与 检索(Information storage and Retrieval), 这是广义的信息检索,如图2-1所示。狭义的信息 检索则是仅指该过程的后半部分,即从信息集合 中找出所需信息的过程。
内容特征 标题词 主题语言 关键词 叙词 描述文献外表特征的检索语言,例如篇名、著者姓名、文 献号等作为文献标识与检索依据直接明了,使用时较为简单。 而文献内容特征的语言,也就是分类语言和主题语言的原理和 使用方法是下面主要介绍的内容。
一条中文书目记录:
题名: 信息检索 作者: 徐天秀 出版项:北京:科学出版社,2006 页码: 320页 价格: CNY23.00 主题: 情报检索 索取号: G252.7/101 内容提要:本书是一本工具型书籍,提供的信息检索学科 范围广,内容尽量以最新版本为主,是一本适用性强的学 习信息检索方法和技巧的专著,尤其是本书配制的多媒体 光盘,为本课程的学习提供了便捷。 分类: G252.7

第二章 信息检索基础知识

第二章  信息检索基础知识

* 叙词语言
是以表达文献主题内容的概念单元为基础,经过规范化处理,可以进行逻 辑组配的一种主语语言。如《汉语主题词表》、《INSPEC叙词表》(《科学 文摘》)、《工程索引叙词表》等。
非规范主题语言:它是相对于规范主题语言而言的,以自然语言的语词作检
索标识,其所用词汇未经过规范化处理。非规范主题语言包括关键词语言和 纯自然语言。
索”。 –B.切分也要适度,不能因切分而改变语义。如:不能将“操作系统” 切分为“操作|系统”
• 2、删除 将课题转换成关键词的集合
–A.删除不具有检索意义的虚词(a,the,is等)和关键词(因使用太宽 泛而不具有检索意义,如:http,com等) –B.删除过分宽泛和过份具体的限定词 » 无损检测技术在材料性能评价中的应用无损检测*材料 –C.删除具有包含关系的其中一个 » 教学用的信息检索课多媒体课件信息检索*多媒体*课件 • 3、替换 用更本质的概念替换表达欠佳的概念 稀土材料的研制钐钴(用户实际上是研究钐钴材料)
第二章 信息检索基础知识
一 信息检索
二 信息检索语言、途径
三 信息检索技术 四 检索步骤
一、信息检索
信息检索:是指将信息 (主要指文献信息)按一定 的方式组织和存储起来,并
根据用户的需要找出相关信
息的过程。
存储
信息检索 检索
存储:是对信息进行著录、 检索:是指面向信息需求 标引、整序,编制检索工 而进行高度选择性的查找 具和建立检索系统的过程。 过程。
作用:1)、保证不同标引人员表征文献信息的一致性。 2)、使内容相同及相关的文献集中化。
3)、保证检索提问与文献信息标引的一致性。
4)、保证检索者按不同需求检索文献信息时, 都能获得最高的查全率和查准率。

第二章信息检索基础知识

第二章信息检索基础知识

字段检索
限定提问关键词在数据库记录中出现的区域, 以控制检索结果的相关性。搜索引擎 中常用字段有: Title(或t); URL(或u); Link; Host(主机); Text。
自然语言检索 Please find for me something about automobile sale in New York State. 系统会检索出“New York State”和 “ automobile sale” 方面的信息。 概念检索 检索: “automobile”能同时检索出包含: “automobile”、“car”、“truck”、“bus”I21 I211 I212 I213 I22 I221 I222 I223 I23 I231 ……. I3 I31 I311 …… I4 ……
文学作品
中国文学作品
中国诗歌作品 中国古代诗歌 中国近代诗歌 中国现代诗歌 中国戏剧作品 中国古代戏剧 中国近代戏剧 中国现代戏剧 中国小说作品 中国古代小说 ………
按网络信息传播范围分:光盘信息源、联机 检索信息源、Internet信息源 按网络信息加工层次分:网络资源指南、搜 索引擎
2.2 信息检索语言及信息检索技术
2.2.1 . 信息检索语言:把信息的存储和检索联 系起来,把标引人员与检索人员联系起来以便取 得共同理解的语言,称为检索语言。类型: 按描述文献信息的特征划分:描述文献信息外表特
(2)图书馆的电子信息服务
图书馆提供的上网服务 图书馆的检索服务 图书馆提供的电子信息服务 图书馆提供的电子信息服务 图书馆提供的书籍全文在线阅读 图书馆举办的用户培训
(3)图书馆的信息资源借阅与查找
图书借阅 古籍善本书、线装书的阅览 期刊查阅 个人发表论文的查找 快速借阅所需图书 图书馆的图书逾期罚款制度 借阅查询 代书牌的使用

信息检索基础.ppt

信息检索基础.ppt
查全率 80% 查准率 88.9%
27
2.3 信息检索类型
1.文献检索
以索引、文摘或其他文献特征为主要检索对象 ,目的是运用检索系统查检出与某课题相关文献 检索,从而获取原始文献。
2.数据检索
以数据为检索对象,可直接选择专门的数据性 工具进行查检,从而得到数值性数据、图表、化 学结构式、计算公式等。
冠状动脉疾病 冠状动脉心脏病
主题词 冠状动脉疾病
治疗
文献
20
4. 著者检索
用文献的著者、编者、译者的姓名或机构团体名 称编制而成的索引。
按著者姓名字顺编排 书写格式 姓前(全称)、名后(缩写,即用首字
母)
如:Willian Henry Harrison →Harrison W H
Ren Shu Min → Ren SM
计算机检索系统
3
二、信息检索的原理
是将描述特定用户所需信息的提问特征,与 信息存储的检索标识进行异同的比较,从中找 出与提问特征一致或基本一致的信息。
本质是用户的信息需求与存储 在信息集合中的信息进行比较和 选择, 即匹配的过程。
4
主题
信息 文献的 分析 存贮 信息内容
主题
信息 检索者的 分析 检索 信息需要
18
3. 主题途径
主题词:是以自然语言为基础,以概念组配为 基本原理,并经过规范化处理,表达主题的最 小概念单元,作为信息存储和检索依据的一种 检索语言。
特 点: 词义、词类、词形规范保证词语与概念的唯一
对应关系,具有专指性。
19
检索举例:冠心病的治疗
自由词
冠心病
冠状动脉粥样硬化性心脏病 治疗
1. 直接浏览法
直接浏览法也称直接查找法,指检索者不依靠任何检 索工具或检索系统,从本专业最新核心期刊或其他文献中 直接阅读原文或浏览最新目次而获取文献的方法。这是一 种最常见的信息资源的获取方式。因为编制检索工具需要 时间,有的半年,甚至长达一年之久,直接浏览可以及时 获得最新文献。但利用这种方法查找的信息不全面、不系 统、且局限性较大,不能作为查找文献的主要方法。

信息检索教程(第二章)

信息检索教程(第二章)

4
(b)按收录文献出版形式分
●图书目录 ●期刊目录 ●会议论文目录 ●标准目录等。
(c)按物质形式划分
●卡片目录 ●书本目录 ●机读目录 ●联机公共检索目录等。
5
(2)图书馆目录、OPAC和联合目录概述
①图书馆目录
定义:它主要提供馆藏资源的检索,又叫馆藏目录,它反映
了一个图书馆的文献收藏情况,是一种重要的检索工具。
26
常用法示例
27
追溯法示例
28
2.3.2检索途径
29
30
1.分类途径
图书期刊分类法
世界三大图书分类法
《杜威十进分类法》(DDC)(Dewey decimal Classification ) 《国际十进分类法》(UDC)(Universal Decimal Classification) 《国会图书馆图书分类法》(LCC)(Library congress classification)
定义:所谓文献检索的方法,即查找文献的方法。有以下三种: 常用法:直接利用文献检索工具或检索系统来查找文献的方法,是 一种常规的科学检索方法。又称工具法或直接法。分为顺查法 、倒查法和抽查法。 追溯法:是一种跟踪查找法。它不利用检索工具只是利用文献(尤其 是评述性论文或专著) 后面所附的参考文献进行逐一地追踪查 找原文。又称引文法。 综合法:是常用法和追溯法的综合。利用检索工具或检索系统进行 常规检索,再利用文献后所附参考文献进行追溯检索,分期分 段交替使用这两种方法,直到满足要求为止。可以查得较全面 较准确,尤其适用于那些过去年代内文献较少的课题。称循环 法、分段法或交替法。
22
2.2.2检索工具的鉴别与评价
1.信息收录范围与信息质量

信息检索基础知识

信息检索基础知识

46
计算机信息检索系统工作流程

输入子系统——选择收集特定范围的信息资源、按系统 指定款式输入系统 处理子系统——处理加工经过鉴定、选择好的数据和信 息,使其成为易于存储和检索的形式。 存储子系统——将加工处理后的信息按某种规定有序聚 积在存储载体上以构成可检文档。 传输子系统——通过计算机与通信线路的连接,完成信 息编码的传递、转接、处理与接受。 输出子系统——根据用户需求有效输出各类最终信息产 品。 控制子系统——根据系统内外环境变化,适时调控,保 障系统的有效输入、有效存储、有效输出等环节的协调 运行。
16
三、计算机信息检索系统 2、计算机信息检索系统的类型
计算机单机信息检索系统(20世纪50年代 初——60年代中期) 计算机联机信息检索系统( 20世纪60年 代中——70年代中期) 计算机光盘信息检索系统( 20世纪70年 代中——80年代中期) 计算机网络信息检索系统( 20世纪80年
(期).页码
10
二、手工信息检索系统
5、几种常用的手工信息检索工具 《中国农业文摘》: 81年创刊、85年起分7个分册 刊期、类型:双月刊、文摘型 检索途径:分类、主题、著者 著录格式:分类号 顺序号 题目 /作者
// 刊名, -年,卷(期). -页码 文摘正 文…… 图x 表x 参x (文摘员)
23
一、信息检索语言概述
信息检索语言是人们在加工、存储
及检索信息时所使用的标识符号; 信息检索语言是索引款目所使用的 标识系统; 信息检索语言可以是对自然语言作 规范化处理后的词汇与技术语言, 也可以是某类事物及其某方面特征 的代码。
24
二、信息检索语言的基本类型
1、按构成原理分:

第二章:信息检索基础

第二章:信息检索基础
文献检索是信息检索的核心部分。
从性质上说: 文献检索是一种相关性检索,检索的结果 是与课题相关的文献或文献线索,而不直 接解答用户所提出的技术问题本身; 事实检索与数据检索则是确定性检索,检 索的结果是用户所需的确切的数据或事实。
2.1.3 信息检索的发展简要历程
手工检索阶段
世界四大检索工具(SCI\EI\ISTP\ISR),1665年《学者周刊》
补充
补充同义词或相关词 补充原词或缩略语
例:基于DSP芯片的虹膜识别系统
补充DSP的全称:数字信号处理(digital signal processing)
毫米波,补充MMW
补充
补充同一词的不同拼写
例1:虹膜识别:iris recognition 或 iris
identification 例2:3维、3D
一定要彻底,必Leabharlann 到词为止,同时也要适度,不能因 切分而改变语义。
例:基于DSP芯片TMS320DM642开发的虹 膜识别系统
基于| DSP |芯片| TMS320DM642 |开发|的|虹 膜|识别|系统
删除
删除虚词 删除过分宽泛和过分具体的限定词 删除存在蕴涵关系的可合并词
例:基于DSP芯片TMS320DM642开发的虹膜识别 系统 DSP |芯片| 虹膜|识别|
题名途径 著者途径 机构途径 代码/序号途径 其他途径
信息外部特征
检索途径
信息内部特征
分类途径 主题途径 关键词途径
分类途径
以学科性质和内容的相应类目、类号为 特征标识的检索方法。分类途经检索与分 类法是相对应的。
目前,我国通用的分类法主要有三种: A《中国图书馆图书分类法》(简称《中图 法》) B《中国科学院图书馆图书分类法》(简称 《科图法》) C《中国人民大学图书馆图书分类法》(简 称《人大法》)

第二章 信息检索基础知识

第二章 信息检索基础知识

全文检索
图像检索 超文本检索
文献检索
使用以二次文献为存储对象的信息系统,如目录
型、题录型、文摘型数据库,是一种相关性检索。特 点:检索结果不直接解答课题用户提出的技术问题, 只提供与之相关的线索。 例如:查找有关“食品安全与人类健康 ”方面的
国内外信息有哪些?
数据检索
以数值信息为检索对象,通过检索,用户可以获 得所需要的确切数据,是一种确定性检索。它一般以
的方式记录在相应的信息载体上,组织成系统
化的检索系统。
1. 数据库及其构成
数据库(database):至少由一种文档组
成,并能满足某一特定目的或某一特定数据处
理系统需要的一种数据集合。 通俗地说,数据
库就是在计算机存储设备上,按一定方式存储的 相互关联的数据集合,是信息检索的基础。
1. 数据库及其构成
一、信息检索的效果评价指标 二、影响检索效率的主要因素
一、信息检索的效果评价指标
以一个检索提问去检索任何一个数据库都会出现 4 个相关量:检出的相关信息量、未被检出的相关信 息量、检出的非相关信息量、未检出的非相关信息量。
一、信息检索的效果评价指标
1. 查全率 a 查全率(R )= —— ×100% a+c 查全率是对所需信息被检出程度的信息量指标。 2. 查准率 a 查准率(P )= ——×100% a+b 查准率是衡量拒绝非相关信息的指标。
中国图书馆分类法的体系结构:
S农业科学类目简表
(2)按事物的性质分类
按事物的性质分类 --- 热门主题 : 各种搜索引擎和网站 按事物的性质分类 --- 功能(使用方向)主题: 国际专
利分类法(IPC)
2.主题描述及信息检索语言

新第二章 信息检索基础知识

新第二章 信息检索基础知识

2.2 信息检索语言
三、主题语言
4.关键词语言
是指从文献标题、文摘、正文中抽离出来的,对表征文献主题 内容具有实质意义的语词,以关键词作为信息标识和检索依据的主 题语言。关键词没有固定的词表,因为对于同一个事物的概念,不 同作者甚至是同一个作者在不同的著作中用词都会不同,它是没有 经过规范化的自然语言词汇。 在检索中文医学文献中使用频率较高的《CMCC》数据库就是 采用关键词索引方法建立的。
2.5 计算机检索技术 四、词组检索
将固定词组或短语 看成单个词进行处理。
常用“ ”作为词组检索的运算符。
2.5 计算机检索技术 五、字段检索
对指定的一个或多个字段进行检索,从而提高查准率或查全率。
标题、作者、摘要、关键词、作者单位、文献来源、学位授予单位、 学位级别、会议信息、会址、会期、书名、出版地、出版年、专利号、报 告号、ISBN、ISSN等。
2.2 信息检索语言
一、信息检索语言的定义、作用和种类
4.分类:
篇名(题目) 著者名称 描述文献外表特征 文献序号 引用文献 等级体系分类语言 分类语言 组配分类语言 主题语言
检索语言
描述文献内容特征
代码语言
标题词语言 关键词语言 单元词语言 叙词语言 分子式索引 结构式索引 专利号索引等
2.2 信息检索语言
2.4 信息检索标识 一、检索标识的定义
检索标识即检索词,是指能表达检索课题主题概念和信息需 求的名词术语、分类号、名称、代码等的总称,包括主题词、 关键词、名称、分类号、分子式、专利号及各种号码。
2.4 信息检索标识 二、信息检索标识的类型
1.描述信息内容特征的检索标识: 分类、主题、代码(符号)。
2.5 计算机检索技术 一、布尔逻辑检索

第二章信息检索基础1

第二章信息检索基础1

化学物质登记号(CAS registry number)检索
分子式(formula)检索 记录顺序号(accession number)检索 化合物结构图检索(structure search)检索 ……
不同检索途径常用字段名称
题名途径:题名、标题、篇名、题目、title 分类检索途径:分类号,中图分类号 主题途径:主题词、MeSH、MeSH terms、 Thesaurus、map term to subject headings 关键词途径:关键词、keywords、text words 著者途径:(第一)作者、著者、责任者、 author、first author
研、生产中的具体问题所需要的特定知识或信息。(微波炉
发明) (四)文献(Literature) 文献是记录有知识的一切载体,是知识的外在形式。
情报的基本属性
知识或信息 经过传递
经用户使用产生效益 情报的 基本属性
信息与知识、情报、文献的关系
知识源于信息,是信息的一部分 情报源于知识或信息,是激活了的知识或信息 文献是信息、知识、情报的主要载体形式
形成系统,便于检索的文献。
如:题录、书目、索引和文摘。
特征1 特征2 特征3 特征4 特征5
提取特 征
特征n
二次文献
二次文献
二次文献
2013-8-10
40
三次文献
三次文献是利用二次文献并在其指引下,对大 量的一次文献进行综合分析研究,加以浓缩和提 炼而成的文献。 包括综述、述评、进展、预测等,各类词典、 手册、年鉴、百科全书、指南等参考工具书也属 于三次文献的范畴。
一次文献、二次文献、三次文献
一次文献:
又称原始文献,是首次公开发表的文献,直 接记录了科研成果,报道了新发明、新技术、新 知识和新观点。 一次文献主要包括专著、期刊论文、科技报 告、会议文献、学位论文、专利文献等。

信息检索基本知识

信息检索基本知识
第二章 信息检索基本知识
第三节 信息检索与检索系统
第三节信息检索与检索系统
• 1、信息检索 • 2、检索系统 • 3、检索系统的组织
1. 信息检索
• 信息检索(Iformation Retrieval):将信息按一 定的方式组织和存储起来,并根据信息用户的需 要找出有关的信息的过程和技术。
了解用户的 信息需求
如何提高查全率?
• • • • • 1.优先使用最简单常用的主题词; 2.逐渐减少不重要的检索词; 3.加用多个等同词,用“或”(OR、|)语法; 4.换用上位词; 5.增加检索途径
如何提高查准率?
• • • • • 1. 换用专指性更强的主题词; 2. 逐渐加用主题词; 3. 加用辅助词; 4. 利用词和网页的外部特征限制输出结果; 5. 观察不相关检索结果的特征,使用“减”(-) 语法排除; • 6. 使用下位词
信息检索 的技术或 方法
满足信息 用户的需 求
1.2、信息检索的对象-----你找谁?
文献
• 包括题录、文摘和全文。
数据 事实
• 数值或数据(包括数据、 图表、公式等)
• 某一客观事实为检索对 象,查找某一事物发生 的时间、地点及过程
信息检索的起源
• 信息检索起源于图书馆的参考咨询和文摘索引工 作。
按检索性质区分
• 定题检索:查找有关特定主题最新信息的检索, 又称为SDI检索。
▫ 特点是:只检索最新的信息,时间跨度小。
• 回溯检索:查找一段时期内有关特定主题信息的 检索,也称为追溯检索。
二、信息检索类型
• 按检索的信息形式区分
▫ 文本检索:查找含有特定信息的文本文献的检索, 其结果以文本形式反映特定信息. ▫ 多媒体检索:查找含有特定信息的多媒体文献的检 索,其结果以多媒体形式反映。

第二章信息检索基础知识

第二章信息检索基础知识

属后组式语言。
主题词
概念:通过文献所属学科的主题对文献进行检索, 是以主题词为检索标识,它是一种特性检索。 主题词是用来表达文献的主题概念的,经过规范化 主题词 处理的名词或词组。 如:出生缺陷-畸形 杵状指-骨关节病,继发肥大性
主题词表- 主题词表-单元词表
《WPI--规范化主题词表》
(WPI--LIST OF STANDARD THESAURUS TERMS)
是检索英国德温特公司专利文献的工具。按规范 词字顺排列。其著录格式见图
WPI-List of Standard Thesaurus Terms 1987 COBALT(3772)(1) COBALT@(3) CODON【87】(4) ELECTRIC(33892)(1) Electrical(2)
关键词 自然语言 单元词 标题词 叙词 语 言 言 语
分类语言
分类语言是运用概念划分的方 法,按文献内容所属学科、专 业性质的逻辑次序,以数字、 字母或数字与字母结合为基本 字符,以分类号为标识,用来 存储和检索文献的文献标识系 统。
分类语言的特点
主要特点就是按学科专业性质集中图书 区分不同性质的图书 集中性质相同的图书 相近的放在相近的位置 按照远近亲疏的关系把图书组成为一个 有条理的体系 提供从学科分类查找图书的途径
机械制造工艺系统学 / 张恩生,申铁固编著-上海交通 大学出版社 TH16/ Z31 机械设计学习指南 / 陶民华等编机械工业出版社 TH122-44/ T43 机械优化设计基础 / 张九明编著煤炭工业出版社 TH122/ Z32A 分类号+著者号TP393-62/J25
主题语言
主题语言是指以自然语言的字符为字符, 以名词性术语为基本词汇,用名词性术 语作为标识的一种信息标识系统。是主 题概念检索文献信息的检索语言。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

确定检索途径
• • • • 1.分类途径 2.主题途径 3.著者途径 4.序号途径
实施检索
• 按照一定的检索途径和检索方法实施检索。 往往具体的检索工具提供的标识略有差异, 此时就要作相应的调整,使其趋向检索工 具中的标识。
检索命中
• 用户的检索提问标识与检索工具或数据库 记录中的信息特征标识进行对比,当二者 一致时,即为检索命中。
信息检ห้องสมุดไป่ตู้语言
• 信息检索语言是一种专门的人工语言,有 称标引语言和索引语言,是信息系统中用 以描述信息的内容及外表特征和检索这表 达检索提问的语言,是两者相互沟通的共 同依据,是用于信息标引和检索提问的约 定语言。
信息检索语言的作用
• 用于标引信息的主题,简明而有效地揭示出信息 的内容及其外表特征。 • 通过对信息的标引,把内容相同及相关的信息集 中在一起,加之信息检索语言本身的序列化,从 而可对大量信息进行系统化和组织,使有规律的 检索成为可能。 • 信息检索语言的单一性和表述概念的唯一性,记 忆信息检索语言在信息标引和信息检索中同时运 用,决定了存储标识和检索标识的有效比较,为 准确输出所需信息提供了前提。
信息检索模型概述
• IR Model是信息检索的主要内容之一,他 运用数学或其他的语言和工具,对信息检 索的主要要素——查询和文档,及其之间 的匹配程度——相似度(Relevance)进行 抽象描述,用于信息检索过程。 {D,Q,F,R(qi,dj)} • 信息检索模型分类表
信息检索的基本程序
• 信息检索通常可以按下面五个步骤,即: 分析研究课题、选择检索工具、确定检索 途径、实施检索、索取原始文献。 • 如图。
分析研究课题,明确查找要求
• 1.找出课题所涉及的主要内容和相关内容, 从而形成主要概念,选取主题词。 • 2.明确课题需要的文献类型。 • 3.确定检索的时间范围。 • 4.课题需要的主语种。 • 5.了解课题对查新、查准、查全方面有无具 体要求。
选择工具或检索系统
• 两种主要的方法: • 1.浏览图书馆网站提供的检索工具,从中挑 选、确定最为合适的检索工具。(优:直 接、具体。缺:不全面) • 2.通过查询国内外出版的检索工具介绍,挑 选、确定检索工具。(优:系统、全面。 缺:效率低)
第二章 信息检索基础
从淘金到信息寻宝
• 普林斯顿大学物理系大学生约翰﹒菲利普仅利用 图书馆公共资料就在四个月时间画出原子弹设计 图。法国、巴基斯坦等国纷纷致函美国大使馆购 买他的设计拷贝。 • 哈佛大学经济专业年轻学生的《制造核弹的方法》 • 阿波罗飞船燃料箱在压力测试时发现甲醇会引起 钛应力腐蚀,为此花费数百万进行技术攻关。时 候发现十年前就已经有人给出了解决办法,即在 甲醛中加入2%的水即可。而检索这篇文章仅需10 分钟。
信息检索的重要意义有那些?
• 减少课题的重复研究,提高科研成功率。 • 有助于节约时间,提高科研效率。 • 掌握获取信息的方法,提高信息意识和信 息观念。 • …
信息源与信息势
• 信息源:信息的来源。
• 信息势:信息源和吸收源之间的信息差位。
信息资源的定义
• 目前无法统一。 • 狭义的信息资源把信息等同于知识、资料和消息。 (忽视了系统观,却突出了信息本身这一信息资 源的核心和实质。) • 广义的信息资源认为,信息资源是一个贯穿于人 类社会信息活动中从事生产、分配、交换、流通、 消费的全过程的多要素集合,包括信息劳动的对 象、信息劳动设备、信息劳动技术及信息劳动者。 (有利于全面、系统的把握信息资源的内涵。)
信息检索分类
• 广义的信息检索(存储和查询两部分)
• 狭义的信息检索(以信息系统为基础的单 纯检索过程)
信息检索分类表
• 板书+讲解
信息检索原理
• 广义地讲,信息检索包含信息存储和信息 检索两个过程。信息存储是对文献进行收 集、标引及注录,并加以有序化编排,编 制信息检索的工具的过程。信息检索是从 大量的信息中查找出用户所需的特定信息 的过程。而实施检索的主要方法就是利用 各种检索工具。 • 查考:信息检索原理图
• 1.用于组成词汇的形式化符号,通常有字母、 数字或文字等; • 2.表达基本概念意义的词汇; • 3.控制语言使用的语法,据此把基本的词汇 组合起来以表达更为复杂的概念意义,主 要体现为各种标引规则、组配规则、引用 次序等。
信息语言的要求
• • • • • 易于标引和检索 检索语言应具有实用性 具有较高的查全率和查准率 满足多种检索要求 检索语言之间的通用性和兼容性
信息检索语言的分类
• 根据检索语言的组配方式分类
• 1.先组式检索语言 • 2.后组式检索语言
• 根据检索语言的结构原理分类(如图)
• 1.分类语言2.主题语言3.名称语言4.代号语言5.引 文语言
• 根据信息特征的描述分类(如图)
• 1.描述文献外部特征的语言 • 2.描述文献内部特征的语言
信息检索语言的构成
信息资源的特征
• • • • • • • 1.普遍性 2.传递性 3.时效性 4.增值性 5.可转换性 6.可利用性 7.共享性
信息资源的使用价值
• 1.真实度 • 2.时效性
信息资源的类型
• 信息资源的类型划分没有固定的标准,注 意取决于人们分析问题的不同需要。 • 根据信息资源的性质、载体形式、内容表 现形式、加工程度及表现形式进行划分。 • 重点——信息资源类型表。
信息存储的工作内容
• • • • • • 1.选择文献。 2.文献的概念分析。 3.词汇转换。 4.信息检索工具的编制(核心和概括) 文献序列(如:文摘、题录) 文献标识的序列(常见的有:字母顺序, 汉语拼音顺序)
信息检索的工作内容
• 信息的检索过程是按照主题词表(或分类表)及 组配原则分析课题,形成检索提问表示,然后根 据信息存储所提供的检索途径,从信息集合中查 获与检索提问标识相符的信息的过程。 • 信息检索的工作内容,主要是由检索人员接受用 户的检索提问,对提问进行细致的主题分析,提 炼出用户检索的主题概念,并编制出相应的检索 策略。工作步骤如下:1.用户提问。2.提问的概 念分析。3.词汇转换。(一方面对提问的主题概念分 析,另一方面是信息检索语言)4.检索的实施。
相关文档
最新文档