信息检索与利用第2讲章计算机检索技术共97页

合集下载

《信息检索与利用》PPT课件

《信息检索与利用》PPT课件

10:01
3
为什么要学习文献检索?
文献资源日益庞大
• •

非科技文献,每10年甚至7-8年翻一番 科技文献,尤其是尖端科学的文献增加速度更快,如, 原子能文献每2-3 年就翻一番,且倍增周期逐年缩短 据估计目前每年出版的各种类型的科技文献有1000多万 篇
出版速度加快
据国外报导,2006年全世界出版
10:01
16
一、基本概念
信息
情报
知识 文献
10:01
17
信息(Information)
信息是客观事物存在的方式或运动状态,以及关于 客观事物存在方式或运动状态的陈述。 《情报与文献工作词汇、基本术语》对信息的定义: 物质存在的一种形式、形态或运动状态,也是事物 的一种普遍属性,一般指数据、消息中所包含的意 义。
(4)共享性
10:01
25
人们看柳树发芽,就知道春天来了,看到天上乌 云滚滚,就知道要下雨了,这就是这些自然世界 发出的信息。 信息是介于物质世界和精神世界之间的过渡状态 的东西,是人们认识事物、感知世界的不可缺少 的中间环节。它贯穿于认知活动的始终,认知过 程本身就是一个以信息为中介的信息运动过程。 人类认识世界和改造世界的过程,是一个不断从 客观世界获得信息,并对信息进行加工处理,形 成新的认知结构,然后通过实践活动反作用于客 观世界的过程。
10:01
6
学会了文献检索有什么好处?
对于科技人员: 文献检索是科技人员必备的基本技 能 文献检索是科学研究的先期工作
10:01
7
一个科研人员的时间分配表
写报告 10%
查资料 50%
查资料 计划思考 实验研究 写报告

信息检索与利用--第二讲

信息检索与利用--第二讲

第三节 检索系统与检索方法
一、检索系统
1. 检索系统的概念
信息检索系统是为满足信息用户的检索需求而建立起 来的、以提供信息检索为目的的信息存储与检索系统。 可以说,一个信息检索系统便是一定范围文献、信息 的全部备的不同,可将检索系 统分为:手工检索系统、机械检索系统、计算机检 索系统。 (2) 按载体形式不同,可分为卡片式、书本式、 缩微式、磁性材料式等检索系统。 (3) 按著录格式不同,可将检索系统分为目录、 题录、文摘、索引、全文检索系统。
3) 代码途径
很多文献因其本身特点有特定序号,如科技报 告号、专利号、标准号、信息收藏单位的入藏号、 ISBN、ISSN等。代码途径就是依据文献信息出版时 所编的代码顺序来检索文献信息的途径。这些序号 往往具有唯一性,可以据此识别特定的文献信息。 依据这些序号数字顺序可编制序号索引,提供序号 检索途径。同时,许多检索系统利用事物本身具有 的某种符号代码编制成分子式、元素符号、结构式 等索引,提供从特定符号代码顺序进行检索的途径, 如化合物索引。
二、检索方法 1. 常用法
常用法是利用检索工具查找信息的一种方法, 因为这种方法是目前查找信息中最常使用的,故亦 称常用法。 (1) 顺查法
(2) 倒查法
(3) 抽查法
(1) 顺查法 是指按年代由远及近的顺序进行查找的 方法,如检索“电视文化”这一课题,首先 要弄清起始时间,即“电视文化”产生的时 间是哪一年,然后从这一年开始查起,一直 查到当前“电视文化”方面的相关信息为止。 这样,“电视文化”课题就检索完毕。这种 方法的查全率和查准率都较高,但是检索整 个课题较费时费力。
2) 事实型信息检索
事实型信息检索是以特定客观事实为 检索对象,借助于提供事实检索的检索工具 与数据库进行捡索。其检索结果为基本事实。 如某个字、词的查找,某一诗词文句的查找, 某一年、月、日的查找,某一地名的查找, 某一人物的查找,某一机构的查找.某一事 件的查找,某一法规制度的查找,某一图像 的查找,某一数据、参数、公式或化学分子 式的查找等。

信息检索与利用教程-精品文档34页

信息检索与利用教程-精品文档34页

19.10.2019
信息检索与利用教程
32
请大家认真思考
1、资料型參考资源 查詢字詞语汇---字典 词典
查詢各类知识---百科全书 类书
了解人物生平---传记 年谱
查询地理资讯---地图 方志 旅遊集
发现古今事实---年鉴 年表 大事記
查询人物与组织---名录 机构
查詢数据---统计年鉴或手册
信息检索与利用教程
2
2.1手工检索基础
手工检索:利用印刷型检索工具进 行人工查找资料的方式。
工具书:不是用于某一学科或专题的系 统阅读,而是为了查找,是阅读时的一 种辅导工具,也就是供查找和检索文献 线索,解决阅读中产生的疑难问题的一 类图书,属于二次或三次文献。
19.10.2019
信息检索与利用教程
2 手工检索
19.10.2019
信息检索与利用教程
1
手工检索工具和参考工具书

科学技术发展,
利用前人成果人们通过实践,创造了许多解决这对矛盾的方
法,最主要的方法是将一次文献加工成二次或三
次文献,编制成能够快、准、全地查阅一次文献
的工具,这就是检索工具和参考工具书 。
19.10.2019
19.10.2019
信息检索与利用教程
10
参考工具书类型
1、字、词(辞)典 2.百科全书 3.年鉴 4.手册 5.标准 6.名录
19.10.2019
信息检索与利用教程
直 接 提 供 知 识 内 容
11
(1).字、词(辞)典
解释文字的形、音、义及其用 法的参考工具书称为字典。
解释词语的含义、及用法的参 考工具书称为词(辞)典。 如:《中药大辞典》

第二讲 计算机检索技术ppt课件

第二讲 计算机检索技术ppt课件
《中图法》从大类到小类,层层展开,不断 细分,形成完整的学科知识体系。
T 工业技术 TP 自动化技术 计算机技术
TP3 计算机技术 TP39 计算机的应用 TP393 计算机网络 TP393.4 国际互联网
精选PPT课件
索书号: TN911/846 TN911/855 TN912/123
图书排架规律: 奇数列的书架先以两列书架为一单元,最后再以三列 书架为一单元,按从左至右,由上而下的规律排架。
检索原理示意图精选PPT课件
检索过程
文献
分析 文献特征
情报工 作人员
用检索语言对 文献进行描述
文献标识
检索工具(系统)
检索者怎样才
能找到自己需
要的资料呢?

是否匹配
检索需求 分析
课题特征
用检索语言对 课题进行描述
检索表达式 (提问标识)
输出结果为零

得到检索结果☺
5
精选PPT课件
二、检索语言
1. 检索语言的定义
2
精选PPT课件
第二讲 计算机检索技术
一、 检索的含义 二、 检索语言 三、 检索工具 四、 检索技术 五、 检索步骤与策略
3
精选PPT课件
一、检索的含义
文献检索是检索者使用某种手段(手工、计算机 或其他),借助某种工具(印刷型检索工具、计算 机检索系统等),查找所需文献信息的的活动和过 程。
文献存储过程
例如:超星数字图书馆、中国期刊全文数据库、 万方博硕论文全文数据库、PQDD、EBSCO、IEEE、 ScienceDirect 、 Emerald 、Springer
23
精选PPT课件
三、检索工具
(4)数值、事实数据库

科技信息检索与利用2

科技信息检索与利用2

第一阶段:手工检索阶段。发源于图书馆的参 考咨询工作和文摘索引工作。在这一阶段,信 息检索逐渐形成一个独立的领域,走向专门化, 纸本工具书是这一时期信息检索的主要工具。 第二阶段:脱机批处理检索。20世纪五六十年 代计算机的诞生带来了信息检索的革命。在这 一时期,计算机还没有连接通信网络,也没有 远程终端装置,主要是利用计算机进行现刊文 献的定题检索和回溯性检索。
2.1.4文献信息检索方法类型 1、常规法:利用检索工具,以主题、分类、著 者等为检索入口检索所需文献的方法。顺查法、 逆查法、抽查法。 2、追溯法:利用原始文献后面所附的参考文献 和有关论著引文注释进行追踪检索的一种方法。 3、循环法:是常规法与追溯法的结合,交替使 用的检索方法,也叫综合法。
2.1.5 文献信息的一般检索步骤
2、以检索方式区分 1)手工检索 2)计算机检索
信息检索系统 1.信息检索系统的类型 目录 题录 文摘 全文
2.1.3
信息检索系统的构成
1、广义的信息检索系统的构成 1)检索文档 2)技术设备 3)语言工具 4)作用于系统的人
2、狭义的信息检索系统的组成 从物理构成来说,包括计算机硬件、软件和数 据库、通讯线路和检索终端五部分 数据库的结构:文档--记录--字段 文档:数据库中一部分记录的有序集合 记录:数据库的信息单元,每条记录描述了 一个原始信息的外部特征和内部特征。 字段:比记录更小的单位,是组成记录的数 据项目。
书信 函电 公文
(3)
隐含概念扩展法 如:“投资管理”的显见主题是“投资管 理”,隐含主题还有“投资法规”、“投资 法律”。 又如,“作家笔下的主人公特征比较”, 隐含主题还有“文学作品”和“小说”。

基于检索结果的概念扩展法

第2章 计算机信息检索技术PPT精品文档96页

第2章 计算机信息检索技术PPT精品文档96页

2019/12/11
3
国外计算机信息检索发展阶段(P5)
脱机检索阶段(20世纪50-60年代) 联机检索阶段(20世纪60-80年代) 光盘检索阶段(20世纪80年代中-90年代) 网络信息检索阶段(2019-)
2019/12/11
4
1.2 计算机信息检索的定义
计算机信息检索的实质就是由计算机将输入的检索策略与 系统中存储的文献特征标识及其逻辑组配关系进行类比、 匹配的过程,需要人——机协同作用来完成。
第二章 计算机信息检索技术
郑州大学信息检索教研室
2019/12/11
1
第1节 计算机检索概述 第2节 计算机信息检索系统组成 第3节 计算机信息检索的分类 第4节 计算机信息检索技术 第5节 信息检索的方法* 第6节 信息检索的策略*
2019/12/11
2
1.1 国内外计算机信息检索发展阶段
1975年,从国外引进数据库开展机检服务; 1980年,建立国际联机终端开展检索服务; 20世纪80年代中后期,自建数据库; 90年代初,发展光盘检索; 90年代中期,Internet网络化检索阶段。
顺排文档是数据库的主体,又称主文档,按每条记 录的顺序号大小排列,检索结果都来自于顺排文档。 倒排文档是从顺排档中抽取有检索意义的检索标识, 如主题词、著者姓名、化学物质名、刊名等,并 按索引词的字顺排列,同时在检索标识后注明入 藏顺序号,这就是常见的数据库中的主题词索引、 著者索引、刊名索引。
2019/12/11
2019/12/11
10
信息检索过程
用户对检索课题加以分析,明确检索范围,弄清主题 概念,然后用系统检索语言来表示主题概念,形成检 索标识及检索策略,输入到计算机进行检索。计算机 按照用户的要求将检索策略转换成一系列提问,在专 用程序的控制下进行逻辑运算,选出符合要求的信息 输出。

《信息检索与利用》课件2

《信息检索与利用》课件2
图书馆的藏书都是按分类号排架的。分类号的排列 采用由左至右逐位对比的方法进行排列,先比较字 母部分,再比较数字部分。
——字母部分按英文字母固有的次序排列。例:
B2中国哲学 B3世界哲学 E27各种武装力量 E512苏联军事 TM92电气化、电能应用 TU201建筑设计原理
——分类号中的阿拉伯数字依小数制排列。例:
存储 过程
一次 分析 信息 信息 特征 检 索 语 言 信息 需求
分析
标引 信息特征 输入
标识
检索 过程
检索 提问
标引 检索提问 检索
标识
信 息 检 索 系 统 ( 工 具 )
检 输出 索 结 果
July 13, 2013
北京交通大学出版社《信息检索教程》(Information Retrieval Textbook)系列课件
July 13, 2013
北京交通大学出版社《信息检索教程》(Information Retrieval Textbook)系列课件
2-9
3 检索语言
检索语言(retrieval language)是文献信息标引
和检索提问而约定的人工语言。
检索语言是为沟通文献标引与文献检索而编制的
人工语言,也是连接信息存储和检索两个过程中标 引人员与检索人员双方思路的渠道。 ——在存储的过程中用于标引信息称为标引语言; ——用于编制索引就称为索引语言; ——用于信息检索则称为检索语言。
language)是对事物的某一方面特征用某 种代码系统来加以标引和排列的检索语言。例如,根据化合物 的分子式这种代码语言,可以构成分子式索引系统,允许用户 从分子式出发,检索相应的化合物及其相关的文献信息。
自然语言是直接从原始信息中抽取出来的未经规范化处理,

《信息检索与利用》课件

《信息检索与利用》课件
图书馆资源评价
图书馆资源的评价可以从馆藏量、学科覆盖范围、更新速度等方面进行 评估。同时,也可以参考图书馆的服务质量、借阅方便程度等因素。
特种文献检索
01
特种文献检索
是指针对特定领域或特定需求的文献进行检索的方法。特 种文献包括专利文献、标准文献、政府出版物等。
02 03
特种文献检索技巧
在特种文献检索时,需要了解不同类型特种文献的特点和 收录范围。同时,可以利用特种文献的官方网站或专门的 检索工具进行检索。在检索过程中,可以利用关键词、分 类号等来提高检索的准确性和效率。
信息检索
通过各种检索工具和途径 ,快速准确地获取所需信 息。
信息筛选
根据信息的相关性、准确 性和权威性进行筛选,剔 除无关和低质量的信息。
信息整理
对筛选后的信息进行分类 、标注和整理,便于后续 使用和查找。
信息分析与应用
信息评估
对信息的质量、价值和适用性进行评估,为实际应用提供依据。
信息整合
将不同来源的信息进行整合,形成完整、系统的信息体系。
信息应用
将信息应用于实际工作、学习和研究中,提高效率和成果质量。
知识产权保护
知识产权意识
了解和遵守知识产权法律法规,尊重他人的知识产权。
合理使用
在合理范围内使用他人的知识产权,不侵犯他人的合法权益。
保密与安全
对涉及机密和敏感的信息进行保密,确保信息安全不泄露。
05 信息素养与终身学习
信息素养概念
网络信息评价
网络信息的评价可以从权威性、 准确性、时效性等方面进行评估 。同时,也可以参考不同来源和 平台的信息特点和可信度。
03 信息检索策略与技巧
信息需求分析
明确信息需求
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

AB
A
B
A
B
逻辑或 A+B
逻辑与 A*B
逻辑非 A-B
18
2.2.1 布尔逻辑
运用“布尔算符”的注意事项:
• 布尔逻辑运算符运算顺序为: not→and→or • 运算符遵循数学运算法则;
(a) 括号优先;(A or B) and C not D (b) 在检索式中只有and或or前后的检索标识可
• 逻辑“非”算符,是具有概念包含关系的一种组 配,可以从原检索范围中排除某一内容。
• 表达形式:A not B、A-B • 具有缩小命中范围,提高查准率,增强检索的
专指性,减少输出量的作用。
• 例:Energy not nuclear
A
B
17
布尔逻辑检索技术
• 逻辑或(OR): 扩大检索范围,有利于提高查全率。 • 逻辑与(AND):缩小检索范围,有利于提高查准率。 • 逻辑非(NOT):缩小检索范围,有利于提高查准率。
• 单元词:指从信息内容中抽出的最基本的词汇。 • 关键词语言:关键词是从文题、文摘或正文中
抽出,具有实质意义,能够代表文献内容主题 的名词术语。关键词可直接用于文献标引。
6
叙词语言
• 叙词:指从信息的内容中抽出的、能概括表达 信息内容基本概念的名词或术语,它是经规范化处 理的自然语言词汇。
• 叙词受叙词表控制,有组配功能。 运输飞机设计
• 截词符具有“OR ”运算符的功能,能够扩大检 索范围,而且减少了输入检索词的时间,节约 了机时。
22
截词的分类
• 按位置分类: 前截词 中间截词 后截词
• 按取代数量分: 有限截词 无限截词
23
15
逻辑或
• 逻辑“或”算符,用来表示概念的并列、平行、 等同关系
• 代表符号:“or”、“+”
AB
• 表达形式:A OR B 或 A + B
• 具有扩大检索范围,减少漏检的功能。
• 例:AIRPLANE OR AIRCRAFT (Google) 或 AIRPLANE+AIRCRAFT
16
逻辑非
信息检索与利用
信息检索技术基础
1
主要内容
2.1 信息检索语言 2.2 信息检索技术 2.3 检索效果评价 2.4 检索词的确定 2.5 信息检索策略及策略式 2.6 信息检索步骤 2.7 科技查新
2
2.1 信息检索语言
• 检索语言:在信息的存储和检索过程中, 为使信息在用户和系统间有效传递,各 种检索工具使用专门的语言体系来描述 信息的内部特征和外部特征,同时要求 用户依此构造检索提问式来进行信息检 索,这种专门的语言体系成为检索语言。
运输 飞机 设计
• 通常使用的叙词表有:
运输飞机
飞机设计
国内《汉语主题词表》,
英国《科学文摘》使用的《INSPEC Thesaurus》,
美国《工程索引》使用的《Ei Thesaurus》等。
7
EI(Thesaurus)
8
2.1 信息检索语言
作用 • 检索词用来组织信息(信息工作者)
• 对文献信息内容进行标引; • 对内容相同或相关的信息加以集中或揭示其相关性; • 对信息进行系统化、有序化;
• 检索词用于检索(检索用户)
• 进行主题检索 • 进行分类检索 • 进行外表特征检索
• 检索词是信息资源组织与检索者检索提问的桥 梁,在数据库中,对应为检索点、检索入口
9
特征1 特征2 特征3 特征4 特征5
对文献信息内容进行标引
特征n
数据库中文献的记录方式
字段名
11
2.2 信息检索技术
2.2.1 布尔逻辑 2.2.2 截词检索 2.2.3 限制检索 2.2.4 位置逻辑 2.2.5 检索策略式
5
2.1 信息检索语言
• 标题词语言:是表征文献内容特征的、经过规 范化处理的名词术语(包括词和短语)。
例如:飞机:plane、airplane、aeroplane aircraft 用aircraft来表示所有“飞机”概念,以此作为规范词.使 用aircraft一词的检索结果将包括全部有飞机概念的文 献.
14
逻辑“与”
• 在计算机信息检索时,“与”用于表示概念的交 叉、限定关系
• 逻辑符号:and、﹡、还可用空格表示 A
B
• 表达形式:A and B、 A * B 、或 A B
• 具有缩小检索范围和提高专指性的功能。
• 例: computer and control (SCI) computer*control (Dialog) computer control (Google)
3
2.1 信息检索语言
检索 语言
描述文献 内容特征
分类语言
主题语言
关键词语言 单元词语言 标题词语言 叙词语言
描述文献 外表特征
题名(书名、刊名、篇名) 著者 出版事项
代码/序号
4
2.1 信息检索语言
• 主题语言(内容特征) • 按照主题性质的不同可分为:
• 标题词 • 单元词 • 叙词 • 关键词
20
写出下图的布尔逻辑检索式
2.2.2 截词检索
• 截词(truncation):是指检索者将检索词在认为比 较合适的地方截断,也称模糊检索,又称词干 检索法
• 截词检索,用截断的词的一个局部进行的检索 即利用检索词的词干加上截词符号去数据库中 进行检索。(模糊检索)
• 截词符号:一般为“?”或 “*” 。各种检索系统 有不同规定,没有统一标准。
以交换; (c) 检索式中有not时前后检索词不能交换。
Байду номын сангаас
备注: ( )必须在半角和英文状态下输入
19
布尔逻辑检索表达式的特点
• 布尔检索表达式式目前信息检索系统中 使用最多的一种方法。
• 优点:表现直观清晰,方便扩检和缩检。 易于计算机实现。
• 缺点:没有反映文献内容(或信息需求) 所涉及的多个概念的相对重要性。没有 反应概念之间的内在语义关系。
12
2.2.1 布尔逻辑检索
在进行信息检索时,检索项之间概念有 相交关系、同义关系或相关关系,这时 采用布尔逻辑进行检索项之间的逻辑组 配。
用“与”(AND)、“或”(OR)、“非” (NOT)来表达。
13
2.2.1 布尔逻辑
• 布尔逻辑检索:在进行信息检索时,检索项
之间概念有相交关系、同义关系或相关关系, 这时采用布尔逻辑进行检索项之间的逻辑组配。 • 布尔逻辑算符有三种: 逻辑与、逻辑或、逻辑非 用“与”(AND)、“或”(OR)、“非” (NOT)来表达。
相关文档
最新文档