《信息资源检索(第二版)》教学课件—第四章计算机信息检索技术
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4.1 计算机信息检索概述
计算机信息检索就是用户利用计算机设备和 通信网络,与计算机信息检索系统相连接, 运用系统特定的指令和检索方法,组织检索 策略,从储存了大量记录的数据库中检索出 所需信息的过程。
4.1.1 检索原理
计算机信息检索原理与手工检索的原理相同 ,都是将检索需求与检索对象进行匹配的过 程。
Hepatitis B virus
www.lib.whu.edu.cn
Hepatitis B virus OR HBV
3.逻辑非
去掉一个主题中某一部分的主题,用于缩小检索 范围,提高查准率; 用运算符号“NOT”或“-”连接两检索词
例1 查“玉米但不是甜玉米”方面的文献。 检索式=玉米-甜玉米
4.网络化检索阶段
20世纪90年代,随着卫星通信、公共数据 通信、光缆通信技术以及信息高速公路事业 在全世界的迅猛发展,计算机情报检索步入 全球大联网时期。
网上资源具有信息的时效性、内容的广泛性 、访问的快速性、搜索的网络性和资源的动 态性五大特点,那么要及时、准确、有效地 获取与自身需求相关的实用信息,对所有网 络用户都非常具有ቤተ መጻሕፍቲ ባይዱ战性。
www.lib.whu.edu.cn
2.逻辑或
表示概念的平行、并列,用于扩大检索范围 ,提高查全率
用运算符“OR” 或 “+”连接两检索词
A B A OR B
例:逻辑或(OR 或 + )
乙肝病毒的研究 检索词:
乙肝 乙型肝炎 HBV Hepatitis B virus 检索式:
乙肝 OR 乙型肝炎 OR HBV Hepatitis B virus OR HBV
用运算符号:AND 或 * 连接检索词
A
B
A AND B
例:逻辑与(AND或*)
计算机在图书馆的应用
计算机
图书馆
计算机 AND 图书馆
人类活动对群落多样性的影响 检索概念:
人类活动 群落多样性 影响 检索式
人类活动 AND 群落多样性 人类活动 AND 群落多样性 AND 影响
人类活动 AND 群落多样性 AND 影响
思考:购买商品的各索引系统
前提:买什么东西?哪个厂家生产?该产品叫什么?是否有
批准文号(法定)?使用该产品的市场反馈如何?产品的发明 人或生产者是谁? 该厂家的地理位置在哪里?是否含有特殊 的有效成分?
模型化的具体对应与索引:
买什么东西----------分类索引 该产品叫什么---主题索引或轮排索引 哪个厂家生产-----单位索引或团体索引 是该厂家的哪地方的分厂生产-----地理索引
4.1.3 检索特点
(1)速度快、效率高。 (2)检索途径多。 (3)灵活方便。 (4)更新快。 (5)直接输出检索结果。
4.2 计算机检索系统构成
计算机信息检索系统主要由计算机、通信网 络、检索终端以及数据库组成。
4.2.1 计算机 1.硬件 计算机是检索系统的核心部分,它统筹管理
然而,在手工检索时,各种匹配过程只在自 己的头脑当中,无须事先进行明确的表达, 人们在检索时可以进行人为的判断和修正, 即边检边选,对检出结果的内容也可以进行 思考和判断,必要时再进行二次或多次检索 。
在利用计算机检索系统进行检索时,计算机 对结果不具有任何判断力,仅仅是机械地执 行检索策略,其执行过程是指令的机械匹配 ,只要是符合条件的文献均作为命中文献予 以选出。
整个系统的运行,其容量、运算速度决定整 个检索系统的能力。计算机由硬件和软件组 成。
2.数据库的类型
数据库的类型归纳起来主要有以下几种: (1)书目型数据库 :是机读的目录、索
引和文摘检索工具,检索结果是文献的线索 而非原文。图书馆的书目数据库就是这种类 型。
(2)数值型数据库:提供以数值为主的情 报信息。如化学物质毒性数据库、机信息检 索中最基本的也是最常用的技术。
2.联机检索阶段
所谓人机对话就是用户在终端直接输入检索 提问,计算机在联机数据库检索并立即显示 检索结果,用户如对结果不满意,可随即修 改检索提问重新检索。
3.光盘检索阶段
1983年出现了一种新的内存,即CD—R OM光盘。光盘检索具有如下优点:存储量 大而体积微小、要求设备简单,可随地安装 、使用方便,易于操作、检索费用低(不需 要昂贵的联机检索通信费用)、可随时修改 检索策略,具有很高的查全率和查准率等。 因为这些优点,光盘检索至今仍被世界各地 广泛应用。
第4章 计算机信息检索技术
目录
4.1 计算机信息检索概述
4.1.1 检索原理 4.1.2 检索服务模式 4.1.3 检索特点
4.2 计算机检索系统构成
4.2.1 计算机 4.2.2 通信网络 4.2.3 检索终端 4.2.4 数据库
4.3 计算机信息检索技术
4.3.1 布尔逻辑检索技术 4.3.2 截词检索技术 4.3.3 限制检索技术 4.3.4 位置检索技术 4.3.5 加权检索技术
例2 查“国外有关数字图书馆方面”的文献 检索式=数字图书馆-国内
A B A NOT B
4.运算优先级
当在一个检索式中,同时出现不同的布尔逻 辑算符时,它的运算级别是不同的。布尔逻 辑算符的运算次序通常是:在有括号的情况 下,括号内的逻辑运算先执行;有多层括号 时,先执行最内层的括号。逻辑“与”、“ 或”、“非”的运算次序是:先执行逻辑“ 非”操作,再执行逻辑“与”,最后执行逻 辑“或”。
布尔逻辑检索
运用布尔逻辑算符(Boolean operators)对检索 词进行逻辑组配,表达两个概念之间的逻辑关系 。
布尔逻辑算符主要有: AND OR NOT 在中文数据库里,布尔逻辑运算符有时用AND、
OR、NOT表示,有时用 “*”、 “+”及“- ”。
1.逻辑与(逻辑乘)
表示概念的相交、限定,缩小检索范围,提高检 准率。
同时,与手工检索相比,计算机检索时人们 无法直接看到数据库中的内容,因而利用计 算机系统进行检索时,对需求的表达就成了 重要的环节。
4.1.2 检索服务模式
计算机信息检索发展至今已有几十年的历史 ,其检索服务模式也主要经历了以下几个阶 段。
1.脱机检索阶段
这一阶段的计算机检索是以批处理方式进行的脱机检索 ,即检索只能在检索系统所在地进行,由检索人员定期 将用户课题汇总,批量输入计算机,用户不能参与检索 过程,不能实时浏览检索结果,修改检索方案,即不能 人机对话。