第3章 信息存储与信息检索 信息管理原理与方法(第2版)教学课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

[学习目标]
(1)理解信息存储、信息检索的作用和原则;了解信息存储的 技术和存储体系;
(2)了解信息检索的过程、类型和系统;理解信息检索的效率; (3)掌握网络信息检索的特点和原理;掌握网络信息检索的方
法和技巧。
3.1 信息存储
2. 信息的磁存储
在现代信息存储技术中,磁存储是信息存储的主要手段。磁存储信息系 统,尤其是硬磁盘存储系统,是当今各类计算机系统的最主要存储设备。
原理是使用Robot(一种搜索程序,名字叫网络蜘蛛,类似的软件还有 Spider,Crawler,Wander 等)来遍历因特网,将WWW上分布的信息 下载到本地文档库,然后对文档内容进行分析并建立索引,对于用户提 出的查询提问,搜索引擎通过查找索引找出匹配的文档或链接,再返回 给用户。
3.2 信息检索
3.2 信息检索
3.2.4 信息检索的效率
信息检索效率是研究信息检索原理的核心,是评价一个检索系统性能优 劣的标准,它始终贯穿于信息存储和检索的全过程。主要有以下衡量指 标:
1. 查全率(R)= w 100 %
x
2. 查准率(P)= w 100%
m
w: 检索出的相关信息量
3. 漏检率(O)= 1 w x
的总称,分为系统软件和应用软件。 ➢ 系统软件是关于组织控制计算机硬件资源协调工作的操作
程序。 ➢ 应用软件通常包括自动标引软件、词表管理软件、各种匹
配程序及数据库管理程序等。 • 数据库管理程序是计算机信息存储体系最基本、最重 要的组成部分。
3.1 信息存储
3. 数据库 数据库是计算机信息存储体系的基础,也是用户进行计算机
3.2 信息检索
3.2.2 信息检索的过程
(1)信息标引和存储过程 信息标引和存储是对大量无序的信息资源进行标引处理,使之有
序化,并按科学的方法存储,形成检索工具或检索文档,即组织检索 系统的过程。 (2)信息的需求分析和检索过程
信息的需求分析和检索是分析用户的信息需求,利用已组织好的 检索系统,按照系统提供的方法与途径检索有关信息,即检索系统的 应用过程。
数据库与数据仓库的比较表
比较特征 设计目标 存储对象 数据处理类型 数据操作特点 冗余设计特点
数据库
数据仓库
面向事务设计,为捕获 面向主题设计 , 为分析数
数据而设计
据而设计
在线交易数据
历史数据
事务型数据
决策支持型数据
经常进行记录修改和删 记 录 的 修改和 删 除操 作很
除等操作
少,通常只需要定期的加
信息存储与检索的对象。 数据库的类型:
➢ 从数据的存储方式划分,可以分为层次数据库、网状数据 库和关系数据库。
➢ 从数据存储的介质划分,可以分为磁带数据库、磁盘数据 库和光盘数据库。
➢ 从数据类型划分,有文献数据库、数据型数据库、事实型 数据库、多媒体数据库和超媒体数据库。
3.1 信息存储
4. 数据仓库 数据仓库(DW)是一个面向主题的、集成的、相对稳定的、反映历史
信息的缩微存储是用缩微摄影机将文件资料缩小拍摄 在感光胶片上,经加工处理后作为信息载体保存起来。
缩微存储技术的特点: (1)缩微品的信息存储容量大,密度高; (2)存储介质占用空间小,可节省大量空间; (3)缩微品忠于原件,不易出差错; (4)保存时间长; (5)便于计算机检索。
主要成就: (1)计算机输出缩微胶片(COM) 技术 (2)计算机输入缩微胶片(CIM) 技术 (3)计算机辅助缩微品检索系统 (4)视频缩微系统
Discuss & Exchange 布置作业
进行选择、记录和存储,以便用户采用科学手段与技术获取 必要和充分信息资源的信息系统。 从整体上看,计算机信息存储系统包括硬件、软件和数据库。
1. 硬件设备 这是计算机信息存储体系用于处理数据的各种硬设备的总称。
包括:外部设备;中央处理机;主存储器;外部存储器等
3.1 信息存储
2. 软件设备 软件设备是计算机信息存储体系中各类程序和各种文件数据
载和刷新
尽量避免冗余
有意引入冗余
3.2 信息检索
3.2.1 信息检索的作用和原则
信息检索是指从以任何方式组成的信息集合中,查找特定用户在特定时 间和条件下所需信息的过程。
信息检索的作用: (1)有利于充分利用信息资源,避免重复劳动。 (2)有利于缩短获取信息的时间,提高工作效率。 (3)有利于决策者进行决策。
计算机检索系统,按使用的设备和采用的通讯手段,可分为: –联机检索系统 –光盘检索系统 –网络检索系统
3.2 信息检索
3.2.6 网络信息检索
1. 网络信息检索的特点 (1)网络信息检索的范围不断拓宽。 (2)信息检索手段更加容易。 (3) 信息检索的途径更加灵活。
2. 网络信息检索的原理 网络信息的检索主要是通过搜索引擎在Internet上查找信息,检索
磁存储的特点:
(1)长久保存、重复使用和重新记录;
源自文库
(2)多路存储;
(3)存储频带宽广。 几种主要磁存储介质:
IBM System Storage TS3100 磁带库
(1)计算机磁带
(2)硬盘
(3)软盘
(4)移动存储磁盘
软盘
移动硬盘(U盘、MP3) 台式机硬盘
3.1 信息存储
3. 信息的缩微存储
4. 误检率(N)= 1 w
m
x: 信息库中存储的相关信息量 m: 检出信息总量
3.2 信息检索
3.2.5 信息检索系统 信息检索系统是拥有一定的存储、检索技术装备,存储经过
加工的各类信息,并能为信息用户检索所需信息的服务系统。 检索系统的构成:
➢ 信息数据库 ➢ 存储、检索信息的装备 ➢ 存储、检索信息的方法 ➢ 系统工作人员 ➢ 信息用户
3.2 信息检索
信息检索与信息存储的关系:信息检索是通过信息存取系统(即检索工 具)来实现的。
信息存储

信息检索





息 主题
式 转换成

转换成 式
课题
资 源
分析
概 念 检索标识
语 言
概 系统标识 念
分析

索 信息
提 问
用户
信息集合
检索 系统
答 复
图3.3 信息存储与信息检索关系图
3.2 信息检索
3.2 信息检索
信息检索系统按使用的技术手段可分为: ➢ 手工检索系统
又称传统检索系统,是用人工查找信息的检索系统。其主要类型 有各种书本式或卡片式的目录、题录、文摘和各种参考工具书等。
➢ 计算机检索系统
又称现代化检索系统,是用计算机及其网络技术、远程通讯技术、 光盘技术等构成的存储和检索信息的检索系统。
信息检索的基本原则: (1)目的性。信息检索一定要以所要达到的目的为原则,不能盲目行事。 (2)时间性。信息检索要有一个时间概念。 (3)全面性。信息检索应尽量全面系统地提供用户所需要的一切信息。 (4)准确性。信息检索的结果应该尽可能做到准确无误。 (5)规范性。信息检索应该遵循信息检索规律,按检索规则办事。
变化的数据集合,用于支持管理决策,容量一般大于100GB。 数据仓库的特征:
(1) 面向主题 (2)集成的 (3)相对稳定 (4)反映历史变化 数据仓库系统体系结构(四个层次) : (1)数据源(基础和源泉) (2)数据的存储与管理(核心) (3)OLAP(在线分析技术)服务器(分析) (4)前端工具(应用开发)
(4)利用大型专业数据库搜索 (5)通过新闻组搜索
➢ 新闻组(英文名Usenet 或News Group),简单地说就是一个基于网络的计 算机组合,这些计算机被称为新闻服务器,不同的用户通过一些软件可连接 到新闻服务器上,阅读其他人的消息并可以参与讨论。
3.2 信息检索
4. 网络信息检索的技巧
(1)明确检索目的和要求,确定查询策略。 (2)选择合适的网络检索工具。 (3)选择合适的检索词。 (4)构造恰当的检索表达式。 (5)利用精练、二次检索功能,即利用某些检索工具提供的Refine键,
3. 网络信息检索的方法 (1)直接访问信息源
➢ 直接通过IP 地址、域名打开网站或网页。
(2)借助网络检索工具查找信息
➢ 网络检索工具是经专业人员对网络信息资源的采集、组织、评价、过滤、控 制、检索等手段的全面把握而开发出的可供浏览和检索的网站资源主题指南。
(3)利用搜索引擎进行信息检索
➢ 搜索引擎是能进行关键词、词组或自然语言检索的工具。用户提出检索要求, 搜索引擎代替用户在数据库中进行检索,并将检索结果提供给用户。
缩微胶片 缩微胶片扫描仪 缩微胶片阅读器
3.1 信息存储
4. 信息的光存储 光存储以激光为光源,以薄膜作为信息存储材料。 特点:
(1)数据存储密度高、容量大、盘片可更换、携带方便 (2)存储寿命长、功能多样化 (3)生产成本低廉、数据复制工艺简单、效率高。
3.1 信息存储
3.1.3 信息存储体系 计算机信息存储体系是利用计算机对一定范围内的信息集合
目前搜索引擎主要通过两种技术实现信息检索: (1)使用网站分类技术 ➢ 把网站进行树状归类,对每个网站都有简略的描述。 (2)使用全文检索技术 ➢ 全文处理的对象是文本,通过网页抓取程序对大量网 页数据建立由字(词)组成的倒排索引,以便用户用 关键词对文档进行查询,系统则返回含该关键词的网 页。
3.2 信息检索
第3章 信息存储与信息检索
3.1 信息存储 3.1.1 信息存储的作用和原则 3.1.2 信息存储技术 3.1.3 信息存储体系
3.2 信息检索 3.2.1 信息检索的作用和原则 3.2.2 信息检索的过程 3.2.3 信息检索的类型 3.2.4 信息检索的效率 3.2.5 信息检索系统 3.2.6 网络信息检索
在前一次检索结果的基础上进一步检索,使检索范围缩小,检索策 略更精细化,逐步提炼出更符合检索需求的检索结果。 (6)使用限定条件、限定词,即利用某些检索工具的检索界面上提供的 检索条件、范围选择、参数设定等功能键,通过对资源类型、时间、 语种、数量等的限定,使检索结果逼近用户需求。 (7)使用同义词或近义词检索。 (8)使用多个搜索引擎。 (9)高效率检索的技巧。
3.2.3 信息检索的类型
(1)书目信息检索 从存储有标题项、作者项、出版项或文摘项的检索系统中获取有关信 息线索。
(2)全文信息检索 从存储整篇论文、专利说明书或整本著作的检索系统中获取全文信息。
(3)数据信息检索 从存储有大量数据、图表的检索系统中获取数值性信息 。
(4)事实信息检索 从存储有大量事实信息和数据信息的检索系统中获取某一事项的具体 答案 。
相关文档
最新文档