第3章 信息检索基本理论

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

脱机检索 联机检索
计算机 磁带数据库
终端
计算机磁盘、磁带 数据库
通讯系统(卫星) 终端
光盘检索 网络检索
光盘数据库 (单驱、塔网、镜像)
通讯系统
网络计算机(联机、光盘 多媒体、超媒体) 数据库
用户 终端
终端 终端
我国计算机信息检索的发展过程(四个阶段):
引进开发国外磁带、开展定题服务(SDI):我国计算机检 索最初通过商业途径和交换方式从国外引进文献磁带,进行 定题检索和联机检索服务起步的。截至1992年,先后引进各 类文献磁带65种,自建数据库36个,纵容量达到1700万条。
第3章 信息检索基本理论
第一节 信息检索概述 第二节 信息检索语言 第三节 信息检索工具
第一节 信息检索概述
一、信息检索
信息检索:是指将信息
(主要指文献信息)按一定
的方式组织和存储起来,并
根据用户的需要找出相关信
息的过程。 信息检索
存源自文库 检索
存储:是对信息进行著录、 标引、整序,编制检索工 检具索和:建是立指检面索向系信统息的需过求程。 而进行高度选择性的查找 过程。
文献1:篇名(title): A Model of multimedia information retrieval 主题(subject): information retrieval, multimedia computer applications
文献2:篇名(title): The Information retrieval in chemistry WWW server 主题(subject): chemistry, educational materials
微型计算机和国际联机网信息存取的发展:微机以其方便 、便宜体积小等优势迅速应用于信息管理领域。微机+ 光盘被誉为存储器的革命;接着的Internet以其更快的 速度迅速发展,起来,其方便的检索大有取代传统信息 检索渠道的趋势。
四、信息检索的基本原理: 对信息集合与需求集合的匹配与选择
特征化 表示
信息集合
(3)文献检索:检索的结果是文献资料。查找相关文献的 内容、出处、收藏单位等。如系统地查找水压伺服控制阀原 理方面的相关文献(论文)
三、信息检索的发展
1.脱机检索(20世纪50年代) 2.联机检索(60年代末.70年代初) 3.光盘检索(80年代) 4.网络检索 (90年代)
◇ 19世纪前期,由于科学团体的涌现,集体研究效率的 提高,文献量逐渐增多,导致了一种社会分工的出现: 即对所有发表的文献,及时地进行收集、加工和整理, 并提供一定的手段,方便人们查找文献——信息检索 工作便由此开始了。 ◇ 19世纪末20世纪初,出现了覆盖各种专业领域的多 种检索工具,其中有一些后来成为世界闻名、享有很 高声誉的检索工具,如美国的《工程索引EI》和《化 学文摘CA》以及英国的《科学文摘SA》 。
文献3:篇名(title): ERIC resources 主题(subject): educational materials
开发国际联机检索终端:1980年我国建筑技术开发中心及9 部委在香港租用一台国际终端,和美国DIALOG和ORBIT联 机。83年中情所在邮电部支持下建设了第一台终端机经卫星 信道街道意大利分组交换中心。至92年,已有联机终端约130 个,分布于各个城市。
自建数据库:随着国外磁带的引进和定题服务的开展,许 多单位开始对引进的磁带进行开发建设工作,至90年代 中后期,我国各类文献数据库的生产已经趋于饱和,各 种事实型数据库和数值型数据库不断增加,图像数据库 开始受到重视。
文献1:A Model of multimedia information retrieval 文献2:The Information retrieval in chemistry WWW server 文献3:ERIC resources
在对信息存储的过程中,对这三篇文献内容分别进行了分析,并使用检索语言 对其进行标引,标引结果为:
人与人之间的通信活动:人类语言 (communication)
人与计算机对话:需要有计算机语言 人与检索系统对话:来实施检索
检索语言(retrieval language)。
一、检索语言的含义
检索语言:把文献的存储与检索联系起来, 把标引人员和检索人员沟通起来的约定人工 语言。
例如:有三篇文献篇名如下:
◇ 1951年,世界上出现了最早的计算机检索系统,还 主要是单机检索。
◇ 20世纪60年代起,开始出现了联机信息检索系统;
◇ 20世纪70年代,随着卫星技术和通信技术的发展, 联机信息检索突破了地域的限制,走向全球化,出现 了很多著名的联机检索系统,如Dialog、Orbit等, 开始向全世界提供商业化的联机信息检索服务。
特征化 表示
选择与匹配
需求集合
文献存储过程
检索原理图
文献
主题分析 主题概念
情报工 作人员
用检索语言对 主题进行描述
文献标识
检索工具(系统)
检索过程
检索需求
检索者
主题分析
主题概念
用检索语言对 主题进行描述
检索表达式
(提问标识)
是否匹配 是
否 输出结果为零
得到检索结果
第二节 信息检索语言
一、检索语言的含义 二、检索语言的类型
◇光盘是80年代发展起来的激光存储载体,继纸张感光 材料、磁性载体之后问世的又一种新型的信息存储介 质。能存储数据、文字、图形、图像、声音、动画等 各种信息。
◇ 20世纪90年代,网络检索、多媒体检索以惊人的速 度迅速崛起,1992年,因特网向全世界的社会公众开 放,并步入商业应用时代。
◇ 1994年,网上出现了第一个web搜索引擎,1998年, 仅仅四年之后,网上的搜索引擎数量已达400个之多。
二、信息检索的类型(根据不同的检索对象):
(1)数据检索:检索的结果是数据。如某种材料的电阻; 某变压器的参数;化学分子式、数据图表等(手册), 某地方 GDP增长情况(年鉴)
(2)事实检索:检索的结果是事实结论。查询某一事物 (事件)的性质、定义、原理以及发生的时间、地点过程等。 如某产品是哪个厂家生产,哪个牌子的最好;第一颗人造卫 星是什么时候升空的(年鉴)
相关文档
最新文档