第二讲计算机检索
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二讲
计算机检索原理 世界三大检索系统 网络信息检索基础知识 数字资源
一、计算机检索原理
1.计算机检索概念
计算机检索:利用电子计算机、高速传输以及高密度存 储技术进行信息检索(存贮或查询)的过程。
人们在计算机检索网络或终端上,使用特定的检索指令、 检索提问,从计算机检索系统的数据库中检索出所需 要的信息,然后再由终端设备显示、下载或打印。
(3)检索终端 检索终端是用户与检索系统传递信息进行“人—机
对话”的装置,有电传终端、数传终端和微机终端 等。 常用的微机终端,由计算机、打印机以及调制解调 器组成。 调制解调器的作用是把终端的信息在传输前加载到 一个载波信号上(调制),接受时通过检测收到的信 息偏离精确载波信号的程度,分离出原先发送的信 号(称之为解调),以解决信息传输过程中的衰减 问题。
优点:
(1)检索快捷:处理速度快、运算准确、可靠性高。
(2)多元灵活:采用了逻辑运算和限制检索等功能,使 检索词之间能够灵活地进行组配。
(3)量大面广:可迅速浏览相关领域的所有数据库记录, 网络中每台个人计算机都可成为信息源。
(4)更新迅速:如美国OCLC网络的First Search检索系 统,新刊出版后3天内,即可出现。
事实数据库——指专门提供事物发展过程中产生的 事实数据。
全文数据库——存储文献全文或其中主要部分,简 称全文库。
术语数据库——专门存储名词术语信息、词语信息 以及术语工作和语言规范工作成果。
图像数据库——用来存储各种图像或图形信息及有 关文字说明资料。
3 .计算机检索的发展
(1)脱机检索(Off-Line Retrieval)
脱机检索又称批式检索:用户只需要把检索要求 送往检索中心,由专职计算机人员进行检索。往 往把一批检索提问集中起来,对提问不立即回答, 而是定期成批地在计算机上查找。由于种种缺陷, 已于20世纪60年代末、70年代初渐渐停止使用, 脱机检索系统逐步转化成联机检索系统。
1954年,美国海军武器实验站图书馆在一台电子 管计算机上建立了世界上第一个计算机检索系统。
服务器要具有较高的运算 速度和处理能力,并且具 有相当大的信息存储容量。
服务器决定了系统的检索 速度和存储容量。
(2)通信网络
通信网络是终端与服务 器之间的桥梁,其作用 是确保信息传递的畅通。
国际上大型联机检索系 统的主机与本地区数据 通信网络相联,在网络 上有端口,检索用户通 过网线和网络设备检索 数据库信息。
书目数据库——存储某个领域的二次文献(如文 摘、题录、目录等书目数据)。
指南数据库——存储关于某些机构、人物、出版 物、项目、程序、活动等对象的简要描述,指引 用户从其它有关信息源获取更详细的信息。
源数据库:能直接提供原始资料或具体数据 的数据库,用户不必再查阅其它信息源。
数值数据库——指专门提供以数值方式表示的数据 (或包括其统计处理表示法)的一种。
缺点:1.检索费用较高;2.受地区通讯线路质量的 影响较大;3.检索技术较为复杂,难以普及。
20世纪60年代对联机信息检索进行了研究开发试验; 70年代末进入了联机检索地区性应用阶段;90年代以后, 藉以高速信息网络以崭新面貌出现。
(3)光盘检索(CD-ROM SEARCHING)
微机、检索软件、光盘驱动器和光盘数据 库即构成光盘检索系统。
(5)资源共享:利用本地计算机可以查询、获取网上丰 富的信息资源,实现资源共享。
(6)方式多样:提供联机回溯检索、定题检索、联机订 购、直接获取全文等多种服务,可按要求输出。
2.信息检索系统
计算机信息检索系统构成: 服务器 通信网络 检索终端 系统软件 数字资源
(1)服务器
服务器是检索系统的核心 部分,在检索过程中需要 处理大量的指令和数据。
即联机计算机图书馆中心 2、 DIALOG联机检索系统
世界上最早的专业情报Βιβλιοθήκη Baidu索系统 3、 STN国际联机检索系统 世界著名的国际联机检索系统之一
优点是:①使用方便、简单,易于操作; ②不受机时的限制,可反复修改检索策略, 达到很高的检全率与检准率;③检索费用低 廉,没有通讯费用,一次订购,反复使用。
缺点是:①数据更新周期较慢,时差长, 文献的新颖性不够;②同一时间只能一人使 用,资源浪费较大。但是,现在的光盘网络 技术已经解决了这一问题。
(4)网络信息检索(NETWORK SEARCHING)
互联网的发展使人类社会信息的存储、传递、 交流和利用发生了革命性的变化,世界变小 了,实现了全球通讯和资源共享。互联网上 的信息资源呈现爆炸性增长,传统的相对独 立的联机检索系统纷纷变成了互联网上的一 个站点,计算机检索进入了网络信息检索阶 段。
二、世界三大检索系统
1、OCLC (Online Computer library Center)
( 2 )联机检索(Online Retrieval)
使用终端设备,运用一些规定的指令输入检索词和检 索策略,通过通讯网络与相关检索系统直接连接进行" 人机对话",同时通过运行检索软件从信息检索系统的 预先储存文献的数据库中查找所需信息的过程。
优点:1.克服了地理上的障碍;2.消除了时间上的 延迟现象;3.保证检索者获得最新、最及时的文献信 息;4.检索者可修改检索策略,达到一定的查全率和 查准率。
(4)软件
软件的作用是充分发挥硬件的功能,进行信息 的存储、处理检索以及整个系统的运行管理。
操作系统软件:Windows2000,WindowsNT等。 数据库管理系统软件:Oracle、Sybase等。 数据库检索软件和阅读软件:
ssreader(超星),vip(维普)
(5) 数据资源
数据库、电子书刊、网络资 源等。
数据库是一系列信息记录的 集合,是检索系统中的信息 源,它存储在计算机的磁带、 磁盘或光盘上,借助于数据 库的管理软件技术和检索系 统进行利用。
国际上通常将其划分为两大 类:参考数据库、源数据库。
参考数据库:指引用户到另一信息源以获 得原文或其它细节的一类数据库。包括:
计算机检索原理 世界三大检索系统 网络信息检索基础知识 数字资源
一、计算机检索原理
1.计算机检索概念
计算机检索:利用电子计算机、高速传输以及高密度存 储技术进行信息检索(存贮或查询)的过程。
人们在计算机检索网络或终端上,使用特定的检索指令、 检索提问,从计算机检索系统的数据库中检索出所需 要的信息,然后再由终端设备显示、下载或打印。
(3)检索终端 检索终端是用户与检索系统传递信息进行“人—机
对话”的装置,有电传终端、数传终端和微机终端 等。 常用的微机终端,由计算机、打印机以及调制解调 器组成。 调制解调器的作用是把终端的信息在传输前加载到 一个载波信号上(调制),接受时通过检测收到的信 息偏离精确载波信号的程度,分离出原先发送的信 号(称之为解调),以解决信息传输过程中的衰减 问题。
优点:
(1)检索快捷:处理速度快、运算准确、可靠性高。
(2)多元灵活:采用了逻辑运算和限制检索等功能,使 检索词之间能够灵活地进行组配。
(3)量大面广:可迅速浏览相关领域的所有数据库记录, 网络中每台个人计算机都可成为信息源。
(4)更新迅速:如美国OCLC网络的First Search检索系 统,新刊出版后3天内,即可出现。
事实数据库——指专门提供事物发展过程中产生的 事实数据。
全文数据库——存储文献全文或其中主要部分,简 称全文库。
术语数据库——专门存储名词术语信息、词语信息 以及术语工作和语言规范工作成果。
图像数据库——用来存储各种图像或图形信息及有 关文字说明资料。
3 .计算机检索的发展
(1)脱机检索(Off-Line Retrieval)
脱机检索又称批式检索:用户只需要把检索要求 送往检索中心,由专职计算机人员进行检索。往 往把一批检索提问集中起来,对提问不立即回答, 而是定期成批地在计算机上查找。由于种种缺陷, 已于20世纪60年代末、70年代初渐渐停止使用, 脱机检索系统逐步转化成联机检索系统。
1954年,美国海军武器实验站图书馆在一台电子 管计算机上建立了世界上第一个计算机检索系统。
服务器要具有较高的运算 速度和处理能力,并且具 有相当大的信息存储容量。
服务器决定了系统的检索 速度和存储容量。
(2)通信网络
通信网络是终端与服务 器之间的桥梁,其作用 是确保信息传递的畅通。
国际上大型联机检索系 统的主机与本地区数据 通信网络相联,在网络 上有端口,检索用户通 过网线和网络设备检索 数据库信息。
书目数据库——存储某个领域的二次文献(如文 摘、题录、目录等书目数据)。
指南数据库——存储关于某些机构、人物、出版 物、项目、程序、活动等对象的简要描述,指引 用户从其它有关信息源获取更详细的信息。
源数据库:能直接提供原始资料或具体数据 的数据库,用户不必再查阅其它信息源。
数值数据库——指专门提供以数值方式表示的数据 (或包括其统计处理表示法)的一种。
缺点:1.检索费用较高;2.受地区通讯线路质量的 影响较大;3.检索技术较为复杂,难以普及。
20世纪60年代对联机信息检索进行了研究开发试验; 70年代末进入了联机检索地区性应用阶段;90年代以后, 藉以高速信息网络以崭新面貌出现。
(3)光盘检索(CD-ROM SEARCHING)
微机、检索软件、光盘驱动器和光盘数据 库即构成光盘检索系统。
(5)资源共享:利用本地计算机可以查询、获取网上丰 富的信息资源,实现资源共享。
(6)方式多样:提供联机回溯检索、定题检索、联机订 购、直接获取全文等多种服务,可按要求输出。
2.信息检索系统
计算机信息检索系统构成: 服务器 通信网络 检索终端 系统软件 数字资源
(1)服务器
服务器是检索系统的核心 部分,在检索过程中需要 处理大量的指令和数据。
即联机计算机图书馆中心 2、 DIALOG联机检索系统
世界上最早的专业情报Βιβλιοθήκη Baidu索系统 3、 STN国际联机检索系统 世界著名的国际联机检索系统之一
优点是:①使用方便、简单,易于操作; ②不受机时的限制,可反复修改检索策略, 达到很高的检全率与检准率;③检索费用低 廉,没有通讯费用,一次订购,反复使用。
缺点是:①数据更新周期较慢,时差长, 文献的新颖性不够;②同一时间只能一人使 用,资源浪费较大。但是,现在的光盘网络 技术已经解决了这一问题。
(4)网络信息检索(NETWORK SEARCHING)
互联网的发展使人类社会信息的存储、传递、 交流和利用发生了革命性的变化,世界变小 了,实现了全球通讯和资源共享。互联网上 的信息资源呈现爆炸性增长,传统的相对独 立的联机检索系统纷纷变成了互联网上的一 个站点,计算机检索进入了网络信息检索阶 段。
二、世界三大检索系统
1、OCLC (Online Computer library Center)
( 2 )联机检索(Online Retrieval)
使用终端设备,运用一些规定的指令输入检索词和检 索策略,通过通讯网络与相关检索系统直接连接进行" 人机对话",同时通过运行检索软件从信息检索系统的 预先储存文献的数据库中查找所需信息的过程。
优点:1.克服了地理上的障碍;2.消除了时间上的 延迟现象;3.保证检索者获得最新、最及时的文献信 息;4.检索者可修改检索策略,达到一定的查全率和 查准率。
(4)软件
软件的作用是充分发挥硬件的功能,进行信息 的存储、处理检索以及整个系统的运行管理。
操作系统软件:Windows2000,WindowsNT等。 数据库管理系统软件:Oracle、Sybase等。 数据库检索软件和阅读软件:
ssreader(超星),vip(维普)
(5) 数据资源
数据库、电子书刊、网络资 源等。
数据库是一系列信息记录的 集合,是检索系统中的信息 源,它存储在计算机的磁带、 磁盘或光盘上,借助于数据 库的管理软件技术和检索系 统进行利用。
国际上通常将其划分为两大 类:参考数据库、源数据库。
参考数据库:指引用户到另一信息源以获 得原文或其它细节的一类数据库。包括: