【学习课件】第六章计算机信息检索概述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 数值型数据库 • 文本—数值型数据库 • 术语数据库 • 图像数据库 • 全文数据库 • 超文本数据库
ppt课件
13
数值型数据库
• 是指专门提供以数值方式表示的调查数据 和统计数据的一类数据库。
ppt课件
14
文本-数值型数据库
• 是指能够同时提供文本信息和数值数据的 一类数据库。
ppt课件
15
ppt课件
10
数据库的类型
• 参考数据库 • 源数据库 • 混合数据库
ppt课件
11
参考数据库
指用户从中获取信息线索后,还需进一步查找 原文或其他资料的一类数据库。它包括书目数据库 和指南数据库。
(1)书目数据库。它是存储某个学科领域的二次 文献的数据库,有时又称作为二次文献库。它依照 二次文献的不同类型又可分为题录文摘数据库、索 引数据库和图书馆书目数据库。
pLeabharlann Baidut课件
27
终端系统
终端系统是人与系统的接口设备。它能 将字符、声音以及人类的信息表现形式转换 成系统的机器代码。反之,将系统的结果还 原成字符、声音等形式,传送给终端用户。
ppt课件
24
联机检索系统由三个部分组成: • 主机系统 • 通讯系统 • 终端设备
ppt课件
25
主机系统
主机系统是联机检索系统的核心,它具备处 理速度快、多道程序和分时功能,内存容量 大,多样化的输入输出设备。
ppt课件
26
通讯系统
通讯系统是指终端设备与主机系统进行 通信的设备。通信线路分为两种:专用的直 达线路;通过拨号选择对方的交换线路。前 者是特定通信线路,后者使用电话网和用户 电报网,联机系统使用的通信线路就属于后 一种。
计算机信息检索概述
1 计算机信息检索理论基础 2 计算机信息检索的发展历史 3 计算机检索技术与实现 4 计算机检索策略与实施技巧
ppt课件
1
1 计算机信息检索理论基础
使用计算机检索信息,是专业人员在开 展科学研究中不可或缺的一项基本技能。一 个具有这方面能力并善于从电子信息源中获 取所需信息者,将在今后的信息社会中获取 更多的成功机会 。
(2)指南数据库。它是存储有关某些机构、人物、 出版物、项目、程序、活动等简要描述性信息的一 类数据库,亦称指示性数据库。例如,机构名称数 据库、人物传记数据库、产品数据库等都属于这一 类数据库。
ppt课件
12
源数据库
又称为数据银行。它是能够直接为用户提 供原始资料或具体数据的一类数据库。 源数 据库又分为:
ppt课件
4
计算机检索系统的构成
• 硬件 • 软件 • 数据库
ppt课件
5
硬件
• 系统中采用的各种硬件设备的总称,包括 具有一定性能的计算机主机、外围设备以 及怀数据处理或数据传输有关的其他设备。 主机,是计算机检索系统的中枢。外围设 备包括外部存储器,输入输出设备如键盘、 光笔、鼠标、光学字符识别装置,显示终 端、打印机等。
ppt课件
22
联机情报检索
• 20世纪70年代投入商业运营。用户在计算 机检索系统的终端上,通过通信网络,使 用特定的指令和算符,以人机对话方式, 查询远程计算机检索系统核心的数据库, 从中获取所需信息的计算机检索系统。
ppt课件
23
• 联机系统的诞生,使许多相互独立的终端 实现了“对话”方式的信息检索。所谓对 话方式,就是用户利用系统提供的、为数 不多且简单易记的检索命令,每次输入一 条命令或由命令组成的表达式查看结果。 系统方面则每次显示出可能的信息,帮助 用户选择下次该用的命令或表达式,用户 通过与系统双向对话,可不断改变或完善 检索策略,直至获得满意的检索结果为止。
ppt课件
2
1 计算机信息检索理论基础
• 计算机信息检索的定义 • 计算机检索系统的构成 • 数据库的概念
ppt课件
3
计算机信息检索的定义
• 所谓计算机信息检索,就是在计算机和人 的共同作用下,按照一定的方法组织和存 储信息,并通过人机对话从计算机存储的 大量数据中自动输出用户所需的那部分信 息的过程。
ppt课件
19
混合数据库
这类数据库兼有源数据库和参考数据库的特点, 按载体形式它又可分为以下四种类型:
• 磁媒体数据库
• 光盘数据库
• 多媒体数据库:是一种能够对文字、数值、声音 和图像等不同性质的媒体进行一体化处理和管理的 新型数据库
• 超媒体数据库。通过外部树形的链接将多种类型 的媒体连成一个集合,该集合称为超媒体数据库。
ppt课件
6
软件
• 系统中有关的程序和各种文件资料的总称, 包括系统软件(如操作系统,输入输出控 制程序)和应用软件。
ppt课件
7
数据库
• “一组文件的集合”,就是以一定的组织方 式存贮在一起的相关数据的集合。
ppt课件
8
数据库的概念
• 数据库的定义 • 数据库的类型
ppt课件
9
数据库的定义
ppt课件
20
2 计算机信息检索的发展历史
• 脱机批处理检索 • 联机情报检索 • 国际联机检索 • 光盘检索 • 网络信息检索
ppt课件
21
脱机批处理检索
• 1954一64。定期由专职检索人员把许多用 户课题汇总,批量处理提问要求,并把结 果提供给用户。直接在计算机旁检索,不 需要远程终端设备及通信网络。用户在计 算机处理成批检索课题之后才知道检索结 果,不能直接、及时修改检索策略,查全 率和查准率受到一定限制。
• 数据库是至少由一种文档组成,并能满足 某一特定目的或某一特定数据处理系统需 要的一种数据集合。通俗地说,数据库是 在计算机存储设备上按一定方式存储,并 提供给确定范围内的各类用户共享的相互 关联的数据集合。数据库是计算机技术与 信息检索技术相结合的产物。它既是现代 人们从事信息资源管理的工具,同时也是 计算机信息检索的基础。
术语数据库
• 是指专门存储和检索名词术语、词语信息 等的一种源数据库。
ppt课件
16
图像数据库
• 是指用来存储和检索各种图像或图形信息 及有关文字说明资料的一种源数据库。
ppt课件
17
全文数据库
• 是指存储和检索文献全文或其中主要部分 的一种源数据库。
ppt课件
18
超文本数据库
• 这种数据库存储时将存储内容分割为若干 独立利用的结点,使用链路连接结点等方 式进行存取,从而构成一个不拘泥于形式 逻辑推理,不遵循某种正规模式的一种网 络框架结构,因而具备了类似于数据库又 优于一般数据库的特点。
ppt课件
13
数值型数据库
• 是指专门提供以数值方式表示的调查数据 和统计数据的一类数据库。
ppt课件
14
文本-数值型数据库
• 是指能够同时提供文本信息和数值数据的 一类数据库。
ppt课件
15
ppt课件
10
数据库的类型
• 参考数据库 • 源数据库 • 混合数据库
ppt课件
11
参考数据库
指用户从中获取信息线索后,还需进一步查找 原文或其他资料的一类数据库。它包括书目数据库 和指南数据库。
(1)书目数据库。它是存储某个学科领域的二次 文献的数据库,有时又称作为二次文献库。它依照 二次文献的不同类型又可分为题录文摘数据库、索 引数据库和图书馆书目数据库。
pLeabharlann Baidut课件
27
终端系统
终端系统是人与系统的接口设备。它能 将字符、声音以及人类的信息表现形式转换 成系统的机器代码。反之,将系统的结果还 原成字符、声音等形式,传送给终端用户。
ppt课件
24
联机检索系统由三个部分组成: • 主机系统 • 通讯系统 • 终端设备
ppt课件
25
主机系统
主机系统是联机检索系统的核心,它具备处 理速度快、多道程序和分时功能,内存容量 大,多样化的输入输出设备。
ppt课件
26
通讯系统
通讯系统是指终端设备与主机系统进行 通信的设备。通信线路分为两种:专用的直 达线路;通过拨号选择对方的交换线路。前 者是特定通信线路,后者使用电话网和用户 电报网,联机系统使用的通信线路就属于后 一种。
计算机信息检索概述
1 计算机信息检索理论基础 2 计算机信息检索的发展历史 3 计算机检索技术与实现 4 计算机检索策略与实施技巧
ppt课件
1
1 计算机信息检索理论基础
使用计算机检索信息,是专业人员在开 展科学研究中不可或缺的一项基本技能。一 个具有这方面能力并善于从电子信息源中获 取所需信息者,将在今后的信息社会中获取 更多的成功机会 。
(2)指南数据库。它是存储有关某些机构、人物、 出版物、项目、程序、活动等简要描述性信息的一 类数据库,亦称指示性数据库。例如,机构名称数 据库、人物传记数据库、产品数据库等都属于这一 类数据库。
ppt课件
12
源数据库
又称为数据银行。它是能够直接为用户提 供原始资料或具体数据的一类数据库。 源数 据库又分为:
ppt课件
4
计算机检索系统的构成
• 硬件 • 软件 • 数据库
ppt课件
5
硬件
• 系统中采用的各种硬件设备的总称,包括 具有一定性能的计算机主机、外围设备以 及怀数据处理或数据传输有关的其他设备。 主机,是计算机检索系统的中枢。外围设 备包括外部存储器,输入输出设备如键盘、 光笔、鼠标、光学字符识别装置,显示终 端、打印机等。
ppt课件
22
联机情报检索
• 20世纪70年代投入商业运营。用户在计算 机检索系统的终端上,通过通信网络,使 用特定的指令和算符,以人机对话方式, 查询远程计算机检索系统核心的数据库, 从中获取所需信息的计算机检索系统。
ppt课件
23
• 联机系统的诞生,使许多相互独立的终端 实现了“对话”方式的信息检索。所谓对 话方式,就是用户利用系统提供的、为数 不多且简单易记的检索命令,每次输入一 条命令或由命令组成的表达式查看结果。 系统方面则每次显示出可能的信息,帮助 用户选择下次该用的命令或表达式,用户 通过与系统双向对话,可不断改变或完善 检索策略,直至获得满意的检索结果为止。
ppt课件
2
1 计算机信息检索理论基础
• 计算机信息检索的定义 • 计算机检索系统的构成 • 数据库的概念
ppt课件
3
计算机信息检索的定义
• 所谓计算机信息检索,就是在计算机和人 的共同作用下,按照一定的方法组织和存 储信息,并通过人机对话从计算机存储的 大量数据中自动输出用户所需的那部分信 息的过程。
ppt课件
19
混合数据库
这类数据库兼有源数据库和参考数据库的特点, 按载体形式它又可分为以下四种类型:
• 磁媒体数据库
• 光盘数据库
• 多媒体数据库:是一种能够对文字、数值、声音 和图像等不同性质的媒体进行一体化处理和管理的 新型数据库
• 超媒体数据库。通过外部树形的链接将多种类型 的媒体连成一个集合,该集合称为超媒体数据库。
ppt课件
6
软件
• 系统中有关的程序和各种文件资料的总称, 包括系统软件(如操作系统,输入输出控 制程序)和应用软件。
ppt课件
7
数据库
• “一组文件的集合”,就是以一定的组织方 式存贮在一起的相关数据的集合。
ppt课件
8
数据库的概念
• 数据库的定义 • 数据库的类型
ppt课件
9
数据库的定义
ppt课件
20
2 计算机信息检索的发展历史
• 脱机批处理检索 • 联机情报检索 • 国际联机检索 • 光盘检索 • 网络信息检索
ppt课件
21
脱机批处理检索
• 1954一64。定期由专职检索人员把许多用 户课题汇总,批量处理提问要求,并把结 果提供给用户。直接在计算机旁检索,不 需要远程终端设备及通信网络。用户在计 算机处理成批检索课题之后才知道检索结 果,不能直接、及时修改检索策略,查全 率和查准率受到一定限制。
• 数据库是至少由一种文档组成,并能满足 某一特定目的或某一特定数据处理系统需 要的一种数据集合。通俗地说,数据库是 在计算机存储设备上按一定方式存储,并 提供给确定范围内的各类用户共享的相互 关联的数据集合。数据库是计算机技术与 信息检索技术相结合的产物。它既是现代 人们从事信息资源管理的工具,同时也是 计算机信息检索的基础。
术语数据库
• 是指专门存储和检索名词术语、词语信息 等的一种源数据库。
ppt课件
16
图像数据库
• 是指用来存储和检索各种图像或图形信息 及有关文字说明资料的一种源数据库。
ppt课件
17
全文数据库
• 是指存储和检索文献全文或其中主要部分 的一种源数据库。
ppt课件
18
超文本数据库
• 这种数据库存储时将存储内容分割为若干 独立利用的结点,使用链路连接结点等方 式进行存取,从而构成一个不拘泥于形式 逻辑推理,不遵循某种正规模式的一种网 络框架结构,因而具备了类似于数据库又 优于一般数据库的特点。