第10章 多媒体数据库技术

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

表10-1 1NF关系模型中嵌套
属性1 属性2 … General General
许多关系型数据库都利用标准的数据区 域进行扩展,如FoxPro的General字段, Windows的标准动态注释、格式注释、图 形等,去增加多媒体数据的表示。 虽然NF2方法可以利用关系数据库传统优 势(数据类型的数据表示和操作),可 以延用关系数据库语言或其他通用语言。 但无法增强建模能力,不能较好地反映 多媒体数据所特有的时空关系,同时多 媒体对象的存取、检索或其它处理上仍 存在相当大的困难。
7、动画和影像 动画和影像类似与图像,区别与图像的是它的 表现必须时间属性的变化密切配合。动画和影 像数据可以分解成文字、解说、配音、场景、 剪辑以及时间关系等多种元素,在空间和时间 上的管理比其它数据要复杂得多,无论是对各 元素的检索还是对组合元素的检索,都存在着 相当的难度。但若作为一个整体,可以如声波 那样附加以特定的数数据,实现非动画和影像 本身属性方面的检索。
10.2.2
关系型数据模型
在传统的关系数据库(RDB)中,满足基 本关系的形式被称为第一范式(1NF), 这种管理系统本身固有的局限性表现在 数据模型上、性能上和扩展伸缩性三个 方面。 随着多媒体数据媒体数据形式的增加, 要继续使用关系型数据模型,必须扩展 这种模式。关系型数据库的扩展主要包 括类型的增加和层次的增加。
集中统一型结构
该结构如图10-2所示,其中包含一个多媒体数 据库和一个多媒体数据库管理系统。各种媒体 被统一地建于数据库中,由一个数据库管理系 统统一管理和提供访问。目的是要满足用户对 多特征事物的数据存储和管理,以便达到统一 综合应用的效果。但关键的技术基础是需要建 立合适且便于存储、检索和管理的数据类型。 目前,面向对象的数据类型就是建立复杂多媒 体数据类型的一种方法。更有效的多媒体数据 类型的模式有待于进一步的研究。
实际应用时,用户可以对其中任何一个 媒体数据库单独进行访问和管理。对于 多数据库的访问是分别进行的,可以通 过相互通信来进行协调和执行相应的操 作。这种多数据库的联合访问需要开发 用户应用程序去实现。为了提高使用效 率,目前多数据库的整合技术已有所发 展,对于传统型数据库的整合技术已经 达到的由于阶段,而对于复杂的多媒体 多数据库的整合技术还需要一个研究过 程。
10.1.2
多媒体数据库的体系结构
多媒体数据库的组织结构
多媒体数据库的组织结构尚未建立统一的 体系结构,大致有以下几种组织结构。
组合型结构
这种结构是通过整合技术连接的。组合 型结构中可以拥有多个独立的媒体数据 库,如文本数据库、音频数据库和图像 数据库,每一种媒体数据库的设计不需 要考虑和其它数据库的匹配,并且都有 自己独立的数据库管理系统,如图10-1 所示。
4、分布式数据模型。允许用户开发的应用程序 把多个物理分开的、通过网络互联的数据库当 作一个完整的数据库看待。并行数据库通过 cluster 技术把一个大的事务分散到cluster中 的多个节点去执行,提高了数据库的吞吐和容 错性。多媒体数据库提供了一系列用来存储图 像、音频和视频对象类型,更好地对多媒体数 据进行存储、管理、查询。模糊数据库是存储、 组织、管理和操纵模糊数据库的数据库,可以 用于模糊知识处理。 5、多维数据模型。复杂事物往往存在多维特征, 即突破了三维的数据关系。事实上,多维分析 是分析企业数据最有效的方法,多维数据模型 可以通过超立方体、多立方体等方法建立。
3、指示性数据
指示性数据通常以多媒体元素的参数为内 容,即为多媒体元素的特征赋予特定的语 义。例如表示图像大小的高和宽、表示线 条的粗或细、表示声音的强或弱等。 多媒体数据库是一种数据容器,是因某种 应用的需要而建立的,目的是组织有特定 联系的数据,以便对这些数据进行管理、 运用和共享。多媒体数据库所组织的数据 可以包括数值、字符串、文本、图形、图 像、声音、和视像等。
图10-2 集中统一型数据库结构
客户/服务型结构 (网络服务器)
如图10-3所示,客户/服务型结构有多 媒体数据库、各媒体服务器、多媒体管 理服务器、用户接口程序和用户应用程 序组成。
其中各种媒体数据库相对独立,并通过专 用服务器和一个多媒体管理服务器相连。 多媒体管理服务器综合各专用服务器的操 纵,通过特定的中间件系统连接用户的接 口程序,最终达到与客户之间的信息交换。 这种结构比较适用于网络环境中,用户可 以单独选择或组合选择多媒体服务器的服 务。但作为开放互联网中的一种有效的应 用,必须基于一定的标准,包括多媒体数 据类型的模型、数据库模型、标准用户接 口等。
根据数据模型的发展,可以有五种方式: 层次、网状数据模型、关系数据模型、 面向对象的数据模型、分布式数据模型 和多维数据模型。
1、层次数据的数据模型是有根的定向有序树, 网状模型对应的是有向图。它们的共同点:支 持三级模式(外模式、模式、内模式)、保证 数据库系统具有数据与程序的物理独立性和一 定的逻辑独立性、用存取路径来表示数据之间 的联系、有独立的数据定义语言、导航式的数 据操纵语言。
2、引入嵌套表
这种拓展方法是在记录和表之间建立层次关系。 在1NF关系模型中,必须遵守的原则是要求每 一个属性均为原子数据类型,因此同一个属性 可能不得不存在于若干个关系中。为了改变这 种冗余的关系模式,NF2模型(Non First Normal Form),即非第一范式中引入了嵌套 表的概念,不再遵守“表中不能再有表”的规 定。这样就能使层次结构在关系数据库中得到 应用,如表10-1,同时在关系数据库中引入抽 象数据类型,使得用户能够定义和表示多媒体 信息对象。从而来提高关系数据库处理多媒体 数据的能力。
超媒体型结构
如图10-4所示,各种媒体数据库分散存 储于与网络有连接的存储空间,互联网 提供了一个信号传递的通道。该体系结 构强调对数据时空索引的组织,通过建 立适当的访问工具,就可以随意访问和 使用这些数据。
图10-4 超媒体型数据库结构
多媒体数据库的层次结构
已经有许多人提出过多媒体数据库层次划分, 包括对传统数据库的扩展、对面向对象数据库 的扩展、超媒体层次扩展等。虽然各有所不同, 但大都是从最低层增加对多媒体数据的控制与 支持,在最高层支持多媒体的综合表现和用户 的查询描述,在中间增加对多媒体数据的关联 和超链的处理。在这里我们综合各种多媒体数 据的层次结构的合理成分,我们提出一种多媒 体数据库层次结构的划分:
2、关系数据模型。其特点是:实体和实体之 间的联系用关系来表示、以关系数学为基础、 数据的物理存储和存取路径对用户不透明、非 过程化的应用。 3、面向对象的数据模型。其主要特征是:支 持数据管理、对象管理和知识管理,保持和继 承了关系数据库系统的技术,对其它系统开放, 支持数据库语言标准,支持标准网络协议,有 良好的可移植性、可连接性、可扩展性和互操 作性等。
5、图像
图像数据以空间离散的点为基础,如果 对这种原始数据进行存取的话,将不利 于将来对数据的检索,所以通常都通过 一定的格式加以组合。数据库中常用尺 寸、颜色、纹理、分割等对抽象的语义 来描述图像的属性。在特定范围内,图 像数据库在存取和检索方面也已经有成 功的应用,例如,指纹库、人像库、形 体库等。
6、音频 由于音频分为声音、语音和音乐。其中声音数 据的范围太大太杂,不便于存储和管理。语音 数据的存取也是建立在波形文件基础上的,鉴 于语言、语音以及语气的诸多因素,波形的检 索还存在着较大的难度,只有对各声波段附加 数值、字符串或文本数据,并以它们作为检索 的依据,才能达到非声波本身属性方面的的检 索。在目前的实际应用中,只有对特定声音或 特定语音的存取才具有实际意义。 而音乐是表示乐器的模拟声音,它以符号方式 记录信号,因此容易存取、检索和管理。它类 似于图形,一段完整复杂的音乐可以分解音符、 音色、音调等元素来存储。此外,还必须保存 时间及其它相关属性。
1、引入抽象数据类型(ADT)
通过增加描述声音、图形或图像等特征的抽象 数据类型,来增加RDBMS对多媒体数据的管理 能力。这种扩展方法的优点是以极小的代价保 留了关系型数据库的内核和管理方式,拓宽的 对多种媒体的管理能力。但由于基于二维构造 的多媒体数据模型无法反映各媒体之间的空间、 时间和语义关系,有关的处理必须用其它应用 程序来实现,所以在多媒体数据的同步和集成 方面存在很多问题,且对多媒体数据的基于内 容的检索和查询更加难以实现。
3、文本 大量的字符串组成文本数据。文本主要以自然 语言对事物进行说明性的表示,例如,简历、 备注等。其内容抽象度高,计算机理解需要基 于一定的技术。在管理上也增加了难度,例如, 存储问题、语义归类问题、检索问题等。 4、图形 图形数据以点、线、角、圆、弧为基本单位, 一个完整复杂的图形也可以分解为这些基本的 元素来存储。此外,还必须保存各图形元素之 间的位置与层次关系。例如,图形元素库、工 程图纸库等。图形数据是基于符号的,因此存 储量小,便于存取和管理,但图形的使用以显 示为主,必须结合图形显示技术。
第 10 章
多媒体数据库技术
10.1
多媒体数据库概述
多媒体数据库主要研究的多媒体数据的 组织和管理,为了既能满足不同用户的 需求,又能符合系统的可支持性,首先 需要考虑在计算机中可以建立哪些数据 形式,其次要研究如何建立便于使用的 多媒体数据库的体系结构。
10.1.1
多媒体数据库的数据
数据是表征事物特性的,它们可以取自 于现实世界,也可以通过模拟构造产生。 因此,数据可以有原始型、描述型或指 示型三种数据形式存在于计算机中。
1、原始的数据
原始的数据是根据实物采集而得到的,例如, 声音或图像的采集。当对采样数据进行A/D转 换后,可以得到一系列相关的二进制信号,这 些二进制信号就代表着原始的,不带有任何特 殊附加符号的文件格式。
2、描述性数据
描述性数据通常是带有说明特征的,可以是关 键词、语句、段落,或者是语音或声音。并且 数据可以采用结构化或非结构化形式。
概念数据模型层
对现实世界用多媒体数据信息进行的描 述,也是多媒体数据库中在全局概念下 的一个整体视图。通过概念数据模型为 上层的用户接口、下层的多媒体数据存 储和存取建立起一个在逻辑上统一的通 道。存取与存储数据模型层和概念数据 模型层也可以通称为数据模型层。
多媒体用户接口层
完成用户对多媒体信息的查询描述和得 到多媒体信息的查询结果。用户首先要 能够把它的思想通过恰当的方法描述出 来,并能使多媒体系统所接受。次之, 查询和检索到的结果需要按用户的需求 进行多媒体化的表现,甚至构造出“叙 事”效果。
媒体支持层
建立在多媒体操作系统之上,针对各种媒体的 特殊性质,在该层中要对媒体进行相应的分割、 识别、变换等操作,并确定物理存储的位置和 方法,以实现对各种媒体的最基本数据的管理 和操纵。
存取与存储数据模型层
多媒体数据的逻辑存储与存取,各种媒体数据 的逻辑位置安排、相互的内容关联、特征与数 据的关系以及超链的建立等都需要通过合适的 存取与存储数据模型进行描述。
10.2 多媒体数据模型
10.2.1 多媒体数据模型的发展
根据数据模型的发展,可以划分为三个 阶段:第一代的网状、层次数据库系统; 第二代的关系数据库系统;第三代的以 面向对象库的关 键。数据模型由三种基本要素组成:数 据对象类型的集合、操作的集合、通用 完整性规则的集合。多媒体数据库的数 据的复杂性决定了数据库模型的复杂性, 多媒体数据库模型必须能保留各媒体数 据的构造及属性特征,并能确定不同媒 体数据之间的相互关系,还必须对多媒 体数据时空关系的建模,同时要考虑具 有交互性和动态特征的多种媒体的合成 再现。
1、数值
在数据库中,数值可以用来表征事物的大小或 高低等简单属性,例如,人事档案库中的年龄、 工资、身材等。也可以表示事物的类别、层次 等,如性别、部门、学历等。对数值数据可以 进行算术运算,可以提供有关事物的统计特征。 2、字符串 字符串即由数字、字母或其它符号连接组成的 符号串,其形式近乎于事物本身的特征,并常 通过各个角度对事物进行描述,例如,电话号 码、地址、时间等。对字符串数据可以进行连 接运算,在数据库管理中是较便于检索的一种 类型。
相关文档
最新文档