多媒体数据库建设浅析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

BMP 文 件
文件头 信息
文件类型(BM)、大小(字节)。
图像的宽、高、压缩方法,以 及定义颜色等信息。
位图数据
像素值、像素所占字节数、以 及像素显示顺序。
图1
340
第七届(2009)两岸三院信息技术与应用交流研讨会论文报告集
(2)GIF 文件格式。GIF(Graphics Interchange Format)的原义是"图像互换格式",
1. 静态图像文件的格式特点 目前多媒体数据库存储的静态图像常用的有 3 种。
(1) BMP 图像文件格式。BMP 是一种与硬件设备无关的二进制流文件格式,使用非常 广泛。它采用位映射存储格式,除了图像深度可选以外,不进行其他任何压缩。因此,BMP 文件所占用的空间较大。数据库在保存 BMP 文件时,把以二进制形式图像文件信息代码分三 个部分保存在数据库中,即文件头、信息位图数据。典型的 BMP 图像文件结构如图 1 所示:
通过以上多媒体数据和文本数据的比较可以看出,适合文本数据的传统关系型数据库及 其理论和方法不可能适合复杂的多媒体数据,需要采用新的方法和技术实现多媒体数据的有 效管理。流媒体服务系统是当前最为常用的一种数据库管理系统,它包括了下面几个方面 的内容:内容采集、视音频捕获和压缩编码、内容编辑、内容存储和播放、应用服务器 内容管理发布及用户管理等。但这种系统目前还不可能普遍使用的原因是:一、价格昂 贵。一套流媒体服务器系统费用一般都需要数十万元以上。二、设备要求高。一套流媒 体服务系统需要有一个强大的硬件环境,对硬件要求较高,同时海量的数据需要阵列的 支持和后期的不断扩容。三、系统使用要求高。流媒体服务器系统需要专门的系统管理 人员对其进行使用维护。因此在流媒体服务器系统不能普遍使用的情况下,采用 SQL Server 管理多媒体数据库是一种变通方式。
关键词:多媒体数据库;SQL Server;数据挖掘 作者简介:阳军 男 助理馆员、中国社科院政治学所信息资料室,主要从事数据库开 发与管理 e-mail:yangjun@cass.org.cn 电话:85196400 罗维维 女 副研究馆员、中国社科院政治学所信息资料室主任,主要从事图书馆、情 报与文献学研究 e-mail:luoww@cass.org.cn 电话:85196400
之间通常存在复杂的层次结构关系。
(4)数据定义及存储、调用、查询难以用简单的 SQL 语言实现。多媒体数据的复杂性,
决定了其描述语言、数据操作语言或存储结构、存取路径等的复杂性。
342
第七届(2009)两岸三院信息技术与应用交流研讨会论文报告集
(5)声音与视频同步。在视频文件中一般含有声音数据,二者的严格同步是高质量的 视频媒体传送的重要保证。
何实现异构多媒体数据库的异地查询以保证使用者全面、便捷、完整的使用所需数据库文件
是多媒体数据库系统亟待解决的问题。
2. 与文献型数据库相比,多媒体数据库具备以下特性:
(1)数据量巨大。多媒体数据和文本数据相比,其数据量是非常巨大的。如一本著作,
几十万字的文本文件占用空间最多就是几 MB,而多媒体文件少则数十 MB 通常都是上百 MB
第七届(2009)两岸三院信息技术与应用交流研讨会论文报告集
多媒体数据库建设浅析
阳军 罗维维 (政治学所 北京 100732 ,政治学所 北京 100732)
摘要:随着多媒体技术的不断发展,多媒体文件越来越多,如何管理、开发和利用好这 方面的资料,使展示变得更加方便快捷,是数据库建设的一个主要内容。多媒体数据库就是 通过对图像、语音、视频等载体形式资料进行管理和利用的数据库,与传统文献类数据库相 比内容更加生动形象,形式更加多样复杂。本文主要介绍几种常用的多媒体文件格式及其特 点,以及在 SQL Server 环境下实现多媒体数据存储与读取的常用工具和具体方法,并对多 媒体数据库如何进行深度挖掘进行了探讨。
转换为常用的、绝大多数软件都支持的 MP3 格式。这样既保留了绝大多数文件的原本信息又
节省大量存储空间。
3. 常见视频文件的特点。不同格式的视频文件有各自的编码格式和特点,有些清晰度
较高(如 AVI、RMVB),有些则体积较小(如 WMV)比较适合保存和在网络上传播。在表 2
展示了不同格式的视频的特点。
引言 随着信息化技术的不断发展,信息管理已经不止是对书籍、报刊等纸质载体文字文献进 行数字化管理,图表、图片、录音、视频等多媒体文献类型的信息处理在教育和研究领域作 用也越来越重要。 本文就多媒体资源的特点、构建数据库所使用的方法,以及多媒体数据库应该具有哪些 特有的功能,如何有效地对多媒体文献进行数据挖掘,从而最大限度地发挥多媒体数据库作 用等方面进行分析和阐述。
一、多媒体数据库数据资源分类介绍 在中国数字图书馆数据管理系统中,通常将多媒体数字资源分为电子图书、音频、视频 和图片 4 大类:电子图书的文件格式主要包括 HTML、PDF、Postscript、PowerPoint 等类型; 图片主要指 JPEG、GIF、BMP 等类型的静态图象文件;音频主要包括 WAV、MP3、WMA、RM 等 类型文件;视频主要包括 RMVB、RM、AVI、 MPEG、WMV 、ASF 等类型文件。其中电子图书已 经广泛应用,这里不再详加介绍。下面着重介绍一下其他三种类型多媒体文件的特点:
采样生成。在软件中存储着 Layer 3 标准压 推 出 的 一 司的早期
在经过模数转换后形成的千 缩编码的一种音 种 新 的 压 的流媒体
万个独立的数码组,数码数 频 文 件 格 式 。 缩 能 力 强 声 音 格
据表示了声音在不连续的时 MPEG 编 码 具 有 的 音 频 格 式。
间点内的瞬时振幅。
341
第七届(2009)两岸三院信息技术与应用交流研讨会论文报告集
RMVB
RM
AVI
MPEG
WMV
ASF
原 是在流媒体的 RM Real
AVI 是是 MPEG 是一 高 清 晰 是 一 种 可
理 影 片 格 式 上 升 级 Networks 公 微 软 由 种压缩能 度 视 频 以 直 接 在
延伸而来。
三、目前在 sql 环境下对多媒体文件的存储及读取 SQL Server 语言在全面管理多媒体数据存在缺陷的情况下,如何利用它来实现对多媒 体数据的管理,需要我们全面了解 SQL 管理软件的使用特点。 1. Sql 环境下多媒体文件存储及读取的设计思想 在 SQL Server 中,Image 字段可以存储多达 2Gb 的内容,I mage 数据类型字段存储数 据时,可直接将小于 2Gb 多媒体文件原封不动地存储在数据库中;在对多媒体数据进行显示 或播放时,再将此数据从数据库中读出来还原成多媒体数据文件,然后对此文件进行显示或 播放。这样处理在实际的应用中有以下的优点: (1)节省存储空间。对于图像的处理来说,用 VB 编程时,可以用 VB 提供的 I mage 控 件,它可与 SQL Server 的 Image 类型的字段关联起来,方便地存取数据。但是采用这种方 法,不论图像的格式是未压缩位图 BMP 还是 JPG、GIF 等压缩图像格式,一旦存入数据库中 后都变成了非压缩的数据,占用的存储空间很大。例如,将 120KB 的彩色 JPG 图像文件用 这种关联法存入数据库中,其占用的空间近 1.5MB。而采用 SQL Server 的 I mage 数据类 型字段方法存储,则仅需 120 KB 的存储空间。 (2)处理的多媒体数据格式不受限制。采用 SQL Server 的 I mage 数据类型字段来存 储数据,可以处理任何数据格式。例如视频文件,可以存储 Mpeg 系列的文件、WindowsMedia 的 ASF 流式格式, 也可以存取 RealNetworks 的 RM 流式格式。 (3)可以灵活采用不同控件来显示图像或播放动画、 声音及视频。 (4)可以方便的利用各种多媒体处理软件来采集多媒体数据,以便存入数据库中。 (5)数据保密性好, 安全可靠,不易丢失和被修改。 2. SQL Server 中图像数据的存储机制 SQL Server 提供了一种机制, 能存储多达 2GB 的字段类型, 这类对象可包括 image、 text 和 ntext 三种数据类型。在多媒体数据库中使用 Image 数据类型来存储多媒体文件。
很高的压缩率。 式。
优点
有可靠的播放音质量和潜在 其音色和音质没 音质好,压 占空间极
的高质量音频。
有明显的下降。 缩比高,兼 小。
容性好。
缺点
不适合控制乐曲的所有细
存 在 版 权 音质差、
节。数据大、占用空间大。
限制问题。 兼 容 性
差。
表1
从表 1 可以看出,如果是单独的音频文件,使用专门的格式转换软件进行转换,把格式
二、多媒体数据库的功能与特性
1. 多媒体数据库的基本功能:
(1)多媒体数据的存储与管理。多媒体数据一般采用两种方式进行管理,一种是把多
媒体文件转化为二进制形式保存在数据库中并对文件进行标注管理,调用时再进行还原。这
种方式的优点是方便检索文件本身,但占用存储空间太大,调用时需用系统资源多,并且有
些文件格式数据库管理系统不支持。另外一种是只对多媒体进行描述性标引,而文件存在数
类浏览器都支持的图像文件格式。JPG 压缩格式是通过舍弃图像中重复或不重要的资料,将
图像压缩在很小的储存空间中。目前的一般的会议照片资料都用 JPG 格式进行压缩后进行保
存。
2. 常见音频文件的特点(见〔表 1〕)
Wav
Mp3
Wma
Rm
原理
波形声音,它是通过对声音 MP3 是 以 MPEG 微 软 公 司 Real 公
(6)数据传送的连续性。多媒体数据,无论是声音媒体还是视频媒体,都要求连续传 送或输出,否则将导致严重失真,大大影响效果。
(7)对多媒体文件内容的检索。基于多媒体内容的检索(Content Based Retrieval,CBR) 是指根据媒体和媒体对象的内容语义及上下文联系进行检索。
对于多媒体来说,每一种媒体数据都有一些难以用字符和数字符号描述的内容线索,如 图像中某一对象的形状、颜色和纹理,视频中的运动,声音的音调等。为了使用户能利用这 些线索对数据进行检索时,一般首先将多媒体数据的内容转化为文本和关键词形式,分别作 为元数据元素集中关键字和描述值存储起来。在对多媒体数据内容进行自动语义分析、表达 和检索时,可以通过元数据元素集中关键字和描述值来实现。
司 所 制 定 的 WIN3.1 力强的视 格式。 网 上 观 看
音 频 视 频 压 时代就发 频格式。
视频节目
缩 规 范 称 为 表的旧视
的文件压
RealMedia。 频格式。
缩格式。
特 最 大 限 度 地 压 缩 视频柔和
兼容好、 占用空间 微 软 支 压 缩 率 和
点 影片的大小,接近
图象质量 较小,图 持 。 转 图 像 的 质
甚至以 GB 为单位。
(2)数据长度不固定。多媒体数据的数据量大小是可变的,并且无法预先估计,因此
不可能用定长记录来存储多媒体数据,其结构和检索过程与常规数据存在很大的不同。
(3)数据模型复杂。多媒体数据对应的是复杂的对象,不仅包含多媒体数据本身(如一
张图片、一段视频),还包含多媒体数据的说明信息(即多媒体的元信息)。同时多媒体对象
ห้องสมุดไป่ตู้
素。元信息标注的正确性和完整性直接影响海量多媒体数据管理系统的性能,是当前多媒体
领域内一个研究热点。
(3)多媒体数据和元信息的一致性保证。多媒体数据本身(文件)和元信息共同构成多
媒体对象,二者的一致性指的是多媒体数据和元信息之间的一一对应关系。这种一致性的保
证是实现多媒体对象管理和信息检索的基础。
(4)异构多媒体数据库的异地查询。Internet 使得异地的多媒体资源连接在一起,如
于 DVD 品质的视听
好、占用 像 质 量 换 后 变 量不错。
效果。
空间大! 好。
小。
表2
从表 2 可以看出,目前视频多媒体编辑和播放软件对文件格式是有不同要求的,例如,
一些手机和照相机拍摄的视频文件在会声会影软件中编辑声频部分就无法识别,因此,在制
作不同格式视频文件时,需考虑视频制作软件的兼容性和文件格式的转换。
据库的外部,只在检索时进行调用,这种方式只是一种对多媒体文件目录的管理,其优点是,
数据库结构相对简单,占用存储空间小,并不受多媒体文件类型限制的一种管理系统,但不
能对多媒体文件本身进行检索调用。目前的多媒体数据库多采用这种管理方式。
(2)多媒体元信息的存储与管理。元信息是信息管理和检索多媒体文件数据的重要因
次序和延迟时间,更改循环次数,并用多种方法对其进行优化,以减小文件体积。调用应用
程序对帧进行即时编辑,为 GIF 文件添加注释,以及输出 HTML 代码方便调用图像。
(3) JPG 文件格式。JPEG 是 joint Photographic Experts Group(联合图像专家组)
的缩写,文件后辍名为".jpg"或".jpeg",是最常用的、文件尺寸较小,下载速度快、各
是 CompuServe 公司在 1987 年开发的图像文件格式。GIF 文件的数据,是一种基于 LZW 算法
的连续色调的无损压缩格式,其压缩率一般在 50%左右。GIF 不属于任何应用程序,目前几
乎所有相关软件都支持该格式,大量公共领域的软件都在使用 GIF 图像文件。 主要用于简
单动画制作。具体方法是:利用 GIF 制作软件对图像文件进行剪切、缩放、旋转,调整帧的
相关文档
最新文档