多媒体图像压缩技术
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 当然,接收器必须能支持MIDI放音。与传
送合成的信号相比,分别传送独唱信号和 MIDI数据要节省大量的带宽。其它的节目 类型同样可以作类似的规定。MPEG一7标 准又叫多媒体内容描述接口标准。图像可 以用色彩、纹理、形状、运动等参数来描 述,MPEG一7标准是依靠众多的参数对图 像与声音实现分类,并对它们的数据库实 现查询。
一、多媒体数据压缩技术
• 仙农(C.E.Shannon)在创立信息论时,提出把数据看作是信息和冗余度的
组合。早期的数据压缩之所以成为信息论的一部分是因为它涉及冗余度问题。 而数据之所以能够被压缩是因为其中存在各种各样的冗余;其中有时间冗余 性、空间冗余性、信息熵冗余、先验知识冗余、其它冗余等。时间冗余是语 音和序列图像中常见的冗余,运动图像中前后两帧间就存在很强的相关性, 利用帧间运动补兴就可以将图像数据的速率大大压缩。语音也是这样。尤其 是浊音段,在相当长的时间内(几到几十毫秒)语音信号都表现出很强的周期 性,可以利用线性预测的方法得到较高的压缩比。空间冗余是用来表示图像 数据中存在的某种空间上的规则性,如大面积的均匀背景中就有很大的空间 冗余性。信息熵冗余是指在信源的符号表示过程中由于未遵循信息论意义下 最优编码而造成的冗余性,这种冗余性可以通过熵编码来进行压缩,经常使 用的如Huff-man编码。先验知识冗余是指数据的理解与先验知识有相当大的 关系,如当收信方知道一个单词的前几个字母为administrato时,立刻就可以 猜到最后一个字母为r,那么在这种情况下,最后一个字母就不带任何信息量 了,这就是一种先验知识冗余。其它冗余是指那些主观无法感受到的信息等 带来的冗余。
• 2.2.DCT变换
DCT变换的全称是离散余弦变换(Discrete Cosine Transform),是指将一组光强数据转换成频率数据,以便得知强度变 化的情形。若对高频的数据做些修饰,再转回原来形式的数据时,显 然与原始数据有些差异,但是人类的眼睛却是不容易辨认出来。 压 缩时,将原始图像数据分成8*8数据单元矩阵,例如亮度值的第一个 矩阵内容如下: JPEG将整个亮度矩阵与色度Cb矩阵,饱和度Cr矩 阵,视为一个基本单元称作MCU。每个MCU所包含的矩阵数量不得超 过10个。例如,行和列采样的比例皆为4:2:2,则每个MCU将包含四 个亮度矩阵,一个色度矩阵及一个饱和度矩阵。 当图像数据分成一 个8*8矩阵后,还必须将每个数值减去128,然后一一代入DCT变换公 式中,即可达到DCT变换的目的。图像数据值必须减去128,是因为 DCT转换公式所接受的数字范围是在-128到+127之间。
• MPEG用于活动影像的压缩。MPEG标准具体包三部分内容:(1)MPEG
视频、(2)MPEG音频、(3)MP系统(视频和音频的同步)。MPEG视频是 标准的核心分,它采用了帧内和帧间相结合的压缩方法,以离散余变 换(DCT)和运动补偿两项技术为基础,在图像质量基不变的情况下, MPEG可把图像压缩至1/100或更MPEG音频压缩算法则是根据人耳屏 蔽滤波功能。利用音响心理学的基本原理,即“某些频率的音响在重 放其频率的音频时听不到”这样一个特性,将那些人耳完全不到或基 本上听到的多余音频信号压缩掉,最后使音频号的压缩比达到8:1或 更高,音质逼真,与CD唱片可媲美。按照MPEG标准,MPEG数据流 包含系统层和压层数据。系统层含有定时信号,图像和声音的同步、 多分配等信息。压缩层包含经压缩后的实际的图像和声数据,该数据 流将视频、音频信号复合及同步后,其数据输率为1.5MB/s。其中 压缩图像数据传输率为1.2M压缩声音传输率为0.2MB/s。
四、JPEG图像压缩算法
• 1..JPEG压缩过程
JPEG压缩分四个步骤实现: 1.颜色模式转换及采样; 2.DCT变换; 3.量 化; 4.编码。 2.1.颜色模式转换及采样 RGB色彩系统是我 们最常用的表示颜色的方式。JPEG采用的是 YCbCr色彩系统。想要用JPEG基本压缩法处理全 彩色图像,得先把RGB颜色模式图像数据,转换 为YCbCr颜色模式的数据。Y代表亮度,Cb和Cr则 代表色度、饱和度。通过下列计算公式可完成数 据转换。
三、压缩原理
• 由于图像数据之间存在着一定的冗余,所以使得数据的压
缩成为可能。信息论的创始人Shannon提出把数据看作是 信息和冗余度(redundancy)的组合。所谓冗余度,是由 于一副图像的各像素之间存在着很大的相关性,可利用一 些编码的方法删去它们,从而达到减少冗余压缩数据的目 的。为了去掉数据中的冗余,常常要考虑信号源的统计特 性,或建立信号源的统计模型。图像的冗余包括以下几种: (1) 空间冗余:像素点之间的相关性。 (2) 时间冗余:活 动图像的两个连续帧之间的冗余。 (3) 信息熵冗余:单位 信息量大于其熵。 (4) 结构冗余:图像的区域上存在非常 强的纹理结构。 (5) 知识冗余:有固定的结构,如人的头 像。 (6) 视觉冗余:某些图像的失真是人眼不易觉察的。
• Y=0.2990R+0.5870G+0.1140B
Cb=-0.1687R-0.3313G+0.5000B+128 Cr=0.5000R-0.4187G-0.0813B+128 人类的眼晴对低频的数据比对高频的数据具有更 高的敏感度,事实上,人类的眼睛对亮度的改变 也比对色彩的改变要敏感得多,也就是说Y成份的 数据是比较重要的。既然Cb成份和Cr成份的数据 比较相对不重要,就可以只取部分数据来处理。 以增加压缩的比例。JPEG通常有两种采样方式: YUV411和YUV422,它们所代表的意义是Y、Cb和 Cr三个成份的资料取样比例。
• 每个解码缓冲器只接收属于它自己的灵敏据流,并转送给解码器。复合存储
器完成图像元素的存储,并将它们送到显示器的恰当位置。音频的情况也是 这样,但显然不同点是要求同时提供所有的元素。数据上的时间标记保证这 些元素在时间上能正确同步。MPEG一4标准对自然元素(实物图像)和合成元 素进行区分和规定,计算机生成的动画是合成元素的一个例子。比如,一幅 完整的图像可以包含一幅实际的背景图,并在前面有一幅动画或者有另外一 幅自然图像。这样的每一幅图像都可以作最佳压缩,并互相独立地传送到接 收器,接收器知道如何把这些元素组合在一起。在MPEG一2标准中,图像被 看作一个整体来压缩;而在MPEG一4标准下,对图像中的每一个元素进行优 化压缩。静止的背景不必压缩到以后的I帧之中去,否则会使带宽的使用变得 很紧张。而如果这个背景图像静止10秒钟,就只要传送一次(假设我们不必担 心有人在该时间内切人此频道),需要不断传送的仅是前台的比较小的图像元 素。对有些节目类型,这样做会节省大量的带宽。MPEG一4标准对音频的处 理也是相同的。例如,有一位独唱演员,伴随有电子合成器,在MPEG一2标 准下,我们必须先把独唱和合成器作混合,然后再对合成的音频信号进行压 缩与传送。在MPEG一4标准下,我们可以对独唱作单独压缩,然后再传送乐 器数字接口的声轨信号,就可以使接收器重建伴音。
• PEG利用了人眼的心理和生理特征及其局限性来
对彩色的、单色的和多灰度连续色调的、静态图 像的、数字图像的压缩,因此它非常适合不太复 杂的以及一般来源于真实景物的图像。它定义了 两种基本的压缩算法:一种是基于有失真的压缩 算法,另一种是基于空间线性预测技术(DPCM)无 失真的压缩算法。为了满足各种需要,它制定了 四种工作模式:无失真压缩、基于DCT的顺序工 作方式、累进工作方式和分层工作方式。
编码压缩方法有许多种,从不同的 角度出发有不同的分类方法,比如 从信息论角度出发可分 为两大类:
• (1)冗余度压缩方法,也称无损压缩,信息保持编码或熵编码。具体讲
就是解码图像和压缩 编码前的图像严格相同,没有失真,从数学上讲 是一种可逆运算。(2)信息量压缩方法,也称有损压缩,失真度编码或 熵压缩编码。也就是讲解码图像和原始图像是有差别的,允许有一定 的失真。应用在多媒体中的图像压缩编码方法,从压缩编码算法原理 上可以分类为:(1)无损压缩编码种类 •哈夫曼编码 •算术编码 •行程编 码 •Lempel zev编码(2)有损压缩编码种类 •预测编码:DPCM,运动补 偿 •频率域方法:正文变换编码(如DCT),子带编码 •空间域方法:统 计分块编码 •模型方法:分形编码,模型基编码 •基于重要性:滤波, 子采样,比特分配,矢量量化(3)混合编码 •JBIG,H261,JPEG, MPEG等技术标准衡量一个压缩编码方法优劣的重要指标 (1)压缩比要 高,有几倍、几十倍,也有几百乃至几千倍; (2)压缩与解压缩要快, 算法要简单,硬件实现容易; (3)解压缩的图像质量要好。
二、多媒体数据压缩技术的实现方 法
• 目前多媒体压缩技术的实现方法已有近百种,其中基于信源理论编码
的压缩方法、离散余弦变换(DCT)和小波分解技术压缩算法的研究更 具有代表性。小波技术突破了传统压缩方法的局限性,引入了局部和 全局相关去冗余的新思想,具有较大的潜力,因此近几年来吸引了众 多的研究者。在小波压缩技术中,一幅图像可以被分解为若干个叫做 “小片”的区域;在每个小片中,图像经滤波后被分解成若干个低频 与高频分量。低频分量可以用不同的分辨率进行量化,即图像的低频 部分需要许多的二进制位,以改善图像重构时的信噪比。低频元素采 用精细量化,高频分量可以量化得比较粗糙,因为你不太容易看到变 化区域的噪声与误差。此外,碎片技术已经作为一种压缩方法被提出, 这种技术依靠实际图形的重复特性。用碎片技术压缩图像时需要占用 大量的计算机资源,但可以获得很好的结果。借助于从DNA序列研究 中发展出来的模式识别技术,能减少通过WAN链路的流量,最多时的 压缩比率能达到90%,从而为网络传送图像和声音提供更大的压缩比, 减轻风络负荷,更好地实现网络信息传播。
• 通常数据压缩技术可分为无损压缩(又叫冗余压缩)和有损
压缩(又叫熵压缩)两大类。无损压缩就是把数据中的冗余 去掉或减少,但这些冗余量是可以重新插入到数据中的, 因而不会产生失真。该方法一般用于文本数据的压缩,它 可以保证完全地恢复原始数据;其缺点是压缩比小(其压 缩比一般为2:1至5:1)。有损压缩是对熵进行压缩,因 而存在一定程度的失真;它主要用于对声音、图像、动态 视频等数据进行压缩,压缩比较高(其压缩比一般高达20: 1以上。最新被称为“E—igen—ID”的压缩技术可将基因 数据压缩1.5亿倍)。对于多媒体图像采用的有损压缩的 标准有静态图像压缩标准(JPEG标准,即 ‘JointPhotographicExpertGroup’标准)和动态图像压缩 标准(MPEG标准,即‘MovingPictureExpertGroup’标准)。
• MPEG标准的发展经历了MPEG—I,MPEG一2、MPEG一4、
MPEG-7、MPEG一21等不同层次。在MPEG的不同标准中, 每—个标准都是建立在前面的标准之上的,并与前面的标 准向后的兼容。目前在图像压缩中,应用得较多的是 MPEG一4标准,MPEG-是在MPEG-2基础上作了很大的扩 充,主要目标是多媒体应用。在MPEG一2标准中,我们的 观念是单幅图像,而且包含了一幅图像的全部元素。在 MPEG一4标准下,我们的观念变为多图像元素,其中的 每—个多图像元素都是独立编码处理的。该标准包含了为 接收器所用的指令,告诉接收器如何构成最终的图像。
对数字图像进行压缩通常利用两个 基本原理
• (1)来自百度文库数字图像的相关性。在图像的同一行相邻像素
之间、活动图像的相邻帧的对应像素之间往往存 在很强的相关性,去除或减少这些相关性,也就 去除或减少图像信息中的冗余度,即实现了对数 字图像的压缩。(2) 人的视觉心理特征。人的视觉 对于边缘急剧变化不敏感(视觉掩盖效应),对颜 色分辨力弱,利用这些特征可以在相应部分适当 降低编码精度,而使人从视觉上并不感觉到图像 质量的下降,从而达到对数字图像压缩的目的。