图像压缩编码方法综述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图像压缩编码方法综述
【摘要】:图像压缩编码在图像处理中起着至关重要的作用,文章论述了图像压缩的必要性和可行性,介绍了几种常用的几种常用经典图像压缩方法和现代压缩的算法及应用情况。
【关键词】:图像压缩;经典压缩方法;现代压缩算法
1. 图像压缩的必要性和可行性
随着多媒体应用的普及和数字视频技术的发展, 以及网络上图像传输的增多, 对图像的处理变得越来越重要。图像的数字化是必然的趋势, 但是经过数字化的图像所占的数据量相当庞大, 而信道带宽和存储空间的限制又给实际应用带来了很大的困难, 所以图像压缩已成为现代信息社会急待解决的问题。虽然数字图像的数据量极为庞大,但这些数据之间往往是高度相关的。换言之,其中存在着大量的冗余,数字图像压缩技术就是通过有效地消除图像的各种冗余,达到用尽可能少的数据表示和重建原始图像的目的。一个常用的图像压缩系统模型如下:
2. 图像压缩编码的分类
2.1 传统图像压缩编码方法
2.1.1 熵编码
熵编码是纯粹基于信号统计特性的编码技术。它是一种无损编码,解码后能无失真地恢复原图像。其基本原理是给出出现概率大的符号一个短码字,而给出出现概率小的符号一个长码字,从而使得平均码长最短。
①霍夫曼编码
霍夫曼编码〔Huffman encoding)是常用的压缩方法之一,它是通过用更有效的代码代替数据来实现的。霍夫曼编码最初是为了对文本文件进行压缩而建立的,迄今已经有很多变体。它的基本思路是出现频率越高的值,其对应的编码长度越短,反之出现频率越低的值,其对应的编码长度越长。霍夫曼编码很少能达到8: 1的压缩比,此外它还有以下两个不足:其一它必须精确地统计出原始文件中每个值的出现频率,如果没有这个精确统计,压缩的效果就会大打折扣,甚至根本达不到压缩的效果。其二它对于位的增删比较敏感。由于霍夫曼编码的所有位都是合在一起的而不考虑字节分位,因此增加一位或者减少一位都会使译码结果面目全非。
②算术编码
算术编码最早由Shannon提出,其核心思想是累积概率。后来算术编码在理论和实用化方面又进一步得到改进。算术编码就是将任意长度的信息用一个实数R来表示,其中Re (0, 1)。若一串信息所包含的字符数越多,则要求算术编码精度就越高;若将编码结果用一个二进制数来表示,就越长。算术编码是一种效率较高的信息保持型熵编码,近年来得到普遍使用。
③行程长度编码(RLE)
行程长度编码(run-length encoding)是压缩一个文件最简单的方法之一。它的做法就是把一系列的重复值(例如图像像素的灰度值)用一个单独的值再加上一个计数值来取代。比如有这样一个字母序列aabbbccccccccdddddd它的行程长度编码就是2a3b8c6d。这种方法实现起来很容易,而且对于具有长重复值的串的压缩编码很有效。例如对于有大面积的连续阴影或者颜色相同的图像,使用这种方法压缩效果很好。很多位图文件格式都用行程长度编码,例如TIFF, PCX, GEM等。其缺点是:a对误码很敏感,一个值传输或存储出错,可能导致整个图像混乱;b对不连续的情况编码效果很差,甚至可能出现编码后的代码数比编码前的还多。
④LZW编码
LZW编码的基本原理:把每一个第一次出现的字符串用一个数值来编码,还在原程序中再将这个数值还原成原来的字符串。例如:用数值0x100代替字符串” abccddeee”,每当出现该字符串时,都用0x100代替,这样就起到了压缩作用。至于0x100与字符串的对应关系则是在压缩过程中动态形成的,而且这种对应关系隐含在压缩数据中。随着解压的进行,该编码表会从压缩数据中逐步得到恢复,后面的压缩数据再根据前面数据产生的对应关系,产生更多的对应关系,直到压缩文件结束为止。LZW是无损的。GIF文件就采用这种压缩算法。LZW 编码的特点是压缩效率很高,但比较复杂。
2.1.2 线性预测编码(DPCM差分脉冲编码调制)
预测编码是图像压缩技术领域的重要分支,其理论基础是现代统计学和控制论。其基本方法是,在图像编码过程中,首先利用图像像素间的相关性,根据某些像素的值来预测相关下一像素的值,再将该像素的实际值和预测值相减得出误差值,然后对该误差值进行编码。
在信源数据流中,由于相邻像素之间存在相关性,因此前面像素和当前像素的数据之间存在某种相近性,预测压缩编码就是试图用以前数据的某种函数形式来替代当前像素。以降低信源的不确定性,减少数码率。目前,真正实用的预测编码方案为差分脉冲编码调制(简称DPCM)压缩编码。DPCM工作时,发送端首先发送数据流的前面N个像素数据x1, x2,…, xN,然后利用这N个像素数据来预测第N+I个像素数据xN +1,从而得到预测值,真实值与预测值之间的误差经量化后直接传输或经编码器编码后传输。在图像的线性预测编码中,预测值xN +1是通过公式xN +1= a1 x1 + a2 x2 + a3 x3 +...+ an xN计算。
2.1.3 变换编码
将原来在空间域上描述的图像信号,通过一种数学变换,变换到变换域(如频率域)中。我们常会发现,各变换系数之间的相关性明显下降,能量较为集中,这样可以根据压缩比的要求,在满足一定失真度要求的情况下进行有损压缩编码。变换编码的一般过程是:先对每个子像块进行正交变换,生成变换域中的系数矩阵,然后进行变换、量化、编码,再存储或传输。
2.1.4 矢量量化编码
利用相邻图像数据间的高度相关性,将输入图像数据序列分组,每一组M 个数据构成M维矢量,一起进行编码,即一次量化多个点。矢量量化编码属于有损压缩编码,它的缺点是复杂度随矢量维数呈指数增加,数据量和计算量都很大。
2.2 现代图像编码方法
经典的图像处理方法从信息理论出发,只依据图像本身固有的统计特性和视觉系统的某些特性进行压缩编码,这是不充分的。现代图像编码方法突破了Shanno传统信息理论的框架,注重对视觉感知特性的应用,通过新算法,在主观视觉感知没有较大变化地条件下极大地提高了图像的压缩比。现代图像编码方法与经典方法相比在相同压缩比的情况下在重构图像的主观质量上有显著地提高:或者说在重构图像的主观质量不变的情况下压缩比是经典方法的几倍或几十倍。
2.2.1 子带编码(SBC)
将图像信号通过一组带通滤波器分解成不同频带内的分量,然后在每一个子带内单独进行降速采样和编码。其优点:量化在各子带内单独进行,量化噪声被限制在各子带内,可以防止能量较小的频带内信号受其他频带内量化噪声的干扰和影响,还可以根据视觉特性,将有限的比特在各个子带内做合理的分配,即实行噪声频谱成型技术,提高了图像的主观评价质量。
2.2.2 模型基图像编码
利用计算机视觉和计算机图形学的知识对图像信号进行分析与合成,分为两类:语义基图像编码、物体基图像编码。模型基图像编码将图像信号看作三维世界中的目标和景物投影到二维平面的产物,而对于这一产物的评价是由人类视觉系统的特性决定的。模型基图像编码的关键是对特定的图像建立模型,并根据这个模型确定图像中景物的特征参数。解码时根据参数和己知模型用图像合成技术重建图像。由于编码的对象是特征参数而不是原始图像,因此可以得到较大的压缩比。其引入的误差主要是人眼不太敏感的几何失真。因此重建图像非常自然逼真。它主要用于低比特率及图像变化不大的场合,如可视电话和视频会议等。