数字图像编码技术
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
试论数字图像编码技术
[摘要] 本文论述了数字图像编码技术的必要性和可行性.介
绍了三种编码方式(信息保持编码、保真度编码、特征提取),并对具体的编码方法进行了分类(平均信息法、预测编码法、变换编码方法等),最后对图像编码技术的发展方向进行了展望。
[关键词] 数字图像、编码编码方法
中图分类号:tn131+.4 文献标识码:a 文章编号:
1 引言
数字图像处理又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。早期图像处理的目的是改善图像的质量,它以人为对象,以改善人的视觉效果为目的。图像处理中,输入的是质量低的图像,输出的是改善质量后的图像。常见的图像处理有图像数字化、图像编码、图像增强、图像复原、图像分割与图像分析等。图像编码是对图像信息进行编码,可以压缩图像的信息量,以便满足传输与存储的要求。本文主要介绍了图像编码的基本原理和技术方法。
一幅二维数字图像可以由一个二维亮度函数通过采样和量化后而得到的一个二维数组表示。这样一个二维数组的数据量通常很大,从而对存储、处理和传输都带来了许多问题,提出了许多新的要求。为此人们试图采用对图像新的表达方法以减少表示一幅图像需要的数据量,这就是图像编码所要解决的主要问题。压缩数据量的主要方法是消除冗余数据,从数学角度来讲是要将原始图像转化
为从统计角度看尽可能不相关的数据集。这个转换要在图像进行存储、处理和传输之前进行,然后将压缩了的图像解压缩以重建原始图像,即通常所称的图像编码和图像解码。
2 传统编码方法
传统的编码方法可以分成两大类,预测编码方法(对应空域方法)和变换编码方法(对应频域编码方法)。预测编码方法的优点是:算法一般较简单,易于用硬件实现;缺点是:压缩比不够大,承受误码的能力较差。由于它采用的最小均方误差准则不能反映人眼的视觉心理特性,近年来已较少单独采用,而是与其他方法混合使用。另外,由于dpcm编码系统会引起斜率过载、界线繁忙、颗粒噪声和轮廓噪声,在使用中应加以考虑。变换编码方法的优点是:压缩比高、承受误码能力强;缺点是:算法较复杂。
3 现代编码方法
31 第二代图像编码方法
第二代图像编码方法[2]是针对传统编码方法中没有考虑人眼对轮廓、边缘的特殊敏感性和方向感知特性而提出的。它认为传统的第一代编码技术以信息论和数字信号处理技术为理论基础,出发点是消除图像数据的统计冗余信息,包括信息熵冗余、空间冗余和时间冗余。其编码压缩图像数据的能力已接近极限,压缩比难以提高。第二代图像编码方法充分利用人眼视觉系统的生理和心理视觉冗余特性以及信源的各种性质以期获得高压缩比,这类方法一般要对图像进行预处理,将图像数据根据视觉敏感性进行分割。
按处理方法的不同,第二代图像编码方法可分为两种典型的编码技术[3]:一种是基于分裂合并的方法,先将图像分为纹理和边缘轮廓,然后各自采用不同的方法编码;另一种是基于各向异性滤波器的方法,先对图像进行方向性滤波,得到不同方向的图像信息,再根据人眼的方向敏感性对各个通道采用特定的方法单独编码。
32 分形图像编码
分形图像编码是在分形几何理论的基础上发展起来的一种编码方法。分形理论是欧氏几何相关理论的扩展,是研究不规则图形和混沌运动的一门新科学。它描述了自然界物体的自相似性,这种自相似性可以是确定的,也可以是统计意义上的。这一理论基础决定了它只有对具备明显自相似性或统计自相似性的图像,例如海岸线、云彩、大树等才有较高的编码效率。而一般图像不具有这一特性,因此编码效率与图像性质学特性有关,而且分形图像编码方法实质上是通过消除图像的几何冗余来压缩数据的,根本没有考虑人眼视觉特性的作用。
33 基于模型的图像编码
基于模型的图像编码技术[4]是近几年发展起来的一种很有前途的编码方法。它利用了计算机视觉和计算机图形学中的方法和理论,其基本出发点是在编、解码两端分别建立起相同的模型,针对输入的图像提取模型参数,或根据模型参数重建图像。模型编码方法的核心是建模和提取模型参数,其中模型的选取、描述和建立是决定模型编码质量的关键因素。为了对图像数据建模,一般要求对
输入图像要有某些先验知识。
基于模型的图像编码方法是利用先验模型来抽取图像中的主要信息,并以模型参数的形式表示它们,因此可以获得很高的压缩比。然而在模型编码方法的研究中还存在很多问题,例如:①模型法需要先验知识,不适合一般的应用;②对不同的应用所建模型是不一样的;③在线框模型中控制点的个数不易确定,还未找到有效的方法能根据图像内容来选取;④由于利用模型法压缩后复原图像的大部分是用图形学的方法产生的,因此看起来不够自然;⑤传统的误差评估准则不适合用于对模型编码的评价。
34小波图像编码
一维连续小波变换可看成原始信号和一组不同尺度的小波带通滤波器的滤波运算,从而可把信号分解到一系列频带上进行分析处理。将其离散化后即为离散小波变换。小波变换图像编码压缩[6]的核心问题是要对子带图像进行小波分解系数的量化和编码。低频子带图像包含原图像的大部分能量,即包含图像的基本特性。它在图像重构算法中起主导作用,对重建图像的质量有很大影响,因此这部分信号应精确保留。
高频子图像的系数分布符合广义高斯分布,对其系数进行粗量化编码较为有效。这也完全符合人的视觉特性,根据对人眼视觉系统的研究可知,人眼视觉灵敏度具有明显的低通特性,而且对不同方向上的敏感度也不一样,尤其是对倾斜方向的刺激不太敏感,如人眼对对角线方向子图像系数误差敏感度较低,因此可对对角线方
向子图像进行粗量化高压缩。
小波变换后的能量主要集中在低频系数分量,而其他高频系数分量大多为零值,这为高倍率压缩提供了可能。通过选择合适的具有平滑特性小波基,就可消除重建图像中出现的方块效应,减小量化噪声,获得较好的重建图像质量。
小波变换图像编码压缩方法可分为如下两大类:基于传统的图像编码方法和基于分形理论的小波变换图像编码方法。
基于传统的图像编码方法[7]包括:零树小波编码、基于塔式网络矢量量化的小波变换编码、基于lbg算法的小波变换编码、基于标量量化的小波变换编码等。
由于不同分辨率级子图像之间存在着相似性,因此,利用此相似性,可提高压缩比[8]。j.m.shapiro采用零树自嵌套编码方法,对小波分解系数进行压缩,在psnr=27.54db的情况下,获得压缩比为128∶1。这是最著名的一种小波变换图像编码压缩方法。该方法的优点是:与传统的dct编码相比,它既可以克服方块效应,又可以在低比特率下获得较好的图像主观质量。缺点是:由于它对各子带采用相同的门限量化,因此不能充分利用人眼的视觉特性,限制了图像压缩比的进一步提高。对此,a.said等人提出了改进算法。
针对分形图像编码尚存在的缺点,如编码算法的耗时、自然图像不一定具有严格的分形结构而无法达到预期的高压缩比、高压缩倍率时的方块效应等,有人提出了基于小波变换的分形编码[9]。它具有以下特点:①采用平滑小波可去除传统分形变换中存在的方