数字图像编码技术 - 360文档中心

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

信息编码论文

[摘要]数字图像处理又称为计算机图像处理，它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。早期图像处理的目的是改善图像的质量，它以人为对象，以改善人的视觉效果为目的。图像处理中，输入的是质量低的图像，输出的是改善质量后的图像。常见的图像处理有图像数字化、图像编码、图像增强、图像复原、图像分割与图像分析等。图像编码是对图像信息进行编码，可以压缩图像的信息量，以便满足传输与存储的要求。本研究主要介绍了图像编码的基本原理和技术方法。

【关键词】信息编码技术数字图像

一幅二维数字图像可以由一个二维亮度函数通过采样和量化后而得到的一个二维数组表示。这样一个二维数组的数据量通常很大，从而对存储、处理和传输都带来了许多问题，提出了许多新的要求。为此人们试图采用对图像新的表达方法以减少表示一幅图像需要的数据量，这就是图像编码所要解决的主要问题。压缩数据量的主要方法是消除冗余数据，从数学角度来讲是要将原始图像转化为从统计角度看尽可能不相关的数据集。这个转换要在图像进行存储、处理和传输之前进行，然后将压缩了的图像解压缩以重建原始图像，即通常所称的图像编码和图像解码。

图1给出了一个通用的图像编码系统模型，这个模型主要包括2个通过信道级连接的结构模块：编码器和解码器。当一幅输入图像送入编码器后，编码器根据输入数据进行信源编码产生一组信号，这组信号在进一步被信道编码器编码后进入信道。通过信道传输后的码被送入信道解码器和信源解码器，解码器重建输入的图像。一般来说，输出图是输入图的精确复制，那么系统是无失真的或者信息保持型的；否则，称系统是信息损失的。

信源编码器的作用是减少或消除输入图像中的编码冗余、像素间冗余及心理视觉冗余。尽管信源编码器的结构与具体应用和对保真度的要求有关，但一般情况下信源编码器包括顺序的3个独立操作，而对应的信源解码器包含反序的2个独立操作(图2)。在信源编码器中，映射器将输入数据变换以减少表达图像的数据，这与具体编码技术有关。量化器根据给定的保真度准则减少映射器输出的精确度。这个操作可以减少心理冗余，但不可翻转。符号编码器产生表达量化器输出的码本，并根据码本输出。符号编码器编码为了减少冗余，这个操作是可以反转的。

当信道是有噪声的或者容易产生误差时，信道编码器和信道解码器对这个编解码过程是非常重要的。由于信源编码器的输出数据一般只有很少的冗余，所以他们对传输噪声很敏感。信道编码器通过把可控制的冗余加入信源编码器后的码字以减少信道噪声的影响。

2 传统编码方法

传统的编码方法可以分成两大类，预测编码方法(对应空域方法)和变换编码方法(对应频

域编码方法)。预测编码方法的优点是：算法一般较简单，易于用硬件实现；缺点是：压缩比不够大，承受误码的能力较差。由于它采用的最小均方误差准则不能反映人眼的视觉心理特性，近年来已较少单独采用，而是与其他方法混合使用。另外，由于DPCM编码系统会引起斜率过载、界线繁忙、颗粒噪声和轮廓噪声，在使用中应加以考虑。变换编码方法的优点是：压缩比高、承受误码能力强；缺点是：算法较复杂。

3 现代编码方法

31 第二代图像编码方法

第二代图像编码方法［2］是针对传统编码方法中没有考虑人眼对轮廓、边缘的特殊敏感性和方向感知特性而提出的。它认为传统的第一代编码技术以信息论和数字信号处理技术为理论基础，出发点是消除图像数据的统计冗余信息，包括信息熵冗余、空间冗余和时间冗余。其编码压缩图像数据的能力已接近极限，压缩比难以提高。第二代图像编码方法充分利用人眼视觉系统的生理和心理视觉冗余特性以及信源的各种性质以期获得高压缩比，这类方法一般要对图像进行预处理，将图像数据根据视觉敏感性进行分割。

按处理方法的不同，第二代图像编码方法可分为两种典型的编码技术［3］：一种是基于分裂合并的方法，先将图像分为纹理和边缘轮廓，然后各自采用不同的方法编码；另一种是基于各向异性滤波器的方法，先对图像进行方向性滤波，得到不同方向的图像信息，再根据人眼的方向敏感性对各个通道采用特定的方法单独编码。

32 分形图像编码

分形图像编码是在分形几何理论的基础上发展起来的一种编码方法。分形理论是欧氏几何相关理论的扩展，是研究不规则图形和混沌运动的一门新科学。它描述了自然界物体的自相似性，这种自相似性可以是确定的，也可以是统计意义上的。这一理论基础决定了它只有对具备明显自相似性或统计自相似性的图像，例如海岸线、云彩、大树等才有较高的编码效率。而一般图像不具有这一特性，因此编码效率与图像性质学特性有关，而且分形图像编码方法实质上是通过消除图像的几何冗余来压缩数据的，根本没有考虑人眼视觉特性的作用。

33 基于模型的图像编码

基于模型的图像编码技术［4］是近几年发展起来的一种很有前途的编码方法。它利用了计算机视觉和计算机图形学中的方法和理论，其基本出发点是在编、解码两端分别建立起相同的模型，针对输入的图像提取模型参数，或根据模型参数重建图像。模型编码方法的核心是建模和提取模型参数，其中模型的选取、描述和建立是决定模型编码质量的关键因素。为了对图像数据建模，一般要求对输入图像要有某些先验知识。

基于模型的图像编码方法是利用先验模型来抽取图像中的主要信息，并以模型参数的形式表示它们，因此可以获得很高的压缩比。然而在模型编码方法的研究中还存在很多问题，例如：①模型法需要先验知识，不适合一般的应用；②对不同的应用所建模型是不一样的；

③在线框模型中控制点的个数不易确定，还未找到有效的方法能根据图像内容来选取；④由于利用模型法压缩后复原图像的大部分是用图形学的方法产生的，因此看起来不够自然；⑤

传统的误差评估准则不适合用于对模型编码的评价。

34 神经网络图像编码

在图像编码的各种方法中，除信息保持型编码方法外，其余所有方法始终没有解决好如何充分利用人的视觉特性这个问题，神经网络图像编码［5］试图在此有所突破，现在直接用于图像压缩的神经网络主要有BP网络和自组织映射神经网络。采用BP网络实现数据压缩好比是强迫数据通过细腰型网络的瓶颈，并期望在网络的瓶颈处能获得较紧凑的数据表示。

图3给出了BP网络进行数据压缩的原理，这是一nmn型三层BP神经网络。输入层有n 个神经元，通过BP训练算法，在网络的学习过程中调整网络的权重，使训练集图像的重建误差E=‖X-Z‖2均值达到最小(X为输入层样本集，Z为输出层样本集)，或者说，使重建图像在均方误差意义上尽可能地相似于原始图像。训练后的神经网络便可用来进行图像压缩，隐层神经元矢量Y为压缩结果。

自组织映射神经网络中的神经元可以自动地根据外部刺激的兴奋点来调整自己在由外界信号决定的参数空间中的位置。以一种双层神经网络为例：其中输入层神经元(x1,x2,x3,…xn)简单地反映着外部刺激，在输出层中，M个神经元排布成二维网络，其中每个神经元j 接收两类输入：来自输入层神经元i的输入xi(权重为Wij)和来自输出层神经元的固定权重。对每一个外界输入矢量X=(x1,x2,x3…,xn)，只有一个同该输入的距离d1=f(X,Wj),Wj=(W1j,W2j,W3j,…Wnj)为最小的神经元j才被激发。其中，距离函数f(X,Wj)反映了在某一准则(一般为平方误差准则)下，矢量X与Wj之间的距离。在网络的训练中我们只需要提供输入矢量X，通过调整从公共的外部输入到每个神经元j的连接权重Wj，权重矢量将逐渐指向输入矢量空间的聚类。从而实现了输入空间的维数压缩，完成了类似于矢量量化的功能。

35小波图像编码

一维连续小波变换可看成原始信号和一组不同尺度的小波带通滤波器的滤波运算，从而可把信号分解到一系列频带上进行分析处理。将其离散化后即为离散小波变换。

小波变换图像编码压缩［6］的核心问题是要对子带图像进行小波分解系数的量化和编码。低频子带图像包含原图像的大部分能量，即包含图像的基本特性。它在图像重构算法中起主导作用，对重建图像的质量有很大影响，因此这部分信号应精确保留。

高频子图像的系数分布符合广义高斯分布，对其系数进行粗量化编码较为有效。这也完全符合人的视觉特性，根据对人眼视觉系统的研究可知，人眼视觉灵敏度具有明显的低通特性，而且对不同方向上的敏感度也不一样，尤其是对倾斜方向的刺激不太敏感，如人眼对对角线方向子图像系数误差敏感度较低，因此可对对角线方向子图像进行粗量化高压缩。

小波变换后的能量主要集中在低频系数分量，而其他高频系数分量大多为零值，这为高倍率压缩提供了可能。通过选择合适的具有平滑特性小波基，就可消除重建图像中出现的方块效应，减小量化噪声，获得较好的重建图像质量。