图像压缩
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
摘要
多媒体技术和网络与移动通信的飞速发展激发了人们进行视频信息交流的需求,推动了图像通信和数字视频技术的全面发展。图像和视频信号数字化可以避免远距离传输的累积失真,数字化存储可以高保真还原,并且容易借助计算机进行灵活处理和管理。而传输和存储图像需要占用大量的数据空间,这严重影响了传输速率和实时处理量,极大地制约了图像通信的发展。因此,图像压缩编码技术受到了越来越多的关注及应用。
本文在分析视频特点的基础上主要从图像压缩的概念、原理、发展现状等方面进行介绍。并且详细介绍了图像压缩技术的分类方便及几种常用的图像压缩编码方法。主要介绍了行程长度编码(RLE)、LZW编码、霍夫曼编码、预测及内插编码、矢量量化编码、分形编码及小波变换编码
1.引言
在当前这个信息化社会中,新信息技术革命使人类被日益增多的多媒体信息所包围。多媒体信息主要是由图像、文本和声音三大元素组成。图像作为其主要元素之一,发挥着越来越重要的作用。而传输和存储图像需要占用大量的数据空间,这严重影响了传输速率和实时处理量,极大地制约了图像通信的发展。在同等的通信容量下,如果图像数据可以压缩之后再传输,就可以使传输的数据量变得很小,也就能够增加通信能力。因此图像压缩编码技术受到了越来越多的关注及广泛的应用。如数码相机、USB摄像头、可视电话、视频点播、视频会议系统、数字监控系统等等,都使用到了图像或视频的压缩技术。
2.图像压缩的概念及原理
图像可以按其内容的运动状态分成静止图像和活动图像两大类。活动图像又称运动图像,沿用电视技术的术语,一般称其为视频。视频是指一组图像在时间轴上的有序排列,它是由一系列的二维空域(平面)图像沿时间轴所排成的序列,用以描写景物的状态和变化的过程。
习惯上,谈到图像概念时也包含视频。
图像压缩是数据压缩技术在数字图像上的应用,它以尽可能少的比特数代表图像或图像中所包含的信息量的技术,目的是减少图像数据中的冗余信息(数据冗余、符号冗余、视觉冗余等),从而用更加高效的格式存储和传输数据,提高传输速率,节省存储空间。
图像压缩,即去除多余的数据.以数学的观点来看,这一过程实际上就是将二维像素阵列变换为一个在统计上无关联的数据集合。简单来说,就是以较少的比特有损或无损地表示原来的像素矩阵的技术,也称图像编码。
图像数据之所以能被压缩,就是因为数据中存在着大量冗余,当图像被压缩后,非图像专家并不能看出与原图像的差别。冗余主要包括图像自身的冗余和视觉冗余。
图像数据的冗余主要表现为:图像中相邻像素间的相关性引起的空间冗余;图像序列中不同帧之间存在相关性引起的时间冗余;不同彩色平面或频谱带的相关性引起的频谱冗余。
而视觉冗余的产生主要是人类视觉系统对于图像场的任何变化,并不是都能感知的。事实上人类视觉系统一般的分辨能力约为26 灰度等级,而一般图像量化采用28 灰度等级,这类冗余我们称为视觉冗余。通常情况下,人类视觉系统对亮度变化敏感,而对色度的变化相对不敏感;在高亮度区,人眼对亮度变化敏感度下降对物体边缘敏感,内部区域相对不敏感;对整体结构敏感,而对内部细节相对不敏感,这些特性,都是我们进行图像压缩的依据。数据压缩的目的就是通过去除这些数据冗余来减少表示数据所需的比特数。由于图像数据量的庞大,在存储、传输、处理时非常困难,因此图像数据的压缩就显得非常重要。
3.发展现状
图像压缩编码技术的研究工作自1948 年提出电视信号数字化开始,至今己有50 多年的历史。50和60年代时,限于客观条件,仅对帧内预测法和亚取样内插复原法进行研究;70和80年代才开始对预测编码和运动补偿估值算法进行的研究。
目前数字图像压缩已取得了划时代的发展,在国际上形成了一系列国际标准,如JPEG 标准。此标准是负责开发静止图像压缩标准的“联合图片专家组”于1989 年形成的基于自适应DCT 的JPEG 技术规范的第一个草案,后经多次修改,最终在一年后形成国际标准。随着多媒体应用的不断增长,为满足人们在图像压缩领域的迫切需要,于2000 年联合图片专家组又研究出新一代静态图像压缩标准——JPEG2000。系列的国际标准的提出标志着数字图像压缩技术已由学术研究转为产业化,逐步走向成熟。它使通信、广播、计算机产业的界限变得模糊,促使现有信息产业的结构发生巨大改变,当前分形图像压缩和小波图像压缩是研究的新方向。
4.图像压缩编码的分类
实现图像压缩编码的方法有很多,对这些方法的分类也有很多。根据压缩过程有无信息损失,可分为有损编码和无损编码(信息保持型编码),或称不可逆编码和可逆编码。根据编码算法中是否采用自适应技术,可分为自适应编码和非自适应应编码。根据编码对象的不同,可分为静止图像编码、活动图像编码、传真文件编码;二值图像编码和多值(灰度)图像编码;黑白图像编码和彩色图像编码等等。最常见的方法是按照算法的原理进行分类。从实现方式来分,图像压缩编码可分为概率匹配编码、变换编码和识别编码三大类。图像通信中主要应用变换编码,包括帧内和帧间预测变换,去除空间和时间上的相关性。函数变换也能将图像间的相关性大量去掉,因而其压缩效率很高,并且有很多函数变换及快速算法,可以保证实时处理。为了获得最佳压缩编码效果,一般是多种方法兼用,或以某种方法为主而融入其他方法。常见的图像编码算法主要可分为如下几类:
4.1预测编码
预测编码是利用图像信号在局部空间和时间范围内的高度相关性,以已经传出的近邻像素值作为参考,预测当前像素值,然后量化、编码预测误差。最常用的是差分脉冲编码调制(D
PCM)。如果其中的量化器只有两个输出电平,则称为增量调制(ΔM)。根据图像局部的统计特性可以实现自适应预测,利用人的主观视觉特性可以实现自适应量化。如果预测编码系统中不使用量化器,则可以实现信息保持型预测编码。
与运动估值技术结合的运动补偿帧间预测是目前视频压缩编码系统中解除信号的时间轴冗余最常用和最有效的方法。
4.2变换编码
变换编码是将一组像素值经过某种形式的正交变换转换成一组变换系数,然后根据人的主观视觉特性对各变换系数进行不同精度的量化后编码的技术。正交变换的作用是解除像素值间的空间相关性,降低冗余度。用于图像编码的正交变换如离散傅里叶变换(DFT)、沃尔什-哈达玛变换(WHT)、哈尔变换(HRT)、斜变换(SLT)、离散余弦变换(DCT)、K—L变换(KLT)等。在上述这些变换中,除了K-L变换之外,都有快速算法。K-L变换是在最小均方误差准则下进行图像压缩的最佳变换,但因其变换矩阵随图像内容而异,因此一般无快速算法。K-L变换虽不宜用来进行实时编码,但在理论上具有重要意义,可以用来估计变换