图像压缩技术介绍.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图像压缩技术介绍
由于图像和视频本身的数据量非常大,给存储和传输带来了很多不便,所以图
像压缩和视频压缩得到了非常广泛的应用。比如数码相机、USB摄像头、可视电话
、视频点播、视频会议系统、数字监控系统等等,都使用到了图像或视频的压缩技术。
常用的图像的压缩方法有以下几种:
1、行程长度编码(RLE)
行程长度编码(run-length encoding)是压缩一个文件最简单的方法之一。
它的做法就是把一系列的重复值(例如图象像素的灰度值)用一个单独的值再加上
一个计数值来取代。比如有这样一个字母序列aabbbccccccccdddddd它的行程长度编码就是2a3b8c6d。这种方法实现起来很容易,而且对于具有长重复值的串的压缩编码很有效。例如对于有大面积的连续阴影或者颜色相同的图象,使用这种方法压
缩效果很好。很多位图文件格式都用行程长度编码,例如TIFF,PCX,GEM等。
2、LZW编码
这是三个发明人名字的缩写(Lempel,Ziv,Welch),其原理是将每一个字节的值都要与下一个字节的值配成一个字符对,并为每个字符对设定一个代码。当同
样的一个字符对再度出现时,就用代号代替这一字符对,然后再以这个代号与下个
字符配对。
LZW编码原理的一个重要特征是,代码不仅仅能取代一串同值的数据,也能够代替一串不同值的数据。在图像数据中若有某些不同值的数据经常重复出现,也能找到
一个代号来取代这些数据串。在此方面,LZW压缩原理是优于RLE的。
3、霍夫曼编码
霍夫曼编码(Huffman encoding)是通过用不固定长度的编码代替原始数据来实现的。霍夫曼编码最初是为了对文本文件进行压缩而建立的,迄今已经有很多变体。它的基本思路是出现频率越高的值,其对应的编码长度越短,反之出现频率越
低的值,其对应的编码长度越长。
霍夫曼编码很少能达到8∶1的压缩比,此外它还有以下两个不足:①它必须精确地统计出原始文件中每个值的出现频率,如果没有这个精确统计,压缩的效果就
会大打折扣,甚至根本达不到压缩的效果。霍夫曼编码通常要经过两遍操作,第一
遍进行统计,第二遍产生编码,所以编码的过程是比较慢的。另外由于各种长度的
编码的译码过程也是比较复杂的,因此解压缩的过程也比较慢。②它对于位的增
删比较敏感。由于霍夫曼编码的所有位都是合在一起的而不考虑字节分位,因此增
加一位或者减少一位都会使译码结果面目全非。
4、预测及内插编码
一般在图象中局部区域的象素是高度相关的,因此可以用先前的象素的有关灰
度知识来对当前象素的灰度进行预计,这就是预测。而所谓内插就是根据先前的和
后来的象素的灰度知识来推断当前象素的灰度情况。如果预测和内插是正确的,则
不必对每一个象素的灰度都进行压缩,而是把预测值与实际象素值之间的差值经过
熵编码后发送到接收端。在接收端通过预测值加差值信号来重建原象素。
预测编码可以获得比较高的编码质量,并且实现起来比较简单,因而被广泛地
应用于图象压缩编码系统。但是它的压缩比并不高,而且精确的预测有赖于图象特
性的大量的先验知识,并且必须作大量的非线性运算,因此一般不单独使用,而是
与其它方法结合起来使用。如在JPEG中,使用了预测编码技术对DCT直流系数进行编码,而对交流系数则使用量化+游程编码+霍夫曼编码。
5、矢量量化编码
矢量量化编码利用相邻图象数据间的高度相关性,将输入图象数据序列分组,
每一组m个数据构成一个m维矢量,一起进行编码,即一次量化多个点。根据仙农率失真理论,对于无记忆信源,矢量量化编码总是优于标量量化编码。
编码前,先通过大量样本的训练或学习或自组织特征映射神经网络方法,得到
一系列的标准图象模式,每一个图象模式就称为码字或码矢,这些码字或码矢合在
一起称为码书,码书实际上就是数据库。输入图象块按照一定的方式形成一个输入
矢量。编码时用这个输入矢量与码书中的所有码字计算距离,找到距离最近的码字
,即找到最佳匹配图象块。输出其索引(地址)作为编码结果。解码过程与之相反
,根据编码结果中的索引从码书中找到索引对应的码字(该码书必须与编码时使用
的码书一致),构成解码结果。由此可知,矢量量化编码是有损编码。目前使用较
多的矢量量化编码方案主要是随机型矢量量化,包括变换域矢量量化,有限状态矢
量量化,地址矢量量化,波形增益矢量量化,分类矢量量化及预测矢量量化等。
6、变换编码
变换编码就是将图象光强矩阵(时域信号)变换到系数空间(频域信号)上进
行处理的方法。在空间上具有强相关的信号,反映在频域上是某些特定的区域内能
量常常被集中在一起,或者是系数矩阵的分布具有某些规律。我们可以利用这些规
律在频域上减少量化比特数,达到压缩的目的。由于正交变换的变换矩阵是可逆的
且逆矩阵与转置矩阵相等,这就使解码运算是有解的且运算方便,因此运算矩阵总
是选用正交变换来做。
常用的变换编码有K-L变换编码和DCT编码。K-L变换编码在压缩比上优于DCT编码,但其运算量大且没有快速算法,因此实际应用中广泛采用DCT编码。
7、模型法编码
预测编码、矢量量化编码以及变换编码都属于波形编码,其理论基础是信号理
论和信息论;其出发点是将图象信号看作不规则的统计信号,从象素之间的相关性
这一图象信号统计模型出发设计编码器。而模型编码则是利用计算机视觉和计算机图形学的知识对图象信号的分析与合成。
模型编码将图象信号看作三维世界中的目标和景物投影到二维平面的产物,而对这一产物的评价是由人类视觉系统的特性决定的。模型编码的关键是对特定的图象建立模型,并根据这个模型确定图象中景物的特征参数,如运动参数、形状参数等。解码时则根据参数和已知模型用图象合成技术重建图象。由于编码的对象是特征参数,而不是原始图象,因此有可能实现比较大的压缩比。模型编码引入的误差主要是人眼视觉不太敏感的几何失真,因此重建图象非常自然和逼真。
此外,近些年来,分形编码编码和小波变换的技术也越来越多的应用在图像压缩的领域中,但是大多仍处于研究阶段,常见的图像压缩方法仍以前面介绍的为主。当然,在实际的应用中,多种图像压缩方法往往是结合起来使用的,如JPEG等。