图像压缩技术浅析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

图像压缩技术浅析
图像压缩技术是目前计算机应用领域的一项热门技术。

随着计算机技术、现代通信技术、网络技术和信息处理技术的迅速发展,图像作为一种重要的信息载体已经成为应用最广泛的信息表现形式之一。

但是由于未经处理的图像本身数据量非常大,这给图像的传输、存储及加工处理等方面带来了极大的困难,要消除上述三种图像应用中的困难,关键对图像进行压缩。

图像实现压缩的过程要付出较大的计算量,但相对于图像压缩的意义又是非常值得的。

图像实现压缩的意义在于减少数据存储量,节省存储数据时的存储空间和CPU处理数据的时间;降低数据率以减少传输时的使用带宽,节省传输时间;压缩图像的信息量,便于特征抽取,为识别做准备。

图像数据能够实现压缩主要有两个方面的原因:一是图像数据中有许多冗余,包括时间冗余、空间冗余等,用某种数学的方法来表示图像使原始图像数字化从而消除冗余,用这种方式表示的图像还能恢复到图像的原始状态属于无损压缩范畴;二是利用人眼的生理因素,人眼对图像的细节和某些颜色的辨别能力存在着一个极限,把超过这个极限的部分去掉,也可以达到压缩目的,但这种方式表示的图像数据有丢失不能恢复到图像的原始状态,属于有损压缩范畴。

本文首先介绍了图像压缩技术的背景、发展历史和图像压缩的基本原理和图像能够实现压缩的理论依据以及图像压缩的分类应用,并对图像压缩编码的相关研究现状进行了综述性分析,然后对基于哈夫曼编码算法的图像压缩方法及具体实现进行研究,其中重点介绍了哈夫曼(Huffman)编码的原理和算法及其衍生算法,并对几种不同的压缩算法进行了简单的比较,得出结论哈夫曼编码能够实现对图像数据的无损压缩,并且得出哈夫曼编码在有着广泛应用的同时已不再是压缩算法的全部,而经常与其它的压缩算法相结合被当作最终的编码方法,如JPEG压缩算法。

本文充分利用哈夫曼编码简洁方便的特性,摒弃了传统的JPEG压缩算法中要进行哈夫曼编码前先进行图像转换、DCT变换等复杂的过程,结合BMP图像的结构和特点,提出了一种更为简洁的可以实现无损压缩的哈夫曼编码方法,即单纯基于哈夫曼编码算法实现对256色BMP图像数据部分的压缩方法。

该算法有两个互逆过程:压缩和解压缩。

随着计算机技术、现代通信技术、微电子技术、网络技术和信息处理技术的迅猛发展,以可视电话、电视会议、数字音视频为主要内容的多媒体通信将逐步取代模拟语音电话、数据、传真成为目前通信业务的主要内容。

图像和多媒体业务的发展需要存储、处理和传输各类静止的和活动的图像信息,与文字信息不同,图像信息需要大的存储容量和宽的传输信道,虽然通信技术得以较快的发展,但是仍然无法满足需要实现大规模图像数据库或传输高分辨率实时图像信息的场合。

面对数字图像数据量巨大的问题,对图像信息进行有效的压缩成为解决上述问题的必要手段,图像压缩(编码)算法和技术成为近年来一个活跃的研究领域。

人类感受世界的最重要的手段就是视觉,据科学研究表明,在人类所接受的信息
中,大约70%[1]是通过视觉获得的图像得到的。

图像信息具有数据信息量大、直观及确切的特点,具有高的使用效率和广泛的适应性。

随着计算机技术和通信技术的发展,其处理图像的能力逐渐提高,图像信息已经成为通信和计算机系统的一种重要处理对象。

计算机要处理自然界中的图像信息,必须首先要将连续的模拟量图像转换为计算机能够进行存储、传输和处理的离散的数字信号,但是图像的数字化带来了一个重要的问题:海量数据的传输和存储。

未经压缩的数字化的图像数据量[2]是非常巨大的,一般的网络传输速率是无法满足实时的应用要求的,通过对图像进行压缩,可以为图像的存储和传输等提供可靠的保证。

目前与图像相关的处理与分析技术已广泛的应用于办公自动化、工业机器人、地理数据处理、医学数据处理、地球资源、遥感、交互式计算机辅助设计等领域[3]。

图像处理与分析涉及到数学、计算机科学、模式识别、人工智能、信息论、生物医学等多种学科,是一门多学科交叉应用的技术[4]。

1.1.2图像压缩基本原理
图像信息是一个二维的样本值序列[5]:
≤0,


,[(1-1)
],
n
i s≤
m
j
j
i
m和n分别表示图像s在垂直和水平方向的宽度;样本]
,[j
i s表示图像在位置]
i
,[j 的亮度。

彩色图像一般每个位置用三个数值表示,分别与红、绿、蓝三基色分量相对应。

在实际应用中如果要确定一幅图像的参数,要考虑的因素有图像的容量和图像输出的效果,在扫描生成一幅图像时,实际上就是按一定的图像分辨率和一定的图像深度对模拟图片或照片进行采样,从而生成一幅数字化的图像。

图像的分辨率越高、图像深度越深,则数字化后的图像效果越逼真、图像数据量越大。

如果是按照像素点及其深度映射的图像数据大小可用下面的公式[6]来估算:
图像数据量⨯
=(1-2)
数据总的像素
图像深度/
8Byte

)
如根据上面的公式一幅640×480真彩色的图像,其数据量约为:
640=
MByte
⨯/(1-3)
480

1
8
24
这仅仅是一幅比较小的图片,如果再大一点的图片如用普通的数码像机照的图片大都在三、五兆,甚至十几兆,一些需要精度较高的场合,如陆地卫星遥感、医学医疗等方面使用的图片的数据量就更大了,可见未经压缩的图像数据量很大,这对数据存储提出了很高的要求,一般的网络传输率无法满足实时的需求。

无论是从经济还是技术的角度,现在的情况是单纯靠硬件的支持并不能满足人们的需要,真正使制约因素不再成为瓶颈的方法还是图像压缩技术的应用。

图像压缩的依据主要有两个方面,一是图像信息中存在这大量的冗余度,二是利用人的视觉特性,在不影响视觉的情况下,以一定的失真换取数据压缩,以满足数据压缩的要求[7]。

(1)图像信息的冗余度可以通过结构和统计两个方面体现。

冗余度方面表现为很强的空间(帧内)和时间(帧间)相关性;信息统计上的冗余度来源于被编码信息符号概率密度的不均匀性,采用变字长编码对压缩率极为有利。

Shannon第一定理给出了每个信源符号可以达到的最小平均码长为信源的熵。

表明,只要码率超过熵,全部信息可以无失真地编码。

(2)人眼对图像的空间分辨率、时间分辨率和对比度分辨率的要求有一定的限度,人眼对上述三种分辨率的分辨能力是相互制约的。

根据人眼的视觉特性,根据图像的局部特点来决定采样频率和量化精度。

数字图像编码任务是减少或消除输入图像中的各种冗余,在一定的保真度准则下使用最佳的编码方法,其整个编码过程如图1-1所示
图1-1 数字图像编码系统基本结构
映射器:对图像的信息形式进行映射,解除或削弱信号内部的相关性,降低结构冗余度;
量化器:在满足图像质量和视觉要求的前提下,减少信号的精度;
统计编码器:消除被编码信息所含的统计冗余度。

因为信号映射和统计编码是两个可逆的过程,而量化即采样是不可逆的,所以在无损压缩中,不包含量化这个环节。

1.1.3图像压缩的意义
与文字信息不同,图像信息需要大的存储容量和宽的传输信道,给人们的信息交流(传输)、信息的保留(存储)带来很大的困难。

图像压缩,已经成为现代信息社会研究中的一个热点问题,寻求一个快速的图像压缩算法以及解压缩算法,对于许多以图像数据为基础的应用场合具有非常重要的意义。

研究高效的图像数据压缩编码方法,即怎样处理、组织图像数据,在应用领域中的作用将是至关重要的,图像数据压缩编码技术已经成为多媒体及通讯领域中的关键技术之一。

图像压缩编码技术推动了各类图像信息通信系统的推广应用。

它是各类图像信息传输、存贮产品的一项核心技术。

图像压缩的动机是非常明显的,能否用一种
压缩的形式来表示并存储图像信息,是能否提高图像信息的传输、存储及加工处理等方面应用的关键技术。

图像压缩编码的目的和意义就在于如何利用有限的传输和储存资源来传输和保存更多的信息。

对图像信息实现压缩的好处[8]在于:
1、减少数据存储量,节省存储数据时的存储空间和CPU处理数据的时间。

图像压缩编码是为了减少数据的存储容量,以利信息的保存。

如果说数据库是一个桶,那么单位数据的体积越小,同一数据库存储的信息也就越多。

一般的卫星图像的4个信道的平均压缩比为2,也就是说,同一容量的数据库可以成倍地增加有效库存。

2、降低数据率以减少传输时的使用带宽,节省传输时间。

图像压缩编码有利于图像数据传输。

由于数据压缩是一种“去伪存真,去粗取精”的筛选,又由于可以用“代码”表示一组数据,所以压缩后的数据非常“精干”,这样就可以极大地减少必须传输的数据量,以满足人眼和机器分析的要求。

3、压缩图像的信息量,便于特征抽取,为识别作准备。

图像压缩编码便于特征提取,以利于计算机模式识别。

如用计算机对卫星图像中不同类型的农作物进行分类时,使用图像压缩方法,只要考虑区分植物与非植物的特征以及区分植物类型特征即可,从而减少了数据量又满足了实际需要。

压缩技术经过几十年的发展,现在来说还是比较成熟的。

1.2一般图像压缩方法
图像压缩技术从1948年提出的电视信号数字化[9]到今天已经有60多年的历史了,在19世纪80年代后期以来,随着小波变换理论、分形理论、人工神经网络理论及视觉仿真理论的发展,图像压缩技术得到更快更好的发展。

图像压缩编码的分类方法颇多,其中一种分类将图像编码分为平均信息法、预测编码法和变换编码法[10]。

平均信息法是对每个像素单独处理,常用的方法有:脉冲编码调制、熵编码、行程编码和位平面编码;预测编码法是利用相邻像素间的相关性,去掉图像中冗余的信息,对有用的信息进行编码,常用的方法有增量编码、微分预测编码、自适应技术等;变换编码方法是通过对信源建立相应模型预测图像源数据,去掉其空间冗余度。

当前常用的图像压缩方法有:JPEG压缩、JPEG2000压缩、小波图像压缩、分形图像压缩和基于区域的图像压缩方法[11]等。

JPEG压缩[12]方法首先将图像进行分块处理,然后对分成的互不重叠、大小相等的每一块进行而为离散余弦变换,使得离散后的系数具有不相关和低频的特点,根据量化表对系数进行量化。

量化后的系数按zigzag扫描重新组织,然后进行哈夫曼编码。

JPEG压缩具有标准化和在中、高比特率上保证良好图像质量的优点,但由于一般情况下图像是高度非平稳信号,很难用Gauss过程来刻画,图像中如边缘信息等突变结构比图像平稳性重要,用余弦基作为图像信号的非线性逼近不是最优的选择,所以JPEG
算法具有在高压缩比时产生严重的方块效应,除此之外,JPEG是有损压缩并具有压缩比不高的缺点。

JPEG2000编码[13]过程分为预处理、核心处理和位流组织等几个内容。

预处理包括图像分片、直流电平位移和分量变换;核心处理由离散小波变换、量化和熵编码组成;位流组织包括区域划分、码块、层和包的组织。

JPEG2000相对JPEG格式的图像压缩提高了10—30个百分点,而且压缩后的图像更细腻平滑。

JPEG可以通过对系统参数的改变实现图像的有损和无损压缩。

小波变换[14]是根据Mallat塔式快速小波变换算法进行多分辨率分解对图像进行编码。

首先对图像进行多级小波分解,然后对每层的小波系数进行量化,在对量化后的系数进行编码。

小波图像压缩已经那个形成了如MPEG-4、JPEG2000等国际压缩标准。

当前常用于基于小波变换的图像压缩方法有嵌入式小波零树图像编码(EZW)、分层树中分配样本图像编码(SPIHT)及可扩展图像压缩编码(EBCOT)等。

分形压缩[15]是利用图像自相似的特点,通过迭代函数系统实现,是以迭代函数系统定理和拼贴定理为理论基础发展起来的。

分形图像压缩首先将待压缩的图像进行分割,然后将每一个分割后的子图像对应一个迭代函数,以迭代函数存储子图像,压缩率与迭代函数的复杂程度有关,迭代函数越复杂,其压缩率就越小。

根据分形的特征不同,可以将分形图像编码划分为:尺码编码法方法、迭代函数系统方法和A-E-Jacquin 的分形方法。

以上这几种编码的方法都试图充分利用计算机图形学、计算机视觉、人工智能与模式识别等相关学科的研究成果,为图像编码开拓出广阔的前景。

但是由于这些编码方法增加了分析的难度,所以大大增加了实现的复杂性。

从当前发展情况来看,分形编码等方法仍处于有待深入研究的阶段,目前还存在许多明显的不足:如分形法由于在图像分割、迭代函数系统代码的获得非常困难,因而实现起来时间长,算法异常的复杂,因而难以实现和应用;模型法则仅限于人头肩像等基本的图像上,进一步的发展有赖于新的数学方法和其它相关学科的发展;神经网络的工作机理至今仍不清楚,硬件研制很不成功,所以在图像编码中的应用研究进展缓慢,目前多与其他方法结合使用。

在前面介绍的各种图像编码方法中,有有损压缩也有无损压缩。

对于图像的有损压缩,目前已可以取得比较令人满意的效果;对图像进行无损压缩的研究虽一直没有停顿过,但图像的无损压缩效果却一直很不理想。

而无损图像压缩在医学、军事、遥测等众多领域仍然有广泛的需求。

因此无损压缩仍然是今后的一个研究重点,能够实现无损压缩的方法具有特别重要的意义。

本文将介绍一种非常简洁的可以实现无损压缩的编码方法——基于哈夫曼(Huffman)编码在图像压缩编码中的应用情况。

1.3.1主要工作
本课题为“基于哈夫曼编码图像压缩系统的设计与实现”,首先对图像压缩技术的背景、发展历史和图像压缩的基本原理以及分类应用进行了详细的分析,并对各种不同的压缩编码方法进行的比较,然后选用了适合图像无损压缩的较为简单的哈夫曼(Huffman)编码方法,对哈夫曼(Huffman)编码的原理和算法及其衍生算法进行了详细的说明,为后面压缩系统的实现打下基础,最后,利用Visual Basic 6.0作为编程开发工具,从几种压缩算法中选用了一种较好的压缩编码算法——哈夫曼(Huffman)编码算法,开发实现了一个对256色BMP图像进行压缩和解压缩的软件系统,并对该系统作了相应测试分析。

工作的重点是研究对各种压缩编码方法,并对其中的经典算法进行了分析,在此基础上探寻对图像进行无损压缩的算法,以期提高无损图像压缩的性能,缩短算法的执行时间。

1.3.2设计目标
用Visual basic 6.0编程语言编程实现利用编码中的哈夫曼(Huffman)编码标准压缩256色的BMP文件,并实现包括BMP图像的显示、压缩和压缩信息显示以及解压等功能,其具体流程是:
图1-2 设计流程图
第二章图像压缩技术综述
本章节主要介绍了图像压缩的基本概念,图像压缩相关理论和相关技术的研究,图像压缩的性能指标和常用的图像压缩技术及分类,图像压缩技术的发展趋势及前景等。

2.1图像压缩的定义
图像压缩是对图像采用不同的表达方法以减少表示图像所需的数据量[16]。

压缩的理论基础是信息论,数据冗余造成表达图像数据的比特数浪费,减少这些冗余可以达到数据压缩的目的。

图像压缩编码的研究属于信息论中信源编码范畴,按不同的分类方法可以分为不同的编码类别。

按统计特性可分为熵编码、预测编码和变换编码等,按解码算法的精度可分为有损编码和无损编码,按空间冗余特征和变换域冗余特征可分为空域编码方法和变换域编码方法。

图像编码压缩的目的是对要处理的图像信源数据按一定的规则进行变换和组合,从而达到以尽量少的比特数来表征图像,同时尽可能好的复原图像的质量,使它符合预定应用场合的要求。

2.2图像压缩的相关技术研究
2.2.1图像数据表示方法
图像可以用一个二元函数f(x,y)[17]表示,图像是连续的,即f,x,y的值为任意实数,为了用计算机表示图像信息,需要将连续的图像进行离散化,离散化后的图像就是数字图像。

用2维数组f(x,y)表达数字图像,离散化后的f,x,y都是取整数值。

数字图像中的单元称为图像元素,简称像素(pixel)。

图像在空间上的分辨率与其包含的像素的个数成正比。

像素个数越多,显示的图像细节越详细,图像就越清晰。

连续图像在数字化过程中,需要进行采样和量化两个过程。

图像坐标的离散化叫做图像采样,灰度值的离散化称为灰度量化[18]。

图像采样主要解决从连续图像信号中选取信号进行量化从而获得不失真的数字表示的问题,由二维采样定理解决,是奈奎斯特采样定理的推广应用。

图像模型是f(x,y)这个函数特征的逻辑与定性的描述:
图像模型
感知模型局部模型整体模型(景物感知)(采样于重建图像量化统计模型)(景物分析图像理解模型)
图2-1图像模型
2.2.2图像常见表示方法
1、灰度图像的表示
灰度图像是物体的二维光强函数[19]f (x ,y )(0≤f (x ,y )≤L -1),其中x ,y 是空间点的坐标,任意点(x ,y )处的数值f(x ,y)正比于图像在该点的亮度(灰度级L ),非负有界二变量实函数表示一幅灰度图像,它是在空间的坐标和亮度上均已离散化的图像。

可以把一幅灰度图像考虑维一个矩阵,其行和列表示图像中的一个点,而相应的矩阵中元素的值表示出该点的灰度级。

如果灰度级全是黑白两种颜色,则称为二值图像。

2、彩色图像的表示
一般常用三原色[20](RGB )(红色、绿色、蓝色)模式来表示彩色图像,所以彩色图像一般可以表示为:
)},(),,(),,({),(y x f y x f y x f y x f b g r c = (2-1) 其中f c 由),(),,(),,(y x f y x f y x f b g r 组成,分别表示r (红色)、g(绿色)、b (蓝色)这三种灰度在图像坐标系中点(x ,y )的灰度值。

表示颜色的另一种方式是YUV (色差模式),使用亮度、饱和度和色度,表示如下:
● 亮度定义为r 、g 、b 之和,即:
b g r ++=亮度 (2-2)
● 饱和度表示某一颜色与全色的接近程度:
)(),,m in(31b g r f b g r ++-=饱和度 (2-3) ● 色度近似正比于该颜色的平均波长:
)/()(hue)b g r b g r b g r ++++=λλλ色度( (2-4)
式中λr 、λg 、λb 分别为红、绿、蓝三色的中心波长。

2.2.3 图像压缩算法评价
对于一个压缩编码方法优劣主要有三个重要的衡量指标:压缩比、压缩和解压速度、解压缩的图像质量[21]。

压缩比常用编码效率和压缩比进行衡量,编码效率定义为图像的熵与平均码长之比。

设图像灰度级集合为},,,{21N S S S ,对应的概率分别为)}(,),(),({21N S p S p S p 图像的熵定义为:
)(log )()(21i N
i i S p S p S H ∑=-= (2-5)
单位:比特/字符。

图像的熵描述了图像灰度集合的比特数均值,及图像源的平
均信息量。

设i S 对应的码长为)(i S l ,平均码长为:
)()(1i N
i i S l S p L ∑=-= (2-6)
编码效率为:
L
S H )(=η (2-7) 压缩比L
n r =,为编码前后平均码长之比。

衡量图像处理或图像通信系统的重要指标是图像的质量。

图像质量含有图像的逼真度和图像的可懂度两方面的含义。

图像的逼真度指的是被评价图像与原标准图像的偏离程度,而图像的可懂度是指图像向人或计算机提供信息的能力。

目前常用的评价标准有客观准则和主观准则两种。

1)客观准则
在图像压缩中,客观准则对压缩还原后的图像与原始图像的误差进行定量计算,从而对图像进行评价。

一般是对图像或指定区域进行某种计算,以得到对图像进行评价的指标。

客观准则中常用的评价指标有:均方误差、均方根误差、信噪比(常用峰值信噪比)等。

2)主观准则
主观准则是通过选择一组评价者对待评价图像进行打分,对图像得分进行平均从而得到一个主观评价分。

有妨碍尺度准则和质量尺度准则两种评价标准,对于非专业人员多采用质量尺寸准则,而对于专业人多采用妨碍尺度。

客观评价和主观评价之间有一定的联系,可以进行组略转换。

除了上述两种基本的图像评价方法外,还有其他一些评价标准。

ISO 在制定MPEG -4标准时提出了基于感觉的质量评价和基于任务的质量评价两种视频图像质量评价方法。

2.3图像无损压缩技术的发展状况
图像的编码按照对图像的压缩与还原程度可分为有损压缩和无损压缩。

有损压缩在编码过程中丢失一些图像中的次要信息,可以获得大的压缩比,但是在重建原始图像中,因图像信息的丢失不能精确的进行还原。

而无损压缩仅仅去除图像中的冗余信息,图像在压缩过程中没有丢失信息,从而可以保证完整的重建图像,但压缩比较有损压缩要小的多。

虽然无损压缩的压缩比较低,但是在某些领域中是非常必要的,如在图像对象需要进一步的处理、图像的要求质量未知、图像的获取代价昂贵等。

近年来无损压缩在医学图像、遥感图像、高精度图像分析、历史文档、艺术作品的保存等领域的应用越来越广泛。

在无损压缩的基础上研究压缩比高、压缩的实时性好、可靠性高的压缩算法,具有一定的理论意义和使用价值。

对无损压缩的研究大致分为基于预测的方法和基于变换的方法两个研究方向[22]。

基于预测的编码方法由简单的DPCM 固定预测转向自适应统计上下文模型的预测方向发展,其中,LOCO -I 算法已成为无损压缩标准JPEG -LS 的核心算法;在预计变换。

相关文档
最新文档