基于小波和神经网络的图像压缩方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
收稿日期:2009-12-20
作者简介:罗忠亮(1973-),男,湖南桂阳人,韶关学院计算机科学学院讲师,博士研究生,主要从事图像处理及生物特征识别的研究.
韶关学院学报·自然科学Journal of Shaoguan University ·Natural Science 2010年3月
第31卷第3期基于小波和神经网络的图像压缩方法
罗忠亮
(韶关学院计算机科学学院,广东韶关512005)
摘要:针对图像压缩中压缩率与图像质量的折衷问题,综合利用小波变换和神经网络各自的优点,采用小波和神经网络的方法进行图像压缩.该算法先对图像进行小波分解,保留低频系数,然后将高频系数输入训练的网络进行矢量量化编码达到压缩的目的,最后根据保留的低频系数和还原的高频系数重构图像.
关键词:图像压缩;小波变换;神经网络;峰值信噪比
中图分类号:TP301文献标识码:A 文章编号:1007-5348(2010)03-0025-04
随着多媒体业务和通信技术的不断发展,数字图像中所包含的数据量日益庞大,如何让这些庞大的数据在网络中方便、快捷地传输,这对图像信息的存储和传输技术提出了挑战,而图像数据压缩技术是解决这个问题的关键[1-4].通过图像冗余数据的减少可达到图像压缩的目的,在保证图像质量的条件下实现图像压缩.由于小波具有良好的时频局部特性和变焦特性并且能很好地体现人眼的视觉特性,而神经网络具有自学习、自适应性、强鲁棒性、高度并行处理能力和推广能力[5,6].把小波和神经网络结合起来进行图像压缩一直是人们关注的问题.图像经过小波变换后分解为高频子带和低频子带,其中低频分量集中了信号的主要信息,高频部分表现为信号的细节信息.由于人的生理特性决定对细节信息的不敏感,故利用小波可以实现信号压缩的同时尽大可能地保留信号的主要成分[6].采用小波变换和神经网络的方法进行图像压缩,实验证明比单纯BP 神经网络或小波变换有较高的信噪比和压缩率.
1神经网络模型
1985年,Ackley 和Hinton 等人首次把多层前馈神经网络模型用于数据压缩变换.上世纪80年代中后期,神经网络的研究取得很大进展,涉及的应用领域非常广泛.
BP 网络可直接提供数据压缩能力.利用多层前馈网络的模式变换能力实现数据变换的基本思想[2]:把一组输入模式通过少量的隐含层单元映射到一组输出模式,并使输出模式尽可能等于输入模式.当隐含层的单元数比输入模式数少时,就意味着隐含层能更有效地表现输入模式,并把这种表现传送到输出层.
用于图像压缩的神经网络包括输入层、隐含层和输出层,隐含层的节点上小于输入节点数,输入节点数与输出节点数相同.学习时,图像数据既送到输入层,又送到输出层作为教师信号,所使用的学习算法为算法网络训练好后,输入层到隐含层为网络的编码过程,对图像数据进行线性或非线性变换,从隐含层到输出层为网络的解码过程,对经过压缩后的变换系数进行线性或非线性变换,恢复图像的原始数据.
用于学习的图像有N ×N 个像素点,各像素灰度值被量化为m 比特(共2m 个可能的取值).2m 个灰度值按线性关系转化成0~1之间的数值作为网络的输入和期望输出(教师模式).网络随机地抽取各n ×n 图像块作为学习模式,用BP 算法学习.通过调整网络中神经元间的连接权值,使训练集图像的重建误差E=f-g 的均值达到最小.训练好的网络隐含层神经元矢量(经量化)便是数据压缩的结果,而输出神经元矢量便是Mar.2010Vol.31No.3
韶关学院学报·自然科学2010年
重建的数据.其过程可用图1表示:
图1BP网络的计算模型
2基于小波和神经网络的图像压缩原理
2.1图像经小波变换获得系数特征
通过对图像做小波分解可得到一系列不同分辨率的子图像,包括细节图像和近似图像.其中细节子图像大部分系数都接近零,因此,图像的能量主要集中在低频子带上,高频子带所占有的能量很少.
从理论上说,由于f具有指数α∈(0,1)的Holder连续的充要条件[7]是:
|(Wψf)(a,b)|=
取a=2-j,b=k2-j,所以当j较大时,即高频时,小波变换(Wψf)(2-j,k2-j)的绝对值较小,而当j较小时,即低频时,小波变换的绝对值较大.故在高频部分压缩时,其压缩比可以较大,而在低频部分时,其进行压缩比可以较小,从而达到较好的压缩效果.
2.2基于神经网络的矢量量化方法
矢量量化技术从20世纪80年代开始逐步完善起来,1980年由Linde,Buzo和Gray将聚类算法引入到矢量量化器中,提出了著名的矢量量化码书设计算法,即LBG算法.矢量量化的过程可以看成是从K维欧氏空间R K到其中一个有限子集Y的映射[8].
将图像分解后的小波系数看作是一个m维向量,然后把这m个数据截成M段,每段k个数据,形成M 个k维数据向量,接着将这个M向量分为N组,每组用一个数据向量作为代表.设第i组的代表向量为y i,i=1,2,…,N.图像压缩时利用图像上数据向量的代表量来表示的,如果属于第i组,则这个数据向量就用这组的代表向量y i代替,此时编码就是在码书的相应位置上记下编号i,不必记下y i本身.记录y i的文件称为密码书.
2.3基于神经网络的向量量化压缩
分类聚类问题是人工神经网络的主要功能之一,而无监督的聚类问题是指人工神经网络的学习表现为自适应于输入空间的检测规则,其学习过程为:给系统提供动态输入信号,使各神经元以某种方式竞争,“获胜者”神经元本身或其领域将会得到增强,进一步抑制其它神经元,从而将信号空间划分为有用的多个区域.
把M个k维向量作为网络的M个输入样本,所分组数N作为神经元个数,通过一定的算法使网络学习,训练结果将使M个样本以一定规则分为N类,而神经元与输入样本向量之间的连接权值w ij(i=1,2,…,N, j=1,2,…,k)就是第i组的中心向量.
网络学习是将图像数据送入输入层作为训练样本,不断调整各层间的连接权值,使网络的输出均方差