小波在图像特征提取中的应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

小波理论课程设计论文题目小波在图像特征提取中的应用

专业

学号

学生

指导教师

摘要

在模式识别以及神经网络对图标的识别过程中,优化特征向量是首要的环节。本文通过二维小波在图像压缩以及分解的研究,提出了由图像生成特征向量的几个新思路,降低了特征向量的维数并有效保存原图像的信息。小波变换生成的特征向量在保存图像信息上显示了良好的优越性。这些方案在降低后续模式识别的计算量,提高识别率,改善识别系统性能方面,有良好的发展空间。

关键词:小波变换;图像特征提取;图标识别

一课题背景

在对图像的模式识别领域,特征提取与选择是一个很重要的问题。原始图像样本的特征空间维数很好,需要压缩维数以便进行分类,一种方式是特征提取,一种方式是特征选择。小波变换可以满足要求。

我在本科毕业设计是《BP神经网络对图标的识别》,其中很重要的特征提取部分,是提取一个图标图象的特征。当时采用的方法是把256*256的二值化图像矩阵转化成65536维的01向量,通过一族向量样本对神经网络的训练,得到一个训练过的网络,用它正确识别有破坏的图标。实际应用中,对于一个1/4部分完全破坏的图标的正确识别率能达到90%。

在设计中,渐渐突出而当时没有解决的问题有两个:一,这种直观的转化方式并没有有效的提取图标的特征信息。具体来说,图标的形状信息,高频边缘信息,轮廓等都没有充分利用,而只是简单的用65536个值笼统的代表图标,并没有真正的“描述”图像。这是影响识别率的一个重要的原因。二,这种处理方式的65536个输入值对于神经网络的输入来说是很庞大的,也就是说特征提取的时候并没有有效的对特征向量进行降维压缩。

本文正是在这个背景下,通过小波变换在图像压缩,图像的分解与合成中的应用的研究,寻求得到可以实现图像分类要求的特征向量的新思路和方法。

二小波压缩数字图像原理

2.1小波概述

众所周知,傅立叶分析是把一个信号分解成各种不同频率的正弦波,因此正弦波是傅立叶变换的基函数。同样,小波分析是把一个信号分解成由原始小波经过移位和缩放后的一系列小波,因此小波是小波变换的基函数,即小波可用作表示一些函数的基函数。

2.2小波变换和重构

小波变换的基本思想是用一组小波或基函数表示一个函数或信号,例如图像信号。以Haar小波基函数为例,基本Haar小波函数定义如下:

1, 当0≤x<1/2

Ψ(x) = -1, 当1/2≤x<1

0, 其他

设有一幅分辨率只有4个像素的一维图像,对应像素值为:[9 7 3 5]。用Haar小波变换的过程是:计算相邻像素对的平均值,得到一幅分辨率为原图像1/2的新图像:[8 4]。这时图像信息已部分丢失,为了能从2个像素组成的图像重构出4个像素的原图像,必须把每个像素对的第一个像素值减这个像素的平均值作为图像的细节系数保存。因此,原图像可用下面的两个平均值和两个细节系数表示:[8 4 1 -1]。可以把第一步变换得到的图像进一步变换,原图像两级变换的过程如表1所示:

解。这时经过一次小波变换得到是2维图像的近似值以及水平、垂直和对角细节分量值。显然,从2维图像的四个分解值值可以重构出原来的2维图像。

2.3 Marr的视觉理论

Marr猜想,由视网膜系统所提供的基本表达,是在不同尺度下的草图的一个有序的前后相继的序列,并且,尺度是按几何级数增加的,这些草图是由曲

线生成的。

ψ)(x, y)=0的曲也就是说,原始图像f(x, y)完全由一系列满足(f* iσ

线所决定。Mallat的后续工作提出Mallat算法,代表着对数字图像进行小波分析的极其独特的方面。

三特征向量生成新思路

回顾下问题,一是要有效的提取图标的特征信息;二是有效的对图像生成的特征向量进行降维压缩。在对小波理论的学习中,我渐渐对这两个问题有了新的体会和想法。

首先对于第一个问题,小波理论能够较好的解决这个问题,这与机器视觉的道理相同。金字塔算法可以对图像进行压缩,因为我们最后并不需要对图像进行重构,所以只需要提取图像的典型特征就可以。图像被分解成由一个尺度到相临尺度的独立信息,通过对所有样本图标小波变换,我们可以用小波变换系数作为特征向量,而且在不需要重构的条件下,只需要部分系数,比如256个,就可以对不同图标进行区别。

另一个方案是,参照Marr的视觉理论,图像可以由它的零穿越点和它们

ψ)(x, y)=0的曲线所的斜率值进行图像重构,图像可以由一系列满足(f* iσ

决定。而我们进行样本特征提取的时候,只需要提取小波变换的极大值点,或者只需要相应点处的极大值来作为特征向量,就能够达到对不同图标的区分。或者用满足零穿越的系列曲线的一条或者几条来代表一副图标。我们不需要重构图像,因此用这些信息做特征向量实现对图标的“区分”是可行的。这种特征提取方式得到的特征向量在模式识别中是否是可分的,简单的说,这种方式得到的特征向量是否能“唯一”代表一个图标,并在尽可能大的限度内抗干扰,从而达到较好的分类效果,是有待于在具体应用实践中考察的。但可以肯定的是,小波变换在图像的特征提取上,给出了一个“优化”的方案,因为这种方法在理论上是能够重构图像的。

我们选择Haar小波,对图像进行二级Haar小波分解,如下图所示:

图3-1 原始图像图3-2 小波分解结果从图中我们可以看到,Haar小波变换,提取了图像的细节信息,显然,由分解后的结果是可以完全恢复原图像的。

对于我们的要求,我们不需要重构原图,而只需要达到样本是可分的就可以,具体只要满足不同类样本间距离最大,而同类样本类内离散度矩阵最小就可以实现模式类的划分。在这里补充说明一点,在我的应用的范围内,“同类”是只原始图像和含有噪声的同一副图像组成的一类样本。

由于小波及小波包技术可以将信号或图像分层次按小波基展开,以可以根据图像信号的性质以及事先给定的图像处理要求确定到底要展开到哪一级为止,从而不仅能有效地控制计算量,满足实时处理的需要,同时也达到了对特征向量进行降维的目的。

对于第二个问题,我们希望用尽可能低维的特征向量作为神经网络的输入,这可以降低网络的运算复杂度。从这个角度上来说,在我们可以忽略图像细节,只需要提取每个图像各自特殊的主要信息的应用角度,我有下面的想法。记得在小波理论的第一堂课上,老师简单提到了图像的压缩,对我的启发很大。对于一个256*256的矩阵A,通过变换W’AW 转换成对角阵,对角线256个元素就可以代表压缩过的图像,从而实现了降维。这是与模式识别中的一种降维的思想是一致的。对应着模式识别中的方法类似于K-L变换,限于篇幅,本文只提出这种特征向量压缩的一个方案,而不做进一步的分析。

总之在应用中,我的理解就是不同空间“变换”或者说是“映射”的思想,把一个复杂的问题,或者具体说信号,“映射”到另一个空间,映射后的信号是简单容易描述的。小波理论在这个过程中给我们提供了强大的工具,提

相关文档
最新文档