基于灰度直方图和边界方向直方图的图像检索
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于灰度直方图和边界方向直方图的图像
检索
摘要:针对用传统灰度直方图方法检索图像效果不佳的问题,提出了结合灰度直方图和边界方向直方图的方法。灰度直方图反映了灰度图像的整体亮度特征,而忽略了图像的空间分布。而边界方向直方图则表征了图像的形状特征。论文综合使用图像的颜色特征与形状特征进行图像,实验结果表明相比使用单个特征提高了检索正确率。
关键词:图像检索,灰度直方图,边界方向直方图
1 前言
随着互联网的发展,人类的生活已与网络密不可分。网络共享的资源包括数目众多的文字、图像及视频等数据。而如果用户需要从大量的图像中搜索到自己需要的一副图像,就需要应用图像检索技术。图像检索技术包括基于文本的图像检索技术(text-based image retrieval,TBIR)和基于内容的图像检索技术(content-based image retrieval,CBIR)。TBIR依靠人工对图像进行文字注解,利用文本检索实现对图像特征的查找。由于文字很难反映图像中的完整内容,且费时费力,CBIR技术已渐渐不能适应图像检索的需求。CBIR利用图像自身具有的颜色、纹理、形状及区域等特征,依靠例图在图像数据库中进行检索,实现了图像视觉内容特征的检索。由于能更好地满足用户对图像的检索需求,CBIR 成为图像检索技术研究的主流。
灰度图像作为数字图像的一大类,具有灰度分辨率高的特点,包含了十分丰富的图像信息。在MATLAB中,可以将数字图像转化成灰度图像,计算其灰度直方图作为图像的一个特征。
形状特征是图像的一种基本特征,也是人类视觉系统进行物体识别时所识别的关键信息之一。边界方向直方图具有尺度不变性, 能够比较好的描述图像的大体形状。
综合特征检索就是综合图像的颜色、形状、纹理或空间位置等特征表示,计算图像特征向量。各个特征间应有一个权重关系,由用户根据需要进行调整,以适应不同情况的查询。本文采用的检索方式就是综合颜色特征和形状特征的图像检索,与单个特征检索相比,多特征组合的图像检索提高了检索正确率。
2 数字图像表示
数字图像,又称为数码图像或数位图像,是二维图像用有限数值像素的表示。数字图像是由模拟图像数字化得到的、以像素为基本元素的、可以用计算机或者数字电路存储和处理的图像。
像素是数字图像的基本元素,像素是在模拟图像数字化时对连续空间进行离散化得到的,每个像素具有各自的行、列坐标,同时每个像素都具有整数灰度值或颜色值。
每个图像的像素通常对应于二维空间中一个特定的点,并且有一个或者多个与那个点相关的采样值。根据这些采样数目及其特性的不同,数字图像可以划分为:二值图像、灰度图像、彩色图像等。
二值图像(Binary Image)图像中每个像素的亮度值(Intensity)仅可以取自0到1的图像。灰度图像(Gray Scale Image)也称为灰阶图像图像中每个像素可以由0(黑)到255(白)的亮度值表示。0-255之间表示不同的灰度级。彩色图像(Color Image)是由三幅不同颜色的灰度图像组合而成,一个为红色,一个为绿色,另一个为蓝色。
为了计算图像的灰度直方图,需要将彩色图像转化成灰度图像。而图像由彩色图像转化为灰度图像有三种方法,分别为加权法、均值法。最大值法。本文采用加权法,即设一幅彩色图像某一像素点的红、绿、蓝颜色值分别为R、G、B,设转换后该像素点的灰度值为Gray,则灰度值由下式得到。
Gray=0.3*R+0.59*G+0.11*B
3灰度直方图
3.1 灰度直方图的定义
一幅数字图像的灰度直方图就是一个灰度级的离散函数,可以用下式来表示图像灰度直方图的定义。
H(i)=n i
N
,i=0,1,……,L−1
其中i表示灰度级,L表示灰度级种类数,n i表示图像中具有灰度级i的像素的个数,N表示图像总的像素数。公式描述的是图像中具有该灰度出现的频率。
图像的灰度直方图提供了图像外观的一个全局描述,所提取的特征具有RST
不变性,即旋转、比例和位移不变性,缺点是不能有效地表示图像的空间信息。如下图所示,图b为图a的灰度直方图。
(a)(b)
图1.图像灰度直方图
3.2 直方图均衡
针对灰度直方图存在的问题,我们需要提出改进的算法。Stricker提出了累积颜色直方图方法。累积直方图方法是以灰度值为横坐标,每种灰度出现的频数作为纵坐标。故累积颜色直方图表示方法如下。
其中,K是图像的特征取值,L是特征可取值的个数。n i是图像中特征取值为k的像素值的个数,N是图像的总像素值。在累积直方图中,相邻颜色在频数上是相关的。虽然累积直方图的存储量和计算量有很小的增加,但是累积直方图消除了直方图中常见的零值问题,经过累积处理,可以保持两种颜色在特征轴上的距离与它们之间匹配的相似程度成正比关系。除了累积直方图外,还有许多改进的算法,如梁艳梅等提出了一种基于直方图模糊相关的彩色图像检索算法等。
4 边界方向直方图
通常情况下,形状特征有两类表示方法,一类是轮廓特征,另一类是区域特征。图像的轮廓特征主要针对物体的外边界,而图像的区域特征则关系到整个形状区域。而边界直方图即通过对边界特征的描述来获取图像的形状参数,作为一副图像区别于其他图像的特征。
先讨论图像边缘检测。常用的边缘检测算子有Roberts算子、Sobel算子、
Prewitt算子、Canny算子等。一副图像是由很多离散的像素点组成的,这些算子将用差分近似偏导数。Canny算子是目前最好的图像边缘检测算子。它是高斯函数的一阶导数,是对信噪比与定位之乘积的最优化逼近算子。Canny算子的实现是一个多阶段的处理过程,首先对图像进行Gaussian平滑,然后对于平滑后的图像进行一个Roberts算子运算。
用I[i,j]表示图像,使用可分离滤波方法求图像与高斯平滑滤波器卷积,得到一个平滑数据阵列:
S[i,j]=G[i,j;σ]∗I[i,j]
其中,σ(取σ=1)是高斯函数的散步参数,控制平滑程度;S[i,j]为平滑后的数据阵列;G[i,j;σ]为高斯平滑滤波器。
平滑后的数据阵列S[i,j]经过Roberts算子得到x、y上的分量:
P[i,j]≈(S[i,j+1]−S[i,j]+S[i+1,j+1]−S[i+1,j])/2
Q[i,j]≈(S[i,j]−S[i+1,j]+S[i,j+1]−S[i+1,j])/2变换后的图像为
D[i,j]=|P[i,j]|+|Q[i,j]|
这样就得到了Canny方法运算以后的边缘图像。在此边缘图像的基础上就可以简历边界方向直方图H[i]。为了计算方便,本论文中对边界方向以10度为范围进行划分形成一个36级的方向直方图,最后采用欧式距离来衡量两个边界方向直方图的距离。边界方向不受图像中对象的位置的影响,为了达到尺度不变性,可对得到的边界方向直方图进行归一化处理:
H[i]=H[i]/S
其中,S为图像的面积。
(a)灰度图(b)用Canny算子提取的边缘图像(c)边界方向直方图
图2 边界方向直方图