基于直觉模糊集的图像相似性度量
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第22卷 第1期 模式识别与人工智能 V o.l22 N o.1 2009年2月 PR&A I F eb 2009 基于直觉模糊集的图像相似性度量*
徐少平1,2 张 华1 江顺亮2 叶发茂2 熊宇虹2
1(南昌大学机电工程学院江西省机器人与焊接自动化重点实验室南昌 330031)
2(南昌大学信息工程学院计算机科学与技术系南昌 330031)
摘 要 提出一种基于HSV颜色直方图的图像直觉模糊模型.在该模型下图像可看作是一个直觉模糊集合(IFS),图像之间的相似程度可通过计算直觉模糊集合之间距离来度量.实验数据表明:在H S V颜色空间下基于直觉模糊集的相似性度量能够有效用于图像数据库的查询,并且比普通基于模糊集的相似性度量和直方图距离在查询正确率方面提高5%~10%.
关键词 相似性度量,图像直觉模糊模型,H S V颜色直方图,基于内容的图像检索(CB I R)
中图法分类号 T P391.4
I m age Sim il arityM easure Based on Intuiti onistic Fuzzy Set
XU Shao P i n g1,2,Z HANG H ua1,JI A NG Shun L i a ng2,YE Fa M ao2,X I O NG Yu H ong2 1(K ey Laboratory of R obot and W eld i n g Auto m ation o f J iangx iP rovince,School of M echanical and
E lectrical Engineering,Nanchang Un iversit y,N anchang330031)
2(D epart m ent of C o mputer Science and T echnology,School of Infor m ation Eng i n eeri n g,
Nanchang University,Nanchang330031)
ABSTRACT
An i n tu ition istic fuzzy m odel for i m ages based on the H SV co lor histogra m is proposed.The i m age can be consi d ered as an i n tu ition istic f u zzy set(I FS)by th is m ode.l S i m ilarity m easures are ori g i n a lly
i n troduced to express the co mparison bet w een t w o fuzzy sets,and t h ey can be used to reflect the
rese mb lance o f i m ages.Experi m enta l resu lts show that the proposed approach can effic iently process queries o f an i m age database i n H SV color space and its accuracy rate is5%~10%h i g her than those o f
f u zzy si m ilarity m easures and conventi o na l h isto
g ra m distances.
K ey W ords S i m ilarity M easure,Intuitionistic Fuzzy M ode l o f I m age,H SV Co lor H istog ra m,Content Based I m age Retrieval(CB I R)
*国家863计划项目(N o.2007AA04Z242)、国家自然科学基金项目(N o.50863003,60863002)资助收稿日期:2007-12-03;修回日期:2008-02-27
作者简介 徐少平,男,1976年生,博士研究生,主要研究方向为机器视觉、计算机图形学.E m a i:l xushaoping@, forestxup@.张华,男,1964年生,教授,主要研究方向为机器人与视觉、机器人与焊接自动化、信号与信息处理.
江顺亮,男,1965年生,教授,主要研究方向为计算机仿真计算、人工智能.叶发茂,男,1978年生,博士,主要研究方向为数字图像处理、计算机图形学.熊宇虹,男,1971生,博士,主要研究方向为计算机图形学、数字图像处理.
1 引 言
图像(图块)之间的相似性度量在基于粒子滤波跟踪(Particle Filter Track i n g)、基于内容的图像检索(Con tent B ased I m age Retri e va,l CB I R)和模式识别等系统中是一个基础的核心功能模块,相似性度量准确率的提高对这些系统的应用水平有着重要的意义[1-6].由于颜色变化往往较纹理、形状等其它特征的变化对人眼的刺激大,并且对于旋转、平移、尺度变化甚至各种形变都不敏感,表现出一定的健壮性.同时其计算简单快捷、稳定,所以颜色往往作为描述图像视觉特征的首选,而颜色直方图则是描述颜色视觉特征最常用的数据结构[7-9].自1965年Zadeh提出模糊集理论以来,该理论迅速发展并在图像处理、模式识别、计算机视觉等领域得到广泛应用[1-2].T.Cha ira等人将图像颜色直方图重新按模糊集合理论进行解释,提出一种基于RGB颜色空间直方图的图像模糊模型,并在此模型的基础上利用模糊集合之间的距离作为CB I R系统检索图像相似性的度量[2].由于是在RGB颜色空间上工作,T. Cha ira的颜色直方图在各个颜色分量上量化级数较大.K.K onstanti n i d is等人则提出一种在LAB颜色空间下利用Fuzzy Linking技术大大减少颜色直方图的量化级数的方法,在CB I R系统执行查询时,效率比传统的基于颜色空间直方图距离度量有较大提高[1].
本文在T.Chaira等人工作的基础上,针对H SV 颜色空间模型的特点提出一种基于H SV颜色空间直方图的图像直觉模糊模型,在此模型下图像可看作是一个直觉模糊集合.基于此,可将直觉模糊集合之间的距离引入到图像相似性度量中[8-9].与普通的模糊集不同,直觉模糊集不但考虑隶属度和非隶属度信息,还增加了可疑度信息,能够更好的表征图像这个模糊系统[10-13].然而,目前关于直觉模糊集的讨论大多数还停留在理论上,针对具体的应用特别是在图像处理方面还很少,本文用直觉模糊集合距离表述图像相似性度量并将其应用到图像检索中是对这方面有益的探索[10,14].实验数据表明:在CB I R系统中采用本文直觉模糊集相似性度量能够比普通的模糊集相似性度量或直方图距离度量具有更好的性能.2 直方图与图像模糊化处理
2.1 直方图
直方图是一种简单而行之有效反映图像(图块)所包含像素点集颜色特征的描述器[1,7-8].灰度图像A规范化的直方图定义如下:
H A=(h(0),h(1) h(i), h(L-1)),
其中,分量
h(i)=
1
N u!A
i(b u), i=0,1, ,L-1,
L是图像灰度量化级数, i是在灰度i上的K ronecker函数,b u!{0,1, ,L-1}是图像位置u =(x,y)上的灰度值所属的索引,N为图像A的像素总数.如果图像A是用H SV颜色空间表达的彩色图像,那么h(i)为多维向量,则直方图的H A为多维直方图,H A(h,s,v)代表该直方图颜色索引(h,s,v)上的像素点个数与图像像素总数N的比值,
其中
157
1期 徐少平 等:基于直觉模糊集的图像相似性度量
0∀u A (x )+v A (x )∀1, x !X,
u A (x )和v A (x )的值分别代表元素x 对集合X 的隶属度和非隶属度.而元素x 对集合X 的可疑度可以表示为
A (x )=1-u A (x )-v A (x ), 0∀ A (x )∀1.直觉模糊集引入了可疑度信息,与人们通常思考处理问题的方式类似.很明显,模糊集是直觉模糊集的一个特例,即
A ={(x ,u A (x ),1-u A (x ))|x !X }, A (x )=0.理论上,直觉模糊集合由于比普通的模糊集合多考虑可疑度这个信息量,能够更好地刻画模糊系统内
在性质[10-12]
.3.1 H SV 颜色空间
[15]
图1给出了H SV(H ue ,Satura tion ,V a l u e)颜色
空间的圆锥模型和六棱锥模型.H SV 模型通过3个颜色分量来定义颜色:1)色调(H ue)范围0~360,每个值代表一种颜色,典型的值有:0代表红色,120代表绿色;2)饱和度(Saturation)取值范围0~255,0代表没有颜色,255表示某种颜色的最大值,纯度最高;3)亮度(Va lue),取值范围0~255,0代表黑色,255代表最大强度.选择在H SV 颜色空间上建立图像的颜色直方图并在它的基础上构建图像直觉模糊模型的原因有:1)该H SV 颜色模型与人类描述颜色的方式非常类似,对于颜色之间的距离表达直接自然,可以大大提高搜索特定颜色的效率,便于计算指定颜色的可疑度信息,这也是建立图像直觉模糊模型最为关键的地方.2)亮度信息对于区分彩色信息帮助不大,因此,在H SV 模型下建立颜色直方图可大大减小颜色分量量化级数的大小
.
(a)圆锥模型(b)六棱锥模型(a)Con ica l m ode l (b)H ex cone mode l
图1 H SV 颜色空间的圆锥和六棱锥模型F i g .1
Con ical and hex cone m ode ls o fH SV co lor space
3.2 图像直觉模糊模型
新的图像直觉模糊模型中某个颜色索引(h,s ,v)隶属度的定义与式(1)相同(即u A (h,s ,v)=
H A (h,s ,v)),求取指定颜色索引(h,s ,v )的非隶属度是新模型的关键任务.新模型求解指定颜色索引(h,s ,v)非隶属度的思想非常简单:即以像素之间在H SV 颜色空间的距离来度量像素之间的相关程
度,距离越远表示越不相关,距离超过一定范围就可认为不相关.所以在H SV 直方图中对于一个指定颜色索引(h,s ,v)的非隶属度可先通过找出离(h,s ,v )所含颜色距离超过一定阈值d (由用户设定)的那些颜色以及它们所属的颜色索引,然后计算这些颜色索引隶属度的累积和作为(h,s ,v)的非隶属度.故求取非隶属度的问题转化为在H SV 空间内如何度量二个像素点F i 和F j 之间的距离,以及如何快速寻找离F i 距离超过d 的像素点F j .像素点F i 和F j 之间的距离可以用Euc lidean 距离来度量,即 (F i ,F j )=
2
(m -m #)2+(n -n #)2
+(l-l #),
(2)
其中,(m,n,l)和(m #,n #,l #)分别为像素点F i 和F j 在H SV 空间中的坐标.由于亮度信息对区分颜色信息贡献不大,可将V 分量的量化级数设置为1(即V 分量不考虑),则H SV 颜色直方图简化为2维直方图,式(2)简化为
(F i ,F j )=
2
(m -m #)2+(n -n #)2
.
为了快速找到那些使得 (F i ,F j )的值大于d 的像素点F j .首先,考虑F i 、F j 像素点在H 分量上的差值,可将F j 的H 分量设置为m #=(m +180)%360以获得最大差值,这是在H SV 空间里面可获得的最大差值,所以像素点F j 应该在
((m +180)%360,0)~((m +180)%360,255)范围内寻找.其次,考虑S 分量取值的不同,可分为3种情况来最终确定在H SV 空间中那些像素点能够使得 (F i ,F j )的值大于d.当n ∀c ∃256,从((m +180)%360,(1-c)∃256)~((m +180)%360,255)范围内的像素点可认为是满足条件的像素点.这里c 是一个经验值,本文将它设置为1/4.当n %(1-c)∃256时,那么从((m +180)%360,0)~((m +180)%360,(1-c)∃256)范围内的像素点可认为是满足条件的像素点.当c ∃
256<n <(1-c)∃256时,从
((m +180)%360,n )~((m +180)%360,255)范围内的像素点可认为是满足条件的像素点.
基于以上讨论,如果在H S 直方图中某个指定颜色索引(h,s)的隶属度用u A (h,s)表示,那么非隶属度可以表示为
158模式识别与人工智能 22卷
v A(h,s)= sbins
n=s u A((h+hbins/2)%hbins,n),s!(
sbins
4
,
3∃sbins
4
)
s bins
n=s-s u A((h+hb ins/2)%hbins,n), s∀
sbins
4
s
n=0u A((h+hb ins/2)%hbins,n), s%
3∃sbins
4
其中,u A((h+hbins/2)%hb ins,n)是与指定颜色索引距离大于d的颜色索引的隶属度,hbin s、sbin s为H S颜色分量的量化级数,s为经验值,本文根据s 的取值不同将s设置为1~3.图像A的直觉模糊集合可以定义为
A={(h,s),u A(h,s),v A(h,s)}.
显然,新的图像直觉模糊模型不但考虑了隶属度信息和非隶属度信息,也同时考虑了可疑度信息,直觉模糊集合距离比模糊集合距离能更好地表征图像信息.
3.3 直觉模糊度量
本文在实验分析部分使用由文献[13]中给出了一种基于L p范数的直觉模糊距离,其定义为
L p(A,B)=
1 n
n
i=0
(|u A(x i)-u B(x i)|p+|v A(x i)-v B(x i)|p)1/p,
(3)
其中,A,B!I FS(X).L p(A,B)距离满足正定、对称、三角不等式性质,并且被证明与其它的直觉模糊集合距离相比是一种较合理的度量[12-13].从式(3)中可以很容易看出:当p=1时,L1(A,B)实际上是海明距离;当p&∋时,L∋(A,B)为H ausdoff距离.
4 实验及其分析
4.1 测试软件开发平台和运行环境
为了测试基于H SV颜色空间直方图的图像直觉模糊模型的图像相似性度量性能,将其应用到一个CB I R系统的搜索引擎中[1-2].CB I R系统使用I n tel公司提供的开源计算机视觉库OpenC V软件开发包作为开发平台,运行的环境为:AMD2500+处理器,512MB DDR内存,W i n do w s XP操作系统. CB I R系统采用的图像库与文献[1]相同,可从网址(H ttp://utopia.duth.g r/~konkons)下载.该图像数据库中图像大部分是从国际互联网中采集的,规格大小为72像素(72像素,共计约1200张图像,所涵盖的主题非常广泛且许多图像是从不同光照条件、角度和距离拍摄的,可充分考查各类相似性度量在CB I R系统中的性能.
4.2 正确率和查全率
在CB I R系统中,正确率和查全率是衡量相似性度量性能常用的指标.正确率(Prec ision)是检索到的图像中正确图像与检索图像总数的比例,查全率(recall)是指检索到图像与数据库实际存在相似图像的比例.通常,正确率和查全率一起使用可反映出某种相似性度量的优劣,由于事先已知道数据库中相似图像的具体数量,查全率可通过正确率反算出来,所以本文只使用正确率来衡量各种相似性度量的优劣.
4.3 对比实验及分析
文献[1]的测试用例中包含3组不同内容的相关图像集合,其中第三组图像(黄猫和白猫嬉戏图系列)存在旋转、尺度变化、光照、噪声、遮挡等各种因素的变化.本文主要在这一组图像上进行实验分析,用这样的图像集合可测试相似性度量在各种情况下鲁棒性.
图2(a)是文献[1]采用被称为Fuzzy L i n king的模糊度量执行的查询结果(图像以相似性的大小从左到右、从上到下的顺序降序排列,以下同),查询图像是第1张图像,从图中可以知道,当查询到13张正确的图像后出现的一个错误的图像.图2(b)是采用与(a)相同查询图像用新的基于直觉模糊集合相似性度量L1(A,B)所获得的图像集合,新度量仅仅在第20张图片才出现了错误,要优于前者.
为了全面评估新的基于直觉模糊集的相似性度量与其它类型的度量的性能,比较在全新方案下进行:1)仍以文献[1]中的第3组图像集合作为查询图像的测试集合,图像集合中每张图像均将作为查询图像,以查询正确率的平均值作为衡量图像相似性度量的优劣标准.由于这些图像中包含了各种类型的图像变化,故以平均正确率作为衡量标准是比较客观的;2)在不同颜色空间不同量化级数组合条件下执行多组查询,主要目的是为了测试各种度量在不同颜色空间下的正确率;3)测试各种类型相似性度量.主要包括普通的直方图匹配度量、普通模糊集度量和直觉模糊集度量3大类.测试数据如表1所示.在表1中,D4为Ch i Square直方图度量,D5为Bhattacharyya直方图度量,D7为Correlati o n度量,S1为M in M ax模糊度量,S4为Fuzzy divergence 模糊度量,S5为I nclusion m easure模糊度量,S13为M itchell直觉模糊度量,S16为Euclidean模糊度量, L1为海明直觉模糊度量,L∋为H ausdoff直觉模糊度量.
159
1期 徐少平 等:基于直觉模糊集的图像相似性度量
(a)文献[1]方法(a)M ethod i n literature [
1]
(b)本文方法(b)Proposed m e t hod
图2 2种方法检索到的图像集合对比
F ig .2 Co m parison of retrieval results usi ng t wo m ethods
实验数据表明:1)通过不同颜色空间的数据比
较可知:在H SV 空间下各种度量所完成的查询正确率普遍都在90%以上,而在其它颜色空间查询正确率普遍都低于90%,说明在H SV 空间下直觉模糊模型能够有效提高查询的正确率,大致能够提高5%~10%.例如,新的直觉模糊度量在H SV 颜色空间的直方图量化组合仅仅为6(6(1的情况下就已达到93.25%的正确率,而在LAB 颜色空间内获得同
样高的正确率,直方图所需要的量化级数大小至少为6(10(10,比H SV 空间要大16倍.量化级数越大意味者在相似性计算中所需要的时间和为保存这些直方图(图像特征)所需要的空间也越多,由此可见在H SV 颜色空间下图像直觉模糊模型节省的存储空间和计算时间非常可观.2)通过在H SV 空间各类相似性度量之间的数据比较可知:新的直觉模糊集度量所获得的正确率普遍比模糊集度量要高,这说明图像直觉模糊模型能够有效提高基于模糊集合理论的相似性度量的性能.虽然H SV16(4(1和H SV10(6(1量化级数组合条件下,直觉模糊集度量所获得的正确率比普通的直方图距离度量正确率要低一些,但是直觉模糊集度量在H SV 8(8(1、H SV 6(6(1和H SV 4(4(1量化级数组合条件下却可以超越或等同其它相似性度量,这说明量化级
数越小,直觉模糊集度量反而越好,体现了直觉模糊集度量具有较好的鲁棒性.3)图像的存储格式一般用RGB 颜色空间,虽然从RGB 空间转换到H SV 空间需要时间,但是考虑到目前大多数CB I R 系统在执行查询之前,均是将大量的H SV 直方图(图像特征)计算工作事先计算完成并以特征数据库的形式存在系统中,所以本文提出的在H SV 空间执行图像查询任务的方法没有时间转换的代价,仅仅需要建立查询图像的H SV 直方图,颜色空间之间的转换代价对新方法没有太大影响.4)新的基于直觉模糊集合的度量的计算公式中只包含加法和比较运算,而像Bhattacharyya 这些传统的直方图距离度量却包含了乘法和开方运算,其计算时间要高于新提出的度量方法[1-2,7]
.总之,新的相似性度量既可取得较高的查询正确率,执行速度也较快,因此具有较好的应用价值.
5 结束语
本文提出一种新的基于H SV 颜色空间直方图的图像直觉模糊模型,图像之间的相似性度量可用
直觉模糊集合之间的距离来表示.在CB I R 系统的查询中,与普通的模糊相似性度量和直方图距离度量相比具有更好的执行效率和准确率.未来的工作可将图像纹理,形状、边缘的因素考虑进相似性度量中,以进一步提高其性能
[16]
.本文所提出图像相似
性度量不但可用于CBI R 系统的搜索引擎,也可用于模式识别、运动对象跟踪、计算机视觉等应用程序
当中.
160模式识别与人工智能 22卷
表1 在不同颜色空间不同直方图组合的条件下各类相似性度量查询正确率比较
T ab le1 Query accuracy co m par ison among si m ilar i ty m easures i n d iffe rent co l or space w ith d ifferent hist og ram comb i nati on
% NO D4D5D7S1S4S5S13S16L
1
L∋
H SV16(4(199.2599.5090.7597.2594.2597.2595.7595.5098.0096.50
H SV10(6(197.5097.2583.0095.2589.7595.2593.7592.7595.0094.25
HSV8(8(192.7594.0082.5092.2586.7592.2593.2592.7594.2593.50
HSV6(6(193.0092.7581.7591.0087.2591.0092.0092.5093.2593.50
HSV4(4(192.5092.2577.2589.5088.0089.5091.5092.0090.7592.25
RGB4(4(487.7590.7582.0087.5084.2587.50))))
RGB8(8(889.7588.5082.7589.2582.0089.25))))
RG B6(16(1687.7588.5077.2587.5073.0087.50))))
RG B16(16(1689.2590.0079.5090.0072.5090.00))))
LA B3(5(587.2586.7576.2582.0079.5083.50))))
LAB6(10(1091.7593.2581.2589.7585.0089.75))))
LAB12(20(2091.5091.5069.7589.7577.2589.75))))
LAB16(16(1689.5090.2580.0089.2582.2589.25))))
L uv4(4(485.7587.7569.0076.0069.2577.00))))
L uv8(8(890.5091.7575.7588.7580.0088.75))))
Luv8(16(1692.5092.2575.5091.5080.7591.50))))
Y crcb4(4(480.0081.7558.7570.0061.0070.00))))
Y crcb8(8(886.7587.0075.7583.0074.5083.00))))
Y crcb16(16(1688.0089.0067.7587.0076.2587.00))))
参考文献
[1]K onstan ti n i d is K,Gasterat os A,And read is I.I m ageR etrieval Bas ed
on Fuzz y Color H istogra m Processi ng.Op tics C o mmun icati ons, 2005,248(4/5/6):375-386
[2]Ch ai ra T,R ay A K.Fuzzy M easures for C ol or I m age Retri eva.l
Fuzz y S ets and S yste m s,2005,150(3):545-560
[3]M a L,i C hang Faliang,Guo L iz h.i Non R i gid TargetTrack i ng Bas ed
on ColorH ist ogra m M atch i ng.Journa l of Q i ngdao T echnol ogicalU n i versity,2005,26(5):79-83(i n Ch i nese)
(马丽,常发亮,郭立智.基于颜色直方图匹配的非刚性目标跟踪算法.青岛理工大学学报,2005,26(5):79-83)
[4]Sun J und i ng,Zhang X i m i n,C u i Ji angtao,et al.A N e w Approac h
for I mage R etrievalB ased on Color and Spati a l Feat ures.C o m pu ter S ci ence,2005,32(6):158-160,184(i n Ch i n ese)
(孙君顶,张喜民,崔江涛,等.一种新的基于颜色和空间特征的图像检索方法,计算机科学,2005,32(6):158-160,184) [5]Chaira T,R ay A K.Region Extraction U s i ng Fuzzy S i m ilarityM eas
u res.Journ al of Fu z zy M athe m atics,2003,11(3):601-607 [6]C haira T,Ray A K.Fuzz y App roach f or C ol or Region Extracti on.
Pattern Recogniti on L etters,2003,12(24):1943-1950
[7]Vyt au tas P.D istance M easures f or PCA Based Faced R ecogn i ti on.
Pattern Recogniti on L etters,2004,25(6):711-724
[8]van derW eken D,Nach tegaelM,Kerre E E.U si ng S i m il arit yM eas
ures and H o m ogeneit y for t h e Co m pari son of I mages.I m age and V i s i on C o m pu ting,2004,22(3):695-702
[9]van d erW eken D,Nach t egaelM,K erre E E.Co m b i n i ng N ei ghbor
hood Based and H i s t ogra m S i m ilari tyM eas u re for t h e Des i gn Quality M eas u re.I mage and V ision Compu ti ng,2007,25(2):184-195
[10]L i Dengfeng,Cheng Chunti an.Ne w S i m il ari ty M easures of In t u
i ti on isti c Fu z zy Sets and App lication to Pattern R ecogn iti on.Patt ern
Recogn iti on L etters,2002,23(1):221-225
[11]Grzegorz e w s k iP.D i stances bet w een In t u ition i sti c Fuzzy Sets and/or
In terval Valued Fuzzy S ets Based on H ausdorff M etri c.Fuzzy S ets and Syst e m s,2004,148(2):319-328
[12]H ung W L,Yang M S.S i m il arit y M easures of Intu iti on i sti c Fuzzy
Sets Bas ed on Lp M etric.International Jou r n al ofApprox i m at e R ea son i ng,2007,46(1):120-136
[13]H ung W L,Y ang M S.S i m il arit y M easure of Intu i ti on isti c Fuzzy
Sets Based on H au s dorff D istance.Pattern Recogn i ti on Lett ers, 2004,25(14):1603-1611
[14]Ch ai ra T,Ray A K.A N e w M eas u re Us i ng Intu i ti on isti c Fu zz y S et
Theory and Its App li cati on t o Edge Det ecti on.App lied Soft C o mpu ti ng,2008,8(2):919-927
[15]H earn D,Bak er P M.C o m pu ter G raph i cs w i th Open GL.3rd Ed i
ti on.Upper Sadd l e R iver,USA:Prenti ceH al,l2006
[16]Gagaudak is G,Rosi n P L.Incorporati on Shape i n to H istogra m s f or
CB I R.Pattern Recogn iti on,2002,35(1):81-91
161
1期 徐少平 等:基于直觉模糊集的图像相似性度量。