图像检索中图像分割方法综述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2009年4月皖西学院学报A pr.,2009第25卷第2期Jo urnal o f West Anhui U niv er sity Vo l.25 NO.2
图像检索中图像分割方法综述
汪慧兰
(安徽师范大学物理与电子信息学院,安徽芜湖241000)
摘 要:图像分割是图像分析和模式识别需要解决的首要问题和基本问题,也是图像处理的经典难题。针对图像检索中应用的图像分割方法进行了系统论述,分析了各种方法的优缺点并探讨了图像分割技术的发展方向。具体介绍了基于颜色布局的分割方法,基于无监督的分割方法。
关键词:图像检索;图像分割;综述
中图分类号:T P391 文献标识码:A 文章编号:1009-9735(2009)02-0018-04
1 引言
基于区域的图像检索不仅能从整体上描述图像内容,而且通过对图像进行恰当的分割能鉴别出若干富有意义的图像区域以及这些目标区域之间的相互关系,以便在对象层描绘图像特征,使检索更加符合图像的语义。例如在图像库中搜索含有汽车的图像。为了代表图像的物体层,图像检索第一步就是抽取像素特征进行图像分割,分割后得到的各个不同语义区域,如果分割效果理想的话,这些区域将对应一个个物体。
图像分割一直是计算机视觉和图像处理的研究热点和难点,也是基于区域的图像检索系统的关键所在。因此图像分割的效果直接影响到区域特征的提取,进而影响到检索的效果。目前,图像分割至今为止尚无通用的自身理论,随着各学科许多新理论和新方法的提出,很多学者对目前提出的上千种图像分割方法作了综述[1][2]和分类。文献[1]将分割方法划分为基于数据驱动和基于模型驱动的分割方法;文献[2]将其划分为边缘检测、基于区域和其他方法。本文主要介绍近几年针对图像检索在图像分割中出现的新方法及新理论,分析各种方法的优缺点,并探讨图像分割技术的发展方向。
2 基于颜色布局的图像分割方法
2.1 图像分块
最早用于图像检索的分割方法是将图像进行分块,如Gong et al.[3],Chua et al.[4],Lu et al.[5], Pass et al.[6]为了代表图像的空间语义,首先将图像分块,然后从各个子块中抽取颜色特征,利用颜色空间直方图和颜色布局作为分割后的区域特征。还有B.M oghaddam et.al.[7]也将图像分成互不重叠的区域,这种方法虽然简单但不能准确代表图像目标区域的方法,且子块间的空间约束关系太强,对图像的旋转、平移等敏感。基于此,Stricker et al[8]将图像划分成5块互相交叠的区域,通过对区域中的像素和靠近边界的像素设置不同的权重,但也只能做到对目标的有限旋转不变性。
2.2 后向映射
Sw ain和Ballard[9]提出了后向映射算法,为支持大规模图像库中的快速查找,Smith和Chang提出了用颜色集(color sets)作为对颜色直方图的一种近似[10]同时和后向映射算法配合。他们首先将RGB 颜色空间转化成视觉均衡的颜色空间(如H SV空间),并将颜色空间量化成若干个柄。然后,他们用颜色分割技术将图像分为若干区域,每个区域用量化颜色空间的某个颜色分量来索引,从而将图像表达成一个二进制的颜色索引集。VisualSeek[11]是由哥伦比亚大学开发研制基于w eb的图像/视频搜索工具,它是最早基于区域的图像检索系统。系统所采用的视觉特性就是颜色集和基于小波变换的纹理特性。2.3 基于感兴趣点的方法
18
*收稿日期:2008-12-04
基金项目:教育部人文社会科学项目(05JC870012)。
作者简介:汪慧兰(1978-),女,安徽怀宁人,讲师,硕士研究生,研究方向:基于内容的视觉信息检索,模式识别。
基于感兴趣点的检测区域的方法[12]表现图像的高频特征,但是其计算复杂度高。张鹏等[13]借鉴心理学,基于视点转移和视区追踪的显著区域检测,其运算速度和抗噪能力比较好,但没对检测出的区域进行编组。
另外人们还提出了交互的方法[14],这种方法虽然在很大程度上表示了用户的检索需求,但是这对于大型的图像数据库显然是不合适的。
基于颜色布局的图像分割方法仅仅利用图像的低层特征,而不能够进行学习,从而不能很好地代表语义。为了使分割的区域更能代表图像的物体层次,同时能适应大规模的图像数据库的检索,最近人们提出了基于非监督学习的区域分割方法。
3 基于无监督学习的图像分割方法
3.1 聚类算法
Windsurf[15]和SIMPLIcity[16]中都使用K均值聚类算法,K均值算法就是通过最小化聚类的所有点与聚类中心的欧氏距离之和来将数据进行分类,它允许将一幅图像最多分成16个区域,该算法实现简单,应用也广泛,但它仅仅使用了颜色特征且其算法不允许聚类的交叠和无法处理有噪声的情况。Mirm ehdi and Petrouin Ref.[17]对颜色-纹理图像3 -D直方图使用聚类算法,形成高分辨率的图像区域。近年来有许多基于模糊技术的图像分割方法,基于模糊集合和逻辑的分割方法是以模糊数学为基础,利用隶属决图像中由于信息不全面、不准确、含糊、矛盾等造成的不确定性问题,如薛景浩[18]等人提出的一种新的基于图像间模糊散度的阈值化算法以及它在多阈值选择中的推广算法,采用了模糊集合分别表达分割前后的图像,通过最小模糊散度准则来实现图像分割中最优阈值的自动提取,该算法针对图像阈值化分割的要求构造了一种新的模糊隶属度函数,克服了传统函数带宽对分割效果的影响,有很好的通用性和有效性,方案能够快速正确地实现分割,且不需事先认定分割类数,实验结果令人满意。
3.2 JSEG方法
Yining Deng[19]等提出的JSEG方法对图像进行无监督的分割,它包括颜色量化和空间分割两个独立步骤,量化的颜色代表不同的区域,然后用滑动的窗口形成多分辨率的 J图像,区域生长技术应用于J 图像上。此方法能获得较为准确的区域,但其运算速度不高。
3.3 边流(edg eflow)分割法
Netra采用了边流(edgeflow)分割法[20],边流分割法通过不同属性图的边流向量的加权平均,可以检测出多种图像属性的综合边缘,它能检测出图像的颜色!纹理的边缘,边缘检测后,连接不连续的边缘形成封闭的轮廓,再进行区域合并。此方法几乎不需要参数调节,但是它不是完全自动的分割而需手工剪除一些无关区域。Netra[21]系统采用了基于边流法(edge flow)的图像分割,其为UCSB大学Alexandri a数字图书馆项目中用于图像检索的原型系统。
3.4 基于模型的方法
基于模型的方法是非常具有吸引力的,它提供了学习、分割的一个整体框架。其中最有影响力的模型就是马尔可夫随机场(M RF)模型。MRF描述了相邻像素间的相互关系,如Mukherjee et al.[22]用M RF从区域生长算法中获得初始分割,Yang et al.[23]也采用了M RF来分割图像。
近年来,一个新的基于模型的方法正逐渐引起人们的兴趣,那就是基于有限混合模型的方法。有限混合模型的应用已延伸到诸多领域,如模式识别、计算机视觉、信号与图像分析、机器学习等。
多维高斯混合模型。高斯混合模型理论比较成熟,能拟合任何形式的分布,从图像流形的观点来看,在图像分割领域也应该具有良好的前景。Blo b w or ld[24]采用了标准的期望最大法(EM)去确定图像特征空间的高斯混合密度模型的参数。该分割方法需要大量的人工参与,例如需要指定特征分布模型和聚类数目,但它克服了K均值法聚类不能交叠及无法处理有噪声的不足。
为了克服上面的问题,人们提出了改进的EM 算法,如Ueda et al.提出了分裂!融合的EM (SM EM)算法[25],Z.H.Zhang et al.还采用了分裂!融合的EM算法进行了图像分割的实验[26],J.Ver beek,N.Vlassis的贪婪EM(g reedy EM)算法[27], Figueiredo and Jain提出了Co mponent-w ise EM 算法[28],Sho ham提出了确定退火期望最大化算法(DAEM)和确定会聚最大化算法[29]。如唐英干等用高斯混合模型和DAEM算法的自适应图像分割[30]。
在众多的应用中,高斯分布的尾部比需要的要轻,而且参数的估计会受到关于分量的非典型(aty p ical)观测样本的严重影响,T分布比高斯分布有较重的尾部,它提供了一个比高斯分布更鲁棒的方法,如Peel&McLachaln[31]导出K-分量多维T混合模型参数的M L估计,用T混合模型建模特征比用高斯
19