图像分割方法综述【文献综述】
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
文献综述
电子信息工程
图像分割方法综述
摘要:图像分割是图像理解的基础,图像分割的算法研究越来越受到关注,早期的图像分割算法在之后的研究中得到完善。活动轮廓模型是图像分割和边界提取的重要工具之一,主要包括了参数形式活动轮廓模型和几何形式活动轮廓模型两大类,本文对这两类模型进行了大概的说明,简单叙述了相对的优点,如几何活动轮廓模型在变形的过程中能处理曲线拓扑变化。鉴于活动轮廓模型所存在的缺点,提出了水平集算法,使得计算的范围和简易程度有了很大的发展。最后指出了图像分割的算法还有一些进一步优化的研究发展方向。
关键词:图像分割,参数活动轮廓模型,几何活动轮廓模型,水平集
1.引言
对图像进行处理,通过图像分割、目标分离、特征提取、参数测量等技术,将原始的图象转化为更抽象更紧凑的形式,使得更高层的图像分析和理解成为可能。其中图像分割已经越来越受到人们的关注,作为一种图像处理与计算机视觉操作的预处理手段,已经应用到了很多的领域,图像分割可以定义为:根据图像特征对图像进行区域划分[1]过程,图像分割的效果好坏会直接影响到后续的处理结果,所以图像分割是一个基本而又关键的技术,为此人们提出了很多有效的、具有鲁棒性的分割算法。图像分割方法有很多,按知识的特点和层次可分为数据驱动和模型驱动两大类[2],前者有Roberts算子、Sobel算子和Canny算子、阈值分割、分水岭算法和模糊聚类分割算法等;后者是直接建立在先验知识的基础上的,如基于活动轮廓模型的图像分割。水平集的应用领域是隐含曲线(曲面)的运动[3],现在水平集已经广泛应用于图像恢复、图像增强、图像分割、物体跟踪、形状检测与识别、曲面重建、最小曲面、最优化以及流体力学中的一些方面。
一个好的图像分割算法应具有以下特点:1、有效性,能将图像中感兴趣的区域或目标分割出来的有效规则。2、整体性。能得到图像中感兴趣区域或目标的无断点和离散点的封闭边界。3、精确性,分割所得到的感兴趣区域或目标边界与实际情况贴近。4、稳定性,算法受噪声的影响性很小。
5、自动化,分割过程不需要人工的干预。但是让一种具体的图像分割方法全部满足上述特点是很难的,各种图像分割的方法都存在着必然的局限性,所以只能根据不同的适用领域和所要分割的图像区域特征来选择所对应的图像分割方法。
2.早期的图像分割方法
早期的图像分割方法,根据方法所利用的图像特征,分为边界法和区域法两类[4]。前者是根据
区域间像素特征的突变性或不连续性实现;后者是通过架设分割结果的某子区域具有一定的相似性质,而不同区域的像素没有共同性质,即通过判断区域的相似性来进行的分割。它们都存在着各自的优点和缺点,基于区域分割的方法,常见的有:阈值法[5]
,常用的并行区域分割技术,阈值是用于区分不同目标的灰度值,选择合适的阈值是该分割法的关键;区域生长法:从图像的某个像素出发,按一定的准则对领域像素点进行判断,将符合要求的像素点逐步加入,至满足一定条件时终止。此方法计算简单,但需要人为的设置初始点,对噪声敏感;分裂合并法:从整个图像出发,不断分裂成各个子区域,按照一定条件对前景区域进行合并,该方法虽分割效果好,但算法复杂,计算量大,也有可能破坏区域的边界等。基于边缘的分割算法可分为并行边缘检测和串行边缘检测两种[6],并行边缘检测是基于图像边缘处的灰度值不连续性,而利用微分算子进行检测,常用的有Roberts 算子,Prewitt 算子,Sobel 算子,Laplace 算子,Marr 算子,Krisch 算子等。而串行边界分割不但利用了本身像素的信息,还利用了其他已处理的像素信息,常用的算法有边界跟踪。在实际应用中,为了更好的分割效果,经常把各种的分割算法结合起来用,这也成为了图像分割的重点研究方向之一。 3.图像分割的发展
3.1参数形式的活动轮廓模型(snake 模型)
()()()()()()[]⎰⎰+==101
0int snak e c E E ds s c E s c E ds s ext (2-1) 1987年,Kass 等人提出来参数活动轮廓模型(Snake 模型),(2-1)为Snake 模型的能量函数表示,将一系列的图像处理问题统一的转换为能量极小化的问题。跟其他传统方法一样,传统的参数活动轮廓模型存在很多的局限性,由于模型是由演化曲线自身的内力和图像信息的外力构成的,由内力约束它的形状,外力引导它的行为,模型外力的作用范围小是很大的缺陷,而且,这个方法对轮廓的初始位置敏感,不能收敛到轮廓的凹陷区域及处理拓扑变化,计算复杂度也很高。针对外力的缺陷,在后期的研究中产生了很多改进版的模型,Cohen 等人在模型外力中,为了使得模型轮廓在图像同质区域内能够稳定的进行收敛,增加了一项气球膨胀力。Xv 等人提出的GVF(Gradient Vector Flow)模型和广义GVF (Generalized GVF )模型,这两个模型在扩大外力作用范围上有很大的帮助,同时也可以扩大收敛的凹陷区域。Li 等人提出的VFC(Vector Field Convolution)模型在有上述作用的基础上,同时对图像噪声具有一定的鲁棒性[7]
。
由于传统的参数轮廓模型采用的是变分法来极小化能量模型,而变分法需要较高阶次的求导和对能量函数连续的要求,导致数值计算的稳定性较差和一些约束性条件不能有效的运用。Amini 等人提出的基于动态规划(Dynamic Programming ,DP )的优化算法可以去掉变分法的求导过程,但是计算复杂度是O (3nm ),Williams 和Shah 在此基础上提出了一种局部最优的贪婪优化算法(Greedy
Optimization )在保持动态规划等优点的基础上,使得计算复杂降为O (nm )。
3.2水平集方法
水平集(Level Set )函数以隐含的方式表达基于几何活动轮廓模型的轮廓曲线运动[8],最先是由Osher ,Sethian [9]提出,当时提出是用来求解描述火苗外形变化的偏微分方程。水平集方法是将演化曲线()t s C ,嵌入到比它高一维的水平集函数()t y x ,,φ中,得到()()(){}
0,,,,==t y x y x t s C φ。传统的水平集函数定义如(2-2)所示,其中()()()t s ,C y x ,d ,表示坐标()y x ,到曲线C 的距离。嵌入其中的曲线C 随着高维函数φ的变化而变化,所以当φ是被确定的时候,曲线C 一定是确定的。 ()=t y x ,,φ()()()()()()()()()()()()⎪⎩
⎪⎨⎧-t s C outside y x if t s C y x d t s C at y x if t s C inside y x if t s C y x d ,,,,,,,0
,,,,, (2-2)
水平集方法的优点如下: a.能较容易的实现低维向高维的扩展,能轻易的将二维平面演化问题扩展到三维闭合曲面上,有利于实现三维立体图像的分割。
b .演化曲线的几何特征可以用水平集函数()t y x ,,φ直接计算出来。
c .水平集函数()t y x ,,φ的零水平集可以自然的处理变拓扑结构。
d.只要速度函数F 保持为连续的光滑函数,水平集函数()t y x ,,φ就始终为可微函数,从而利用离散的有限差分法实现其数值近似算法。
3.3几何形式的活动轮廓模型
几何活动轮廓模型是由Caselles 等人与Malladi 等人分别独立提出的首个水平集活动轮廓模型
[10],基于曲线进化理论和水平集的思想,先将平面闭合曲线隐含的表达为二维曲面函数的水平集,再通过曲面的进化来隐含的求解曲线的进化,相对于Snake 模型,可以处理曲线的拓扑变化、对初值不敏感、具有稳定唯一的数值解。最初的几何轮廓模型对于边缘不明显或不连续的图像处理效果不理想[11]。Caselles 等人通过测地活动轮廓模型(geodesic active contour )解决这个问题,当轮廓曲线越过正确的物体边缘的时候对曲线修正,该模型采取了与原始Sanke 模型相似的设计模式,以间接的方式来设计轮廓线的演化方程。测地活动轮廓模型关于演化曲线C 的能力泛函被定义为(2-3),其中g 表示图像的边缘指示函数。
()dp p C E ∂∂=⎰1
0G g C (2-3) 测地活动轮廓模型的水平集方程可以写为(2-4)