基于形态学梯度和分水岭的图像分割算法研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

目录
摘要 (I)
Abstract (IV)
1 绪论
1.1 图像分割的重要意义和应用前景 (1)
1.2 图像分割方法研究现状 (3)
1.3 本文主要内容 (10)
2 边缘检测
2.1 概述 (11)
2.2 常见的几种边缘检测算子 (12)
2.3 几种边缘检测算子的性能比较 (18)
2.4 本章小结 (20)
3 数学形态学
3.1 概述 (21)
3.2 膨胀与腐蚀 (22)
3.3 形态学开运算和闭运算 (25)
3.4 多尺度形态学算子 (27)
3.5 本章小结 (28)
4 基于分水岭和多尺度形态学梯度算子的图像分割算法
4.1 分水岭算法介绍 (29)
4.2 本文分割方案设计 (31)
4.3 颜色空间的选取 (33)
4.4 彩色图像的边缘信息提取 (34)
4.5 形态学滤波 (36)
4.6 多尺度形态学梯度的计算与调整 (37)
4.7 本章小结 (43)
5 全文总结 (44)
致谢 (46)
参考文献 (47)
附录1 攻读硕士学位期间发表论文目录 (50)
附录2 算法仿真程序 (51)
1 绪 论
1.1 图像分割的重要意义和应用前景
在对图像的研究和应用中,人们往往只对图像中的某些部分感兴趣。

这些部分就称之为目标或者前景,其他部分称之为背景。

目标一般对应于图像中的特定的、具有某种独特性质的区域。

为了辨识和分析目标,就需要将有关区域分离提取出来,只有在此基础上才能够对目标作进一步的处理,如特征提取、识别等等。

图像分割就是指把图像分成各具特性的区域并提取出感兴趣的目标的技术和过程。

这里的特性可以是灰度、颜色、纹理等,目标可以对应于单个区域,也可以对应于多个区域。

图像分割是由图像处理到图像分析的关键步骤,也是一种基本的计算机视觉技术。

这是由于通过图像分割、目标分离、特征提取、参数测量等技术可以将原始图像转化为更抽象更紧凑的形式,使得更高层的图像分析和理解成为可能。

图像分割多年来一直得到人们的高度重视。

图像分割的定义[1]如下:
对一幅图像(),g x y ()max max 0,0x x y y ≤≤≤≤进行分割就是将图像划分为满足如下条件的N 个子区域(),i g x y ,1,2
,i N =
1)
()()1,,N i i g x y g x y ==, 即由所有子区域组成整幅图像;
2) (),i g x y 是连通的区域,连通性是指在该区域内存在连接任意两点的路径; 3) ()(),,i j g x y g x y =∅ (),1,2,,i j N i j =≠,即任意两个子区域不存在公共元素;
4) 区域(),i g x y 满足一定的均匀性条件,所谓均匀性(或相似性)是指区域内所有像素点满足灰度、纹理、颜色等特征的某种相似性准则。

在人类接收的信息中有80%来自视觉或者说为图像(Image)信息,这包括图像、图形(动画)、视频、文本、数据等,这是人类最有效和最重要的信息获取和交流方式。

随着计算机的普及,人们越来越多地利用计算机来帮助人类获取与处理视觉图像信息。

虽然自然界给予了人类一个完美、强大的视觉系统,能够处理、分析和理解各种视觉
信息,但是,迄今为止还没有一个被人类建造的自主视觉系统的性能能够达到理想的水平高度。

其中的重要原因之一就是:高等生物的视觉系统能够很容易完成极端复杂的分割任务,而机器视觉的分割技术却很难达到相应的分割速度及精度。

因此,研究出一门快速有效的图像分割技术成为了推动机器视觉技术发展的关键之一。

另外,随着互联网与多媒体技术的发展,人们已经不满足于把图像看成简单的像素矩阵,而希望能将其表征成多个有意义的对象的组合,进而实现视频的交互功能及基于内容的图像/视频检索、浏览、编辑与合成等,这些功能的实现都依赖于一个好的图像分割工具。

建立在MPEG-4标准[2]之上的基于内容的视频编码体系的性能,很大程度上取决于图像分割算法的准确性。

同样,建立在MPEG-7标准[3]基础上的多媒体数据库中图像视频的检索、浏览等,其功能的实现也同样依赖于分割,以实现视频/图像内容的特征提取。

然而,这些新的多媒体标准仅对分割出的对象的编码作了规定,至于如何得到这些对象并没有作规定,也即图像分割方法是开放的。

因此,好的图像和视频分割工具是这些基于内容的图像/视频编码、检索标准能够在各个领域中得到广泛应用的最基本前提。

图像分割在其它领域的应用也非常广泛,并涉及各种类型的图像。

例如,在工业监控应用中,分割燃烧炉中的火焰以便监测燃烧过程[4]等;在农业应用中,图像分割被用于户外植物的检测[5]等;在遥感应用中,分割合成孔径雷达图像中的目标[6]或遥感云图中的不同云系和背景分布[7][8]等;在医学应用中,脑部MR图像分割成灰质(GM)、白质(WM)、脑脊髓(CSF)等脑组织和其它非脑组织区域(NB)[9][10];在交通图像分析中,把车辆目标从背景中分割出来[11]等。

在所有这些应用中,分割通常是为了进一步对图像进行分析、识别、压缩编码等,分割的准确性直接影响后续任务的有效性,因此具有十分重要的意义。

但是,图像分割一直是机器视觉及多媒体应用技术中最困难的问题之一,虽然提出了许多分割技术,但还没有一个比较完美的方法[12][13]。

尽管针对某一特定的应用场合或者特定种类的图像。

出现过这样或那样较为有效的分割方法,但至今为止还没有一种通用的、可靠的自动分割算法。

可以预见,在未来的几年内,迫切需要解决的分割问题仍将是研究的热点。

1.2 图像分割方法研究现状
图像分割是图像处理中的一项关键技术,自20世纪70年代起一直受到人们的高度重视,至今已提出上千种分割算法。

但因尚无通用的分割理论,现提出的分割算法大都是针对具体问题的,并没有一种适合所有图像的通用分割算法。

根据图像分割过程中所使用知识的多少,可将图像分割按技术分成:信号层技术、物理层技术和语义层技术。

信号层技术在图像分割过程中纯粹基于数字图像中的数值;物理层技术在图像分割过程中使用了有关图像生成的知识;而语义层技术则在图像分割过程中还使用了有关景物类型的领域专用知识。

另外,还没有制定出选择适用分割算法的标准,这给图像分割技术的应用带来许多实际问题。

最近几年又出现了许多新思路、新方法或改进算法。

对一些经典方法和新出现的方法作了概述,并将图像分割方法分为阈值分割方法、边缘检测方法、区域提取方法和结合特定理论工具的分割方法4类。

1.2.1 阈值分割方法
阈值分割方法的历史可追溯到近40年前,现已提出了大量算法,对灰度图像的取阈值分割就是先确定一个处于图像灰度取值范围之中的灰度阈值,然后将图像中各个象素的灰度值都与这个阈值相比较,并根据比较结果将对应的象素分为两类。

这两类象素一般分属图像的两类区域,从而达到分割的目的。

从该方法中可以看出,确定一个最优阈值是分割的关键。

现有的大部分算法都是集中在阈值确定的研究上。

阈值方法分为全局阈值和局部阈值两种,如果分割过程中对图像上每个像素所使用的阈值都相等,则为全局阈值方法;如果每个像素所使用的阈值可能不同,则为局部阈值方法。

最佳全局阈值的确定的常用方法一般有下面几种:试验法,直方图法,最小误差法(这种方法是假设背景和前景的灰度分布都是正态分布的)。

当光照不均匀、有突发噪声,或者背景灰度变化比较大时,整幅图像分割将没有合适的单一门限,因为单一的阈值不能兼顾图像各个像素的实际情况。

这时,可对图像按照坐标分块,对每一块分别选一阈值进行分割,这种与坐标相关的阈值称为动态阈值方法,也称为自适应阈值方法。

这类方法的时间和空间复杂度比较大,但是抗噪声能力比较强,对采用全局阈值不容易分割的图像有较好的效果。

自适应阈值选取的比较简单的方法时对
每一个像素确定以它为中心的一个邻域窗口,计算窗口内像素的最大和最小值,然后取它们的均值作为阈值。

对图像分块后的每一个子块可以采用直方图分析,如果某个子块内有目标和背景,则直方图呈双峰。

如果块内只有目标或背景,则直方图没有双峰,可根据邻域各块分割得到的参数插值进行分割。

实际的自适应阈值分割完全可以根据图像的实际性质,对每个像素设定阈值,但这个过程要考虑到实际的要求和计算的复杂度问题。

目前提出了许多新方法,如严学强[14]等人提出了基于量化直方图的最大熵阈值处理算法,将直方图量化后采用最大熵阈值处理算法,使计算量大大减小。

薛景浩、章毓晋[15]等人提出基于最大类间后验交叉熵的阈值化分割算法,从目标和背景的类间差异性出发,利用贝叶斯公式估计象素属于目标和背景两类区域的后验概率,再搜索这两类区域后验概率之间的最大交叉熵。

这种方法结合了基于最小交叉熵以及基于传统香农熵的阈值化算法的特点和分割性能,取得很好的通用性和有效性,该算法也容易实现二维推广,即采用二维统计量(如散射图或共生矩阵)取代直方图,以提高分割的准确性。

任明武[16]等人提出的一种基于边缘模式的直方图构造新方法,使分割阈值受噪声和边缘的影响减少到最小。

赵雪松[17]等人提出的综合全局二值化与边缘检测的图像方法,将全局二值化与边缘检测有效的结合起来,从而达到对信封图分割的理想效果。

靳宏磊[18]等人提出的二维灰度直方图的最佳分割方法,找到了一条最佳分割曲线,使该算法得到的分割效果明显优于一维直方图阈值方法。

ZikuanChen[19]等人提出的基于小波的自适应阈值分割方法把小波引入图像分割,利用小波分析取得阈值,得到了很好的分割效果。

赵立初[20]等人提出的基于小波分析的图像自适应阈值选择算法,使图像直方图的特征点可以通过小波变换的特征点由粗到精地表示,使阈值能进行自适应选择。

Mandelbrot创立了几何学理论,提出用分形维数这一度量概念来描述自然现象的不规则程度。

这种方法用于图像分割时的特点在于分形维数直观上与物体表面的粗糙程度相吻合,而自然界中不同纹理的粗糙度有很大差别,因此可以用它作为一个有效的特征参数来区别不同类别的纹理。

所有的这些算法不管采取什么方法,结合什么工具,基本思想是一致的,就是为了寻求最佳阈值。

1.22 基于边缘的分割方法
基于边缘的分割方法则与边缘检测理论紧密相关,此类方法大多是基于局部信息的,一般利用图像—阶导数的极大值或二阶导数的过零点信息来提供判断边缘点的基本依据,进一步还可以采用各种曲线拟合技术获得划分不同区域边界的连续曲线。

根据检测边缘所采用的方式的不同,边缘检测方法可大致分为以下几类:基于局部图像函数的方法、图像滤波法、基于边界曲线拟合的方法及活动轮廓(active contour)法等。

(1) 基于局部图像函数法的基本思想是将灰度看成高度,用一个曲面来拟合一个小窗口内的数据,然后根据该曲面来决定边缘点.
(2) 图像滤波法是基于如下理论的:即对滤波算子与图像的卷积结果求导,相当于用算子的同阶导数与图像做卷积。

于是,只要事先给出算子的一阶或二阶导数,就可以将图像平滑滤波与对平滑后的图像求一阶或二阶导数在一步完成。

因而,这种方法的核心问题是滤波器的设计问题。

常用的滤波器主要是高斯(Gaussian)函数的一阶和二阶导数,Canny认为高斯函数的一阶导数是他求得的最优滤波器的较好近似[21],一般采用Laplacian算子求高斯函数的二阶导数得到LoG (Laplacian of Gaussian) 滤波算子,该算子由计算机视觉的创始人Marr首先提出[22]。

近年来研究的滤波器还有可控滤波器(steerable)[23],B-样条滤波器[24]等。

关于以上滤波算子将在第二章做详细介绍。

(3) 基于边界曲线拟合的方法用平面曲线来表示不同区域之间的图像边界线,试图根据图像梯度等信息找出能正确表示边界的曲线从而得到图像分割的目的,而且由于它直接给出的是边界曲线而不像一般的方法找出的是离散的、不相关的边缘点,因而对图像分割的后继处理如物体识别等高层处理有很大帮助。

即使是用一般的方法找出的边缘点,用曲线来描述它们以便于高层处理也是经常被采用的一种有效的方式。

L. H. Staib等在文献[25]中给出了一种用Fourier参数模型来描述曲线的方法,并根据Bayes 定理,按极大后验概率的原则给出了一个目标函数,通过极大化该目标函数来决定Fourier系数。

实际应用中,先根据对同类图像的分割经验,给出一条初始曲线,再在具体分割例子中根据像数据优化目标函数来改变初始曲线的参数,拟合图像数据,得到由图像数据决定的具体曲线。

这种方法比较适合于医学图像的分割。

除了用Fourier
模型来描述曲线外,近年来还研究了一些其它的曲线描述方法,如A. Goshtasby详细介绍了用有理Gaussian曲线和曲面来设计和拟合二维及三维形状的方法[26]。

R. Legault 等人给出了一种曲线平滑的方法[27]。

M. F. Wu等人给出了一种双变量三维Fourier描述子来描述三维曲面[28]。

(4) 活动轮廓(又称Snake模型)是一种可变形模型(或称弹性模型),最初由Kass 等[29]人提出。

活动轮廓法边缘检测认为图像中各区域的轮廓线应为平滑曲线,各轮廓线的能量由内部能量及外部能量(包括图像能量及控制能量)两部分组成,其中内部能量表征了轮廓线的光滑约束,图像能量由轮廓线上对应点的灰度、梯度和角点曲率半径(若该点为角点)等决定,而控制能量则代表了图像平面上固定点对轮廓线的吸引或排斥作用。

采用变分法求解该能量函数的极小值就可得到与区域边界相对应的轮廓线。

1.2.3 基于区域的分割方法
区域分割的实质就是把具有某种相似性质的像素连通起来,从而构成最终的分割区域。

它利用了图像的局部空间信息,可有效的克服其它方法存在的图像分割空间不连续的缺点,但它通常会造成图像的过度分割。

在此类方法中,如果从全图出发,按区域属性特征一致的准则,决定每个像元的区域归属,形成区域图,这常称之为区域生长的分割方法;如果从像元出发,按区域属性特征一致的准则,将属性接近的连通像元聚集为区域是区域增长的分割方法;若综合利用上述两种方法,就是分裂-合并的方法。

分裂合并法是先将图像分割成很多的一致性较强的小区域,再按一定的规则将小区域融合成大区域,达到分割图像的目的。

图像分割中常用的直方图门限法、区域生长法、基于图像的随机场模型法、松弛标记区域分割法等均属于基于区域的方法。

(1)直方图门限分割就是在一定的准则下,用一个或几个门限值将图像的灰度直方图(一维的或多维的)分成几个类,认为图像中灰度值在同一个灰度类内的象素属于同一个物体,可以采用的准则包括直方图的谷底、最小类内方差(或最大类间方差)、最大熵(可使用各种形式的熵)、最小错误率、矩不变、最大繁忙度(由共生矩阵定义)等。

(2)区域生长是一种古老的图像分割方法。

该方法一般有两种方式,一种是将具有相似性质的象素合起来构成区域;另一种方式是先将图像分割成很多的一致性较强,如区域内像素灰度值相同的小区域,再按一定的规则将小区域融合成大区域,达到分割图像的目的。

区域生长法的关键是要选择合适的生长或相似准则。

生长准则一般可分为3种:基于区域灰度差准则、基于区域内灰度分布统计性质准则和基于区域形状准则。

典型的区域生长法如T. C. Pong等人提出的基于小面(facet)模型的区域生长法[30],区域生长法固有的缺点是往往会造成过度分割,即将图像分割成过多的区域。

(3)基于图像的随机场模型法主要以Markov随机场作为图像模型,并假定该随机场符合Gibbs分布。

使用MRF模型进行图像分割的问题包括:邻域系统的定义;能量函数的选择及其参数的估计;极小化能量函数从而获得最大后验概率的策略。

邻域系统一般是事先定义的,因而主要是后面两个问题。

S. Geman,首次将基于Gibbs分布的Markov随机场模型用于图像处理,详细讨论了MRF模型的邻域系统、能量函数、Gibbs采样方法等各种问题,提出用模拟退火算法来极小化能量函数的方法[31],并给出了模拟退火算法收敛性的证明。

在此基础上,人们提出了大量的基于MRF模型的图像分割算法。

(4)标记法(labeling)就是将图像欲分割成的几个区域各以一个不同的标号来表示,对图像中的每一个象素,用一定的方式赋之以这些标记中的某一个,标记相同的连通象素就组成该标记所代表的区域。

标记法常采用松弛技术来给图像中的各个象素赋予标记,一般可分为离散松弛、概率松弛、模糊松弛等三种。

M.W. Hanson 等人给出了一种以人机交互式分割为基础的松弛标记算法[32]。

松弛标记不仅可用于图像分割,还可用于边缘检测、目标识别等。

1.2.4 结合特定理论工具的分割方法
图像分割至今为止尚无通用的自身理论。

近年来,随着各学科许多新理论和新方法的提出,人们也提出了许多与一些特定理论、方法和工具相结合的分割技术。

(1)基于数学形态学的分割技术其基本思想是用具有一定形态的结构元素去量度和提取图像中的对应形状以达到对图像分析和识别的目的。

如杨杰[33]提出基于图像最大内切圆的数学形态学形状描述图像分割算法和基于目标最小闭包结构元素的数学形态
学形状描述图像分割算法、分水岭区域分割法和聚类快速分割法等。

由于形态学对图像分割具有优异的特性,使其在未来的图像分割中起主导作用。

但该方法的主要缺陷还不能很好地解决耗时问题,将其与一些节约时间的措施结合起来,是图像分割的一种趋势。

(2)基于模糊技术的图像分割方法基于模糊集合和逻辑的分割方法是以模糊数学为基础,利用隶属决图像中由于信息不全面、不准确、含糊、矛盾等造成的不确定性问题,该方法在医学图像分析中有广泛的应用。

(3)基于人工神经网络技术的图像分割方法基于神经网络的分割方法的基本思想是通过训练多层感知机来得到线性决策函数,然后用决策函数对象素进行分类来达到分割的目的。

如JinSangKIM等人提出的图像序列的多特征聚类分割方法[34],先用自组织特征映射(SOFM)神经网络聚类方法将一个多特征空间转换成一维空间,然后将神经网络的输出融合,从而得到期望的分割结果。

(4)遗传算法在图像分割中的应用遗传算法是基于进化论自然选择机制的、并行的、统计的、随机化搜索方法。

对此,科学家们进行了大量的研究工作,并成功地将它们运用于各种类型的优化问题,在分割复杂的图像时,人们往往采用多参量进行信息融合,在多参量参与的最优值的求取过程中,优化计算是最重要的,把自然进化的特征应用到计算机算法中,将能解决很多困难。

遗传算法的出现为解决这类问题提供了新而有效的方法,它不仅可以得到全局最优解,而且大量缩短了计算时间。

(5)基于小波分析和变换的分割技术该方法是借助新出现的数学工具小波变换来分割图像的一种方法,也是非常新的一种方法。

小波变换是一种多尺度多通道分析工具,比较适合对图像进行多尺度的边缘检测。

例如,可利用高斯函数的一阶或二阶导数作为小波函数,利用Mallat算法分解小波,然后基于马尔算子进行多尺度边缘检测,这里小波分解的级数可以控制观察距离的“调焦”,而改变高斯函数的标准差可选择所检测边缘的细节程度。

小波变换的计算复杂度较低,抗噪声能力强。

理论证明,以零点为对称点的对称二进小波适合检测屋顶状边缘,而以零点为反对称点的反对称二进小波适合检测阶跃状边缘。

近年来多进制(Multi_Band)小波也开始用于边缘检测[35]。

另外,利用正交小波基的小波变换也可提取多尺度边缘,并可通过对图像奇异度的计算和估
计来区分一些边缘的类型。

利用小波变换和其它方法结合起来用的分割技术也是现在研究的热点。

1.2.5 图像分割方法的评价标准
尽管人们在图像分割方面做了许多研究工作,由于尚无通用的分割理论,己有的分割算法大都是针对具体问题的,并没有一种适合于所有图像的通用的分割算法。

美国人L.G Clark等从检测的角度对分割算法进行评估,着重处理两方面问题,第一,定义了图像的质量,包括目标对背景的度量和目标自身特性的度量。

第二,是定义目标自身特性的度量。

包括分割得出的目标灰度域中像素点个数及其灰度的标准方差、平均边缘强度、边缘标准方差以及目标的周长等。

他们根据度量进行检测性能评估,并将结果以检测一误警曲线表征。

LF Bennet等在分割的性能评估方面提出了一种以分割精确性为评估指标的基于知识的方法,他指出了分割出的目标区域与标准参照区域的吻合程度。

分割结果的好坏主要靠观察者主观评价。

用肉眼直接观察图像的效果,是一种定性的方法,评价结果有一定的不确定性。

随着模糊数学的发展,人们可以用模糊综合评判方法来尽量减少主观因素影响实现近似定量评价,其定量计算公式中的参数往往要依赖专家经验确定。

尽管客观评价对于自动分割很有意义,对比较不同算法的性能也很重要,但现阶段仍无法找到一种能得到广泛认同的客观评价方法。

多数的方法都将算法的分割结果与主观判断结果(如参考图像)作比较,因而人仍是最终的决定者。

然而,人工分割的参考图像一般不够精确,且带有主观性。

Ranganath与Rezace就曾观察到专家分割出的医学图像常常大于自动分割结果。

事实上,人们对于人眼视觉系统的研究仍不成熟,难以用一个模型去描述它,这是寻求分割的客观评价的困难所在。

另外一个更重要的原因是,分割是面向一个个具体的应用目的的。

不同的应用场合,对分割结果可能会有不同的评价。

例如,同样是对一幅人物图像作分割,如果是作为视频对象提取的帧内分割,需要得到的是目标人物的最外层轮廓;但如果是作面部识别或是细节特征匹配,则除了需要得到外层轮廓之外还要有内部纹理细节。

因此,在许多情况下,主观评价仍是最佳的衡量标准。

相关文档
最新文档