基于聚类算法的图像分割
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
摘 要
图像分割是当今一个比较热门的研究课题,有着广阔的应用前景。
它广泛应用于医学、交通、军事等领域,研究它可以为我们进一步理解、分析图像相关信息提供十分重要的帮助;同时它本身也是一门十分复杂和棘手的技术,由于现有图像分割算法的一些不足也促进研究者们不断创新和改进,使图像分割技术不断完善,以便使其在实际应用中发挥更好的作用。
图像分割算法有很多种类,它们都基于不同的原理而来。
本文主要介绍的是模糊聚类算法在图像分割上的应用。
聚类算法在图像分割中的应用是很广泛的,近年来提出的新算法也是层出不穷。
本文首先介绍了图像分割的一般原理、意义和应用,然后又介绍聚类算法图像分割的原理及应用,以使读者对聚类算法有更深入的认识。
在此基础上,接下来第三章、第四章分别介绍了三种模糊聚类算法在彩色图像分割以及噪声图像分割当中的应用。
其中有一个算法应用在彩色图像分割上,是基于一种叫作空间模式聚类算法在彩色图像分割上的应用。
由于彩色图像的每个像素点的颜色值是由RGB三个颜色分量值组成的,属于三维空间,无法应用在属于单维的基于空间模式聚类算法的灰度空间上。
在此,引入了一个计算公式将彩色图像像素点的RGB值换算为一个亮度值,它取代了算法距离公式当中的灰度值,这样可以使用空间模式聚类算法在该彩色图像的亮度空间中进行聚类分割,在彩色图像分割实验中该方法取得了一定的良好效果。
后两个算法均为噪声图片分割。
当图片当中含有噪声的时候,聚类算法的分割效果会受到影响。
为了增强聚类算法抗噪能力,两种方法被分别应用在了两种聚类算法当中,以提高它们的分割性能。
一种改进方法是在空间模式聚类图像分割算法的隶属度公式中引入了一个变量,以修正因噪声原因而导致计算发生错误的隶属度值,因为隶属度矩阵当中保存了聚类算法的分割结果,在理论上,这种修改对于修正错误的分类结果是有意义的。
另外一种方法则应用在了一般的模糊聚类分割算法上,通过在聚类算法的距离公式当中引入一个变量。
因为如果像素点受到噪声污染,那么像素的灰度值就会发生改变,导致算法计算距离公式的值发生错误,进而影响到隶属度值。
最后,再将前一种对隶属度公式改进的方法应用到此算法当中,强化其抗噪能力。
这种修改在理论上也是可行的。
在对噪声图片的分割实验中,这两个算法均取得了较好的效果。
最后一章对文中的主要内容进行了总结。
关键词:图像分割,聚类,噪声,模糊聚类,彩色图像分割,隶属度,空间模式
Abstract
Image segmentation is a hot subject nowadays, and a broad application prospect will be got from it. It is broadly used in medicine,traffic,military and other domains.It can be used to help us to deeply understand and analyse images’ information.On the other hand,it is also a very complex and difficult technique.The defects of image segmentation force researchers to innovate and improve the algorithms ceaselessly,so that the algorithms will have a good performance in the practical application.
There are many algorithms about image segmentation which come from different theories.This article focus on the image segmentation based on fuzzy clustering algorithm.Image segmentation based on clustering algorithm is very important and used broadly, and many new algorithms are proposed recently. First, theories, significance and applications on image segmentation are introduced in this article.Then, theories and applications on image segmentation based on clustering algorithm are introduced so that readers will have a deeply realization about clustering algorithm.
In the chapter 3 and chapter 4, three FCM algorithms are proposed. One of them aims at color image segmentation.It is extended to color image segmentation from the clustering algorithm of spatial patterns. Each pixel of color image is composed of three elements,called RGB elements.But the clustering algorithm of spatial patterns is used in the linear dimension of gray-scale value and color images’ color space is three dimensions.So,a method is used here to transfer the three color values to a brightness value which is in the linear dimension.Then,it can be used in the algorithm which instead of the gray-scale value of distance formula.This proves good in the color image segmentation experiment.The others aim at noisy image segmentation. The clustering algorithms segmentation results will be affected if a image contains noisies.So,two algorithms are proposed to resist the noisies’ influence.One method is used in the clustering algorithm of spatial patterns.The algorithm is modified by the membership function which is added a variable in order to anti noises as the membership matrix storages the segmentation result. So,it is meaningful in theory.The other method is used in a common fcm algorithm.The algorithm is modified by the distance formula which is also added a variable in order to resist the noises as the distance values will influence the membership values.At last,the method which is used in the former anti noises algorithm is also used in the second algorithm to intensify its anti noisies ability.It is also meaningful in theory.In noisy images experiments,these two algorithms get good segmentation results.
The last chapter summarizes the paper’s main contents.
Keywords:image segmentation, clustering, noise, fcm,color image segmentation, membership, space pattern
目 录
第一章 绪论 (1)
1.1图像分割的基本概念 (1)
1.2图像分割的方法 (2)
1.2.1阈值法 (2)
1.2.2区域生长法 (2)
1.2.3边缘检测法 (3)
1.2.4人工神经网络法 (3)
1.2.5可变模型法 (3)
1.2.6基于模糊集理论的方法 (4)
1.2.7其它方法 (4)
1.3图像分割的应用 (5)
1.4图像分割研究的趋势 (6)
第二章 聚类研究综述 (7)
2.1基本概念 (7)
2.2模糊聚类算法研究的类别 (7)
2.2.1层次聚类 (8)
2.2.2分割聚类 (8)
2.2.3其它聚类 (9)
2.3典型聚类算法 (9)
2.3.1CLARANS算法 (9)
2.3.2BIRCH算法 (9)
2.3.3DBSCAN算法 (10)
2.3.4STING算法 (10)
2.3.5FCM算法 (11)
2.4聚类算法应用 (12)
第三章 空间模式聚类算法在彩色图像分割上的应用 (15)
3.1彩色图像分割综述 (15)
3.2彩色图像分割技术 (15)
3.2.1基于区域的分割技术 (16)
3.2.2基于边缘的分割技术 (17)
3.2.3基于特定理论工具的分割技术 (17)
3.2.4分形技术 (19)
3.2.5混合技术 (20)
3.3空间模式聚类彩色图像分割算法 (20)
3.4算法流程 (22)
3.5实验结果 (23)
3.6实验小结 (36)
第四章 噪声图像分割 (37)
4.1研究意义 (37)
4.2改进的基于空间模式聚类的图像分割 (37)
4.2.1基于空间模式的聚类算法介绍 (38)
4.2.2算法的改进 (38)
4.2.3算法流程 (40)
4.2.4实验结果与结论 (40)
4.3基于矫正变量的聚类噪声图像分割 (46)
4.3.1算法介绍 (46)
4.3.2算法流程 (49)
4.3.3实验结果与结论 (50)
第五章 结论 (54)
致 谢 (56)
参考文献 (57)
附录:作者在攻读硕士学位期间发表的论文 (61)
第一章 绪论
1.1图像分割的基本概念
图像分割是一种重要的图像分析技术,它不仅得到人们广泛的重视和研究,也在实际中得到大量的应用。
图像分割在不同领域中有时也用其它名称,如目标轮廓技术,阈值化技术,图像区分或求差技术,目标检测技术,目标识别技术,目标跟踪技术等,这些技术本身或核心实际上也是图像分割技术。
图像技术在广义上是各种与图像有关技术的总称。
图像技术种类很多,跨度很大,但可以将它们归在一个整体框架——图像工程之下。
图像工程是一个对整个图像领域进行研究应用的新学科,它的内容非常丰富,根据抽象程度和研究方法等的不同可分为三个各有特点的层次:图像处理、图像分析和图像理解[1]。
在对图像的研究和应用中,人们往往仅对图像中的某些部分感兴趣。
这些部分常称为目标或前景(其他部分称为背景),它们一般对应图像中特定的、具有独特性质的区域。
为了辨识和分析图像中的目标,需要将它们从图像中分离提取出来,在此基础上才有可能进一步对图像进行利用。
图像分割就是指把图像分成各具特性的区域并提取出感兴趣目标的技术和过程。
这些特性可以是灰度、颜色、纹理等,目标可以对应单个区域,也可以对应多个区域。
图像分割可以借助集合的概念用如下比较正式的方法定义:
令集合R 代表整个图像区域,对R 的分割可看作将R 分成若干个满足以下5个条件的非空的子集(子区域)12,,,n R R R :
(1) 1n
i i R R ==∪
(2)对所有的i 和j ,i j ≠有i j R R =∅∩
(3)对1,2,,i n = ,有i P(R )=TRUE ;
(4)对i j ≠,有i j P(R R )=FALSE ∪;
(5)对1,2,,,i i n R = 是连通的区域。
其中i P(R )是对所有在集合i R 中元素的逻辑谓词,∅是空集。
分类的准则有:
基于区域像素灰度值的特性,可以分为利用区域间灰度不连续性的基于边界的算法和利用区域内灰度相似性的基于区域的算法。
另外根据分割过程中处理策略的不同,分割算法可分为并行算法和串行算法。
根据以上两个准则,分割算法可分为四类:
①PB:并行分界类;
②SB:串行边界类;
③PR:并行区域类;
④SR:串行区域类[2]。
1.2图像分割的方法
图像分割的方法和种类有很多,有些分割运算可直接应用于任何图像,而另一些只能适用于特殊类别的图像。
有些算法需要先对图像进行粗分割,因为他们需要从图像中提取出来的信息。
现在广泛使用的一些图像分割算法有:
1.2.1阈值法
阈值分割法是简单地用一个或几个阈值将图像的直方图分成几类,图像中灰度值在同一个灰度类内的像素属于同一个类,它是一种PR法。
其过程是决定一个灰度值,用以区分不同的类,这个灰度值就叫做“阈值”。
它可以分为全局阈值分割和局部阈值分割。
所谓全局阈值分割是利用整幅图像的信息来得到分割用的阈值,并根据该阈值对整幅图像进行分割;而局部阈值分割是根据图像中的不同区域获得对应的不同区域的阈值,利用这些阈值对各个区域进行分割,即一个阈值对应相应的一个子区域,这种方法也称适应阈值分割。
阈值法是一种简单但是非常有效的方法,特别是不同物体或结构之间有很大的强度对比时,能够得到很好的效果。
它一般可以作为一系列图像处理过程的第一步。
它一般要求在直方图上能得到明显的峰或谷,并在谷底选择阈值。
如何根据图像选择合适的阈值是基于阈值分割方法的重点所在,也是难点所在。
它的主要局限是,最简单形式的阈值法只能产生二值图像来区分两个不同的类。
另外,它只考虑像素本身的值,一般都不考虑图像的空间特性,这样就对噪声很敏感;它也没有考虑图像的纹理信息等有用信息,使分割效果有时不能尽如人意。
现在有很多研究者提出了许多经典阈值法的更新算法。
特别在阈值选取方面提出了很多方法,如双峰直方图阈值分割法、最大熵阈值分割、最大类间方差阈值分割法、灰度共矩阵阈值分割法等。
1.2.2区域生长法
区域生长法是根据预先定义的标准,提取图像中相连接的区域的方法,它是利用区域的相似性即满足区域一致性准则对目标进行分割。
它是一种SR法。
这个预先定义的标准可以是灰度信息,也可以是图像的边界,或者是两者的结合。
在此法的最简单形式中,先人工给出一个种子点,然后提取出和种子相比符合预知标准的所有象素。
和阈值法一样,区域生长法一般不单独使用,而是放在一系列处理过程中。
它主要的缺陷是,每一个需要提取的区域都必须人工给出一个种子点,这样有多个区域就必须给出相应的种子个数。
此法对噪声也很敏感,会造成孔状甚至是根本不连续的区域,相反的,局部且大量的影响还会使本来分开的区域连接起来。
1.2.3边缘检测法
边缘检测法是基于图像不连续性的分割技术。
由于一幅图像的大部分信息存在于不同区域的边缘上,而且人的视觉系统在很大程度上根据边缘差异对图像进行识别分析。
所以可以通过检测图像的边缘信息来实现对图像的分割。
它按照处理技术可以分为串行边缘检测技术和并行边缘检测技术。
在并行边缘检测技术中边缘的检测可以借助空域微分算子通过卷积完成。
这些微分算子包括Sobel梯度算子、Roberts梯度算子、Prewitt梯度算子、拉普拉斯算子、综合正交算子等。
这些方法对图像中灰度的变化进行检测,认为灰度突变的地方为图像边缘。
在有噪声时,用各种算子得到的边缘像素常是孤立的或分小段连续的,为了得到完整的边缘信息,还需进行边界闭合处理。
边界闭合可以根据梯度实现,即如果某些像素梯度的幅度及梯度方向满足规定的条件就可以把这些像素连接起来,如果对所有的边缘像素都进行这样的判断和连接就有可能得到闭合的边界。
除此之外,还可以利用数学形态学的一些操作进行边界的连接和闭合;哈夫变换也是利用图像全局特性而将边缘像素连接起来组成区域封闭 边界的一种方法。
该算法对于灰度变化复杂和细节较丰富的图像进行处理时,以上算子均很难检测出边缘。
而且一旦有噪声干扰,处理效果更不理想。
1.2.4人工神经网络法
近几年来神经网络在图像分割中的应用得到了很大的发展,按照处理数据类型大致上可以分为两类:一类是基于像素数据的神经网络算法;另一类是基于特征数据的神经网络算法也即特征空间的聚类分割方法。
基于象素数据分割的神经网络算法用高维的原始图像数据作为神经网络训练样本,比起基于特征数据的算法能够提供更多的图像信息,但是各个象素是独立处理的,缺乏一定的拓扑结构,而且数据量大,计算速度相当慢,不适合实时数据处理。
目前有很多神经网络算法是基于象素进行图像分割的,如Hopfield神经网络[3]、细胞神经网络[4]、概率自适应神经网络[5]等。
基于特征的神经网络算法主要是对特征空间的聚类分割方法进行改造。
特征空间聚类分割方法关键的问题是有效特征参数的提取和聚类方法的构造。
有效的特征提取方法有很多,大致上可以分为四种:几何特征方法、统计特性方法、信号特性方法和基于图像模型的方法。
传统的聚类方法效果差,且是基于一定前提假设的,神经网络打破了传统聚类方法的限制,已经成为寻找聚类新方法的基础。
目前使用的神经网络模型有SOFM神经网络[6],LEGION神经网络模型[7]、前向反馈神经网络[8]等。
神经网络在解决如CT图像、遥感图像声纳图像等一系列复杂的图像分割方面显示了其特有的优势,但解决问题的机理很难理解,网络节点个数、网络层数等的设计还缺乏比较系统的理论指导。
另外,神经网络的训练有时比较费时[9]。
1.2.5可变模型法
可变模型法是基于模型的、使用闭合参数曲线或曲面描绘边界的分割方法。
这个模
型又叫Snake 模型(活动轮廓模型)。
其过程就是活动的轮廓在模拟的内部力(内部能量)和外部约束力(外部能量)作用下形变,向物体边缘靠近,外力推动活动轮廓向着物体边缘运动,内力保持活动轮廓的光滑性和连续性;最终到达平衡位置时即收敛到目标的边缘,求得对目标的分割结果。
Snake 是定义在待分割图像上的一条任意闭合曲线,对该曲线构造合适的变形能int image ext E E E E =++。
其中int E 是由于模型拉伸、弯曲而产生的内能;image E 是与图像特征有关的能量;ext E 是外部能量。
E 最小对应于灰度梯度最大,此时的活动轮廓就是物体边缘,通过最小化该函数,就能找到物体边缘。
这种方法也存在一些不足:(1)分割的结果与活动轮廓的初始位置有关,要求初始位置模型应接近物体边缘;(2)活动轮廓很难收敛到曲率高的边缘(如尖角等)。
现在有很多改进的算法,如自适应活动轮廓,引入与各象素点概率分布有关的统计图像能,使得活动轮廓模型克服噪声的影响,且分割的结果与活动轮廓的初始位置无关;为了使活动轮廓能收敛到曲率高的边缘,引入与活动位置有关的弹性系数、硬性系数,提出了一种松弛法。
还可以利用图像的先验知识与 Snake 结合,即在Snake 的内部能量函数中加入预知信息,能提高分割的速度及准确度。
1.2.6基于模糊集理论的方法
为用不精确的知识表达事件,人们提出了模糊集合的概念。
模糊集合理论能较好的描述人类视觉中的模糊性和随机性。
由于图像中的边缘、拐角或者区域之间的关系难以精确的加以描述,具有不确定性和模糊性,把模糊集理论引入图像分割中来,取得了较好的分割效果,并特别在医学图像分析中得到了较多的应用。
结合信息论中交叉熵的概念,基于模糊集理论分割中提出了模糊散度的概念来表达图像中的模糊性。
模糊散度既能定量反映集合内成员对该集合的隶属程度,又能结合概率分布表征两个集合之间的相似程度。
类间最大模糊散度阈值化分割法就是利用模糊集的概念在分割图像时分别定义目标模糊集O ;Fn 背景模糊集b ,由于隶属度函数的形式和取值与阈值有关,对每个待选阈值能得到不同的类间模糊散度,可以将散度最大的阈值作为最优分割阈值,以此阈值来分割图像。
类内最小模糊散度阈值化分割法是把分割后图像B 和原来的图像G 的目标之间的模糊散度和背景之间的模糊散度的和定义为B 和G 之间的模糊散度,当这个模糊散度最小时,可以看作在模糊信息意义上分割图最接近原始图,所以按这种准则来获得最优分割阈值实现对图像的分割。
其他基于模糊集理论的方法还有模糊C—均值聚类分割法、模糊边缘检测技术等。
1.2.7其它方法
还有一些图像的分割方法,如:聚类法;用样条进行曲线拟合,它是一种SB 法(串
行边界)。
此外,基于小波分析的分割技术也逐渐被应用在生物图像中。
因为生物医学图像中软组织的物理和解剖特性,以上的方法一般不单独使用,而是融入其他的方法里。
除了上述方法外,很多研究者把数学形态学、遗传算法、信息融合技术和信息论等应用于此,针对不同的实际情况,提出很多改进的新算法[2]。
1.3图像分割的应用
随着图像分割技术研究的深入,其应用日趋广泛。
凡属需要对图像目标进行提取、测量的工作都离不开图像分割。
目前,图像分割已在交通、医学、遥感、通信、军事和工业自动化等诸多领域得到广泛应用[10]。
在智能交通领域,图像分割已广泛应用于车牌的定位和生产。
汽车牌照区域的定位主要是完成把汽车牌照从所拍摄的图像中分割出来,也就是在这个画面中找出包含牌照字符的最小区域来[11]。
文献[12]给出了一种利用牌照颜色和形状以及神经元网络的方法来定位汽车牌照,文献[13]给出了一种自适应边界搜索的办法来确定牌照区域的边界,文献[14]则是根据牌照图像的属性在频域中的表现来确定汽车牌照区域的。
针对车牌生产中光照不均和存在反光的复杂彩色图像,郝智泉等提出了一种采用灰度空间和饱和度空间联合阈值的图像分割方法。
该方法能够较好地分割目标和背景,获得高质量的二值图像,在工业生产实时监控系统的应用中取得了良好的效果。
在医学领域,医学图像分割技术是医学图像处理和分析中的关键技术。
医学图像分割是一个根据区域内的相似性以及区域间的不同把图像分割成若干区域的过程[15]。
从图像中把有关结构(或感兴趣区)分离出来是图像分析与识别首要解决的问题,也是制约医学图像处理中其它相关技术发展和应用的瓶颈[16]。
医学图像分割在临床诊断、病理分析以及治疗方面具有重要意义,具体表现在:(1)图像分割的结果常用于生物学图像的分析,如不同形式图像的配准、融合,解剖结构的测量,获取先验知识用于图像重建以及心脏运动的跟踪等[17]。
(2)用于测量人体器官、组织的体积。
通过对这些体积在治疗前后的定量测量和分析,可以帮助医生进行诊断、预后和制定或修改对病人的治疗方案[18]。
(3)用于医学图像的3D重建方面,便于可视化,外科手术方案的制定和仿真,病理研究,药物疗效的评估,解剖参考以及放疗计划中的3D定位等[19]。
(4)图像分割结果可用于在不丢失有用信息的前提下进行数据的压缩和传输。
这对于提高在PACS、远程放射学和Internet中的图像传输速度是至关重要的[20]。
(5)分割后的图像与噪声的关系减弱,因此具有降噪功能,便于图像的理解[21]。
在遥感领域,利用遥感数据进行海洋监测、海事救援、海洋污染监控等应用时,需要对图像中海岸线进行分割提取。
传统的阈值方法对于图像中沿海岸线的物体阴影、植被、暗的人工设施等分割效果,瞿继双等提出了一种用于处理光学遥感图像的基于多阈值分割的形态学方法,能有效提高准确检测率,具有较好的
检测效果[10]。
目前国内小麦的虫害防治早已从原来的手工方法转变到化学防除,即利用化学药剂对受到危害的作物进行处理。
但化学药剂的大面积使用,会造成农药残留,对人体及环境有害。
因此,变量喷洒(或有选择性喷洒)的方法,已成为近年来精细农业的研究热点。
实现药剂的变量喷洒,首先要解决的是害虫识别的问题,即通过科学技术方法,如图像处理确定害虫的特征(位置、密度、种类等),将其中的目标区域(害虫)分离出来,用以指导机械装置的操作[22]。
灰度和二值化、平均值分割算法、迭代阈值分割算法和中值滤波[23-24]等是早期的基于机器视觉的害虫识别方法,近年来,国内外学者研究的基于机器视觉的害虫识别方法,主要有数学形态学、二叉树和人工神经网络等[25-26]。
马骏[27]等提出的基于数学形态学的膨胀和腐蚀快速算法,用于提取病虫骨架特征;黄小燕[28]等讨论了基于数学形态学的彩色数字图像分割算法,提出了用形态模板过滤彩色数字图像进行分割的方法,用于储粮害虫彩色数字图像的分割中。
赵汉青、沈佐锐[29]等对40种昆虫用二叉树方法进行分类。
图像分割应用的范围是如此广泛,它的用途也如此的重要,在此很难一一将其详尽的展现出来。
以上仅仅列举了几个图像分割具体应用的例子及相关研究进展情况,旨在说明对于图像分割进行研究,有着十分重要的实际意义。
虽然例子很少,但已经足够说明问题了。
相信随着研究的不断深入和改进,一定会有更多更好的成果发表出来。
1.4图像分割研究的趋势
虽然近年来研究成果越来越多,但由于图像分割本身所具有的难度,使研究没有大的突破性的进展。
仍然存在的问题主要有两个:其一是没有一种普遍使用的分割算法;其二是没有一个好的通用的分割评价标准。
从图像分割研究的历史来看,可以看到对图像分割的研究有几个明显的趋势:一是对原有算法的不断改进。
二是新方法、新概念的引入和多种方法的有效综合运用。
人们逐渐认识到现有的任何一种单独的图像割算法都难以对一般图像取得令人满意的分割效果,因而很多人在把新方法和新概念不断的引人图像分割领域的同时,也更加重视把各种方法综合起来运用。
在新出现的分割方法中,基于小波变换的图像分割方法就是一种很好的方法。
三是交互式分割研究的深入。
由于很多场合需要对目标图像进行边缘分割分析,例如对医学图像的分析,因此需要进行交互式分割研究,事实证明,交互式分割技术有着广泛的应用。
四是对特殊图像分割的研究越来越得到重视。
目前有很多针对立体图像、彩色图像、多光谱图像以及多视场图像分割的研究,也有对运动图像及视频图像中目标分割的研究,还有对深度图像、纹理图像、计算机断层扫描(CT)、磁共振图像、共聚焦激光扫描显微镜图像、合成孔雷达图像等特殊图像的分割技术的研究。
相信随着研究的不断深人,存在的问题会很快得到圆满的解决。