基于空间模糊聚类的图像分割优化算法讲解
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
深圳大学研究生课程论文
题目基于空间模糊聚类的图像分割优化算法
成绩
专业信息与通信工程课程名称、代码模糊数学理论年级研一
姓名梁运恺同组人叶韩
学号2150130406 2150130407
时间2015/1/6
任课教师李良群
基于空间模糊聚类的图像分割优化算法
【摘要】针对传统模糊C-均值(FCM)算法抗噪性能差的问题,提出一种新的基于空间模糊聚类的图像分割优化算法。该算法通过在传统FCM算法基础上加入图像特征项中像素间的空间位置信息,解决了传统FCM对噪声敏感的问题,增强了算法的鲁棒性。实验结果表明,该算法可实现有效分割,分割效果显著优于传统FCM 算法。
【关键词】图像分割;模糊聚类;FCM算法;空间位置信息;
The Spatial Fuzzy Clustering Optimization Algorithm
for Image Segmentation
Abstract: For the poor anti-noise performance limitations of the traditional fuzzy C-means (FCM) algorithm. We proposed a new spatial fuzzy clustering optimization algorithm for image segmentation .we added a wealth of spatial information between pixels in the image feature items, so that the traditional FCM sensitive to noise was solved. And the robustness of the algorithm was enhanced. Experimental results show that our algorithm can achieve the effective segmentation the noise images. And the results are significantly better than those by traditional FCM image segmentation algorithm.
Keywords: image segmentation; fuzzy clustering; FCM algorithm; spatial information
1.引言
图像分割是图像处理到图像分析的关键步骤,是进一步理解图像的基础。图像分割本质上是基于某种相似性准则对像素进行分类,在期望的分割结果中,属于同类的像素特征不仅在数值上相似,其空间位置信息也有紧密联系。数据聚类方法对图像进行分割具有直观和易于实现的特点,其中最有效的是模糊C-均值(Fuzzy C-means ,FCM)聚类算法。但传统的FCM算法未考虑图像的空间信息,在处理受噪声污染的图像时常会得到不理想的分割结果,因此,本文提出一种改进的FCM算法。针对传统FCM算法在分割过程中只考虑本地信息的问题,本文算法加入有影响力的特征因子,即空间位置信息。实验结果表明,本文算法可显著
抑制噪声并保留实际图像的特征。
2. FCM 聚类简介
2.1 模糊集合基本知识
首先说明隶属度函数的概念。隶属度函数是表示一个对象x 隶属于集合A 的程度的函数,通常记做μA (x),其自变量范围是所有可能属于集合A 的对象(即
集合A 所在空间中的所有点),取值范围是[0,1],即0<=μA (x)<=1。μA (x)=1
表示x 完全隶属于集合A ,相当于传统集合概念上的x ∈A 。一个定义在空间X={x}上的隶属度函数就定义了一个模糊集合A ,或者叫定义在论域X={x}上的模糊子集。对于有限个对象x 1,x 2,……,x n 模糊集合可以表示为:
X}x |)x ),(x {(u A ~
i i i A ∈= 有了模糊集合的概念,一个元素隶属于模糊集合就不是硬性的了,在聚类的问题中,可以把聚类生成的簇看成模糊集合,因此,每个样本点隶属于簇的隶属度就是[0,1]区间里面的值。
2.2 C 均值聚类
C 均值聚类也称K 均值聚类(K-Means ),已经应用到各种领域。它的核心思想如下:算法把n 个向量x j (1,2…,n)分为c 个组G i (i=1,2,…,c),并求每组的
聚类中心,使得非相似性(或距离)指标的价值函数(或目标函数)达到最小。当选择欧几里德距离为组j 中向量x k 与相应聚类中心c i 间的非相似性指标时,
价值函数可定义为:
)c x (J J 2
c 1i G k,x i k c 1i i i k ∑∑∑=∈=-== 这里是组I 内的价值函数。这样J i 的值依赖于G i 的几何特性和c i 的位置。
一般来说,可用一个通用距离函数d(x k ,c i )代替组I 中的向量x k ,则相应的
总价值函数可表示为:
))c (x d (
J J i k c 1i G k,x c 1i i i k -==∑∑∑=∈= 为简单起见,这里用欧几里德距离作为向量的非相似性指标,且总的价值函数表示为(2)式。
(1) (2)
(3)
划分过的组一般用一个c×n 的二维隶属矩阵U 来定义。如果第j 个数据点x j 属于组i ,则U 中的元素u ij 为1;否则,该元素取0。一旦确定聚类中心c i ,可导出如下使式子最小的u ij :
⎪⎩⎪⎨⎧≤≠=其他0c -x c -x ,如果i k 对每个1u 2k j 2i j ij 重申一点,如果c i 是x j 的最近的聚类中心,那么x j 属于组i 。由于一个给
定数据只能属于一个组,所以隶属矩阵U 具有如下性质:
n j u
c j i .....111i =∀=∑=
且 n u
c i n j ij =∑∑==11 另一方面,如果固定u ij 则使(6.2)式最小的最佳聚类中心就是组I 中所有
向量的均值:
∑∈=
k k G x k k x ,i i G 1c 这里|G i |是G i 的规模。 为便于批模式运行,这里给出数据集x i (1,2…,n )的K 均值算法;该算
法重复使用下列步骤,确定聚类中心c i 和隶属矩阵U :
步骤1:初始化聚类中心c i ,i=1,…,c。典型的做法是从所有数据点中任取c
个点;
步骤2:用式(6.4)确定隶属矩阵U ;
步骤3:根据式(6.2)计算价值函数。如果它小于某个确定的阀值,或它相对上次价值函数质的改变量小于某个阀值,则算法停止;
步骤4:根据式(6.5)修正聚类中心。返回步骤2。
该算法本身是迭代的,且不能确保它收敛于最优解。K 均值算法的性能依赖于聚类中心的初始位置。所以,为了使它可取,要么用一些前端方法求好的初始聚类中心;要么每次用不同的初始聚类中心,将该算法运行多次。此外,上述算法仅仅是一种具有代表性的方法;我们还可以先初始化一个任意的隶属矩阵,然后再执行迭代过程。
K 均值算法也可以在线方式运行。这时,通过时间平均,导出相应的聚类中心和相应的组。即对于给定的数据点x ,该算法求出最近的聚类中心ci ,并用下(4) (5) (6)
(7)