彩色图像分割混合方法

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

使用直方图c聚类混合方法的彩色图像分割
摘要：
本文提出了一种新的直方图阈值–模糊C-均值混合（htfcm）的方法，这种方法可以应用到模式识别以及计算机视觉特别是彩色直方图等不同领域。

该方法采用直方图阈值技术在彩色图像中获得所有尽可能均匀的区域。

然后，使用模糊聚类（FCM）算法来提高这些均匀区域的聚类紧凑性。

实验结果表明，所提出的低复杂性的htfcm的方法可以比采用蚁群算法进行细分的其他方法，获得更好的聚类结果和分割结果。

1简介
颜色是一个可以用来提取同类区域最重要的低级别的特点，多数时候与对象或对象的部分相关。

在24位真彩色图像中，特殊颜色数量通常超过图像大小的一半，可以达到16百万。

从人的感知上来说，这些颜色不能被人眼识别，只能靠内部认知空间的30种颜色来区分。

由于所有的特殊颜色在感知上非常接近，它们可以被组合来形成同性质的区域来代表图像中的目标对象，因此图像可以变得更有意义并且更容易分析。

在图像处理与计算机视觉中，图像分割是图像分析和模式识别的中心任务。

这是把一个图像分割成多个区域，这些区域相对于一个或多个特征是同类的。

虽然在科学文献中已经出现许多分割技术，它们可分为基于图像域，基于物理和基于特征空间的分割技术。

这些技术已经被广泛使用，但每一种都有其优点和局限.图像域技术把颜色特征和颜色的空间关系应用到同类评估中以便进行分割，这些技术产生具有合理紧凑性的区域但有会存在合适的种子区域选择困难的问题。

基于物理技术的方法利用材料的反射特性的物理模型进行具有更多应用的颜色分割，他们的模型可能会产生色彩变化.特征空间技术利用颜色特征作为图像分割的关键和唯一标准来分割图片。

因为色彩空间关系被忽略所以分割的区域通常是分散的。

但是，这种限制可以通过提高区域紧凑性来解决。

在计算机视觉和模式识别中，由于其聚类有效性和实施简单，模糊C均值（FCM）算法已被广泛用于提高区域的紧凑性。

它是一个将像素划分成群集的像素聚类过程，因此在同一集群中的像素最大可能的相似，那些不在同一组群的像素最大程度的不同。

由于在视觉上不同的区域尽可能不同，这与分割过程相一致。

但是，它的实现往往遇到两个不可避免的困难，确定聚类数和合理选择初始聚类中心。

这些初始化困难对分割质量有影响。

而聚类数的确定可能影响分割区域和区域性特征方差，获得初始聚类中心会影响聚类的紧凑性和分类的准确性。

最近，一些基于特征的分割技术采用蚁群算法（ACA）的概念对图像进行分割。

由于蚁群算法的智能搜索能力，这些技术可以实现图像分割结果的进一步优化。

但由于他们计算的复杂性会产生低效率。

除了获得良好的分割结果外，[26]提及的改进的蚁群算法（AS）提供了一个解决方案来克服FCM的聚类中心和聚类数初始化条件的敏感性。

然而，该技术在特征空间中没有达到非常紧凑的聚类结果。

为了提高蚁群算法的性能，[26]介绍了蚁群–模糊C-均值算法(AFHA)。

本质上，AFHA算法合并FCM算法和蚁群算法来提高特征空间中聚类结果的紧凑性。

然而，由于蚁群算法计算的复杂度它的效率仍然很低。

为了增加AFHA算法的效率，[26]介绍了改进的蚁群模糊C均值算法(IAFHA)。

IAFHA算法在AFHA算法上增加了一个蚂蚁的子采样的方法以减少计算的复杂性使算法具有更高的效率。

虽然IAFHA 的效率得到提高，但还存在较高的计算复杂度。

在本文中，我们提出了一个新的分割方法称为直方图阈值–模糊C-均值混合算法（htfcm）。

Htfcm方法主要分为两个模块，即直方图阈值模块和FCM模块。

直方图阈值模块用于获取FCM聚类中心和聚类数的初始条件。

与蚁群聚类相比这个模块的实现不需要很高的计算复杂度。

这就意味着该算法的简单性。

本文的其余部分安排如下：第2节详细地介绍了直方图阈值模块和FCM模块。

3节提供了
算法实施程序的说明。

第4部分分析了本文提出的方法，同时把该方法和其他技术的结果进行比较。

最后，第5节总结本文的工作。

2建议方法
在本文中，我们试图获得一个解决方案来克服FCM 聚类中心和聚类数对初始条件的敏感性。

从图像的全局信息考虑，采取直方图阈值模块克服了FCM 针对进行初始化弊端。

在这个模块中，图像的全局信息用于获得图像的所有可能区域，同时也可以获得所有可能的聚类中心和聚类数量。

然后FCM 模块用于提高了聚类的紧凑性。

在这种背景下，压实度是指从每个集群中取得每个聚类中心的最优化的标签。

2.1直方图阈值
因为操作简单数字图像直方图是图像实时处理工具。

靠产生图像的全局信息，在图像处理中它作为一个很重要的统计学基础。

用RGB 表示的彩色图像，一个像素的颜色是红，黄，绿三原色混合形成。

每个图像的像素可以被看作是包含代表三种颜色图像像素的三维向量。

因此，全局直方图代表三原始成分，可以分别产生对整个图像的全局信息。

全局直方图的基本分析方向是在一个统一的区域形成相应的直方图峰值。

对于彩色图像，可以通过全局直方图的支配峰识别出特定区域。

因此，直方图阈值是一种流行的图像分割技术，这种方法寻找直方图的峰值和谷值[28,29]。

一种基于直方图分析的典型分割方法只需要判断支配峰能否在直方图中直接找出。

几种常用的寻峰算法利用了峰值的锐度或识别区域直方图中的峰值。

尽管这些寻找峰值的算法在直方图分析中通常是有用的，如果图像包含噪声或剧烈的变化，有时候他们不能得到很好的结果 [30,31]。

在本文中，我们提出了一种新的直方图阈值技术包含三相技术如寻峰技术，该区域的初始化和区域合并过程。

直方图阈值技术应用寻峰技术来确定全局直方图的支配峰。

寻峰算法可以正确地找到全局直方图中所有支配峰，已经通过大量彩色图像的测试证明这种方法是有效的。

因此，可以得到图像的特定区域。

因为图片中任何特定区域都包含3种代表RGB 彩色图像3种颜色的元素，每个特定区域的元素都标记了一个值，这个值对应于各自全局直方图的亮度级的峰值。

虽然成功地获得了特定的区域，特定区域在感官上很接近。

因此，使用区域合并合将这些地区合并在一起。

2.1.1寻找极值点
让我们假设处理RGB 彩色图像，每个原始颜色分量的强度以n 位整数存储，在区间[ 0，L-1 ]给出一个可能的L =2n 强度级别。

让r （i ），g （i ）和b （i ）分别为红色分量，绿色分量和蓝色分量的直方图，让x i ，y i ，z i 分别表示与R （I ），G （I ）和B （I ）强度相关的像素个数，。

峰值寻找算法可描述如下：
i.由以下方程表示红色分量，绿色分量和蓝色分量直方图：
r(i)=xi (1)
g(i)=yi (2)
b(i)=zi (3)
这里0<i<L-1，
Ii.利用原来的直方图，建立以下方程的一个新的直方图曲线：
((2)(1)()(1)(2))
()5s i s i s i s i s i Ts i -+-+++++= (4)
这里s 可以被r,g,b 代替并且2<=i<=L-3。

Tr(i)，Tg(i) 和Tb(i)是分别根据红绿蓝三通道得到的新的直方图曲线。

（注：基于对大量的图片的分析，窗口的一半大小可以设置的取值从2到5。

与原始直方图相比半窗大小小于2不能产生平滑的直方图曲线而过大可以产生平滑的直方图曲线的不同
形状。

）
iii.使用下面的公式确定所有的峰值：
Ps i Ts i Ts i Ts i andTs i Ts i
=>->+
((,())()(1)()(1)
（5）这里s可以被r,g,b代替并且2<=i<=L-2。

PR，PG和PB分别是由TR（I），TG（I）和Tb（I）确定的峰值。

iv.使用下面的公式确定所有的谷值：
Vs i Ts i Ts i Ts i andTs i Ts i
=<-<+
((,())()(1)()(1))
（6）
这里s可以被r,g,b代替并且2<=i<=L-2。

VR，VG和VB分别是由TR（I），TG（I）和Tb （I）确定的谷值。

V.依据下面的聚类法则移动所有的波峰和波谷：
IF（i is peak）AND (Ts(i+1)>Ts(i-1))
THEN (Ts(i)=Ts(i+1))
IF（i is peak）AND (Ts(i+1)<Ts(i-1))
THEN (Ts(i)=Ts(i-1))
IF（i is vally）AND (Ts(i+1)>Ts(i-1))
THEN (Ts(i)=Ts(i-1))
IF（i is vally）AND (Ts(i+1)<Ts(i-1))
THEN (Ts(i)=Ts(i+1)) (7)
这里s可以被r,g,b代替并且2<=i<=L-2
vi.通过转折点具有积极的负梯度变化确定的Tr(i), Tg(i)和Tb(i)主导峰的来确定像素的数量比预定义阈值H的方法好。

（注：基于大量的数字图片的分析，典型值H设为20。

）
2.1.2区域初始化
在寻峰算法后，在红绿蓝三个直方图中分别获得了三个主导峰的强度水平。

让X，Y和Z 分别定义红绿蓝直方图中主导峰的个数，Pr,Pg和Pb分别为红色分量绿色分量和蓝色分量的直方图是设置的主导峰的强度水平。

在红色，绿色和蓝色分量的直方图中，一个统一的区域往往靠聚类中心形成一个主导峰值，该地区的初始化算法被描述如下：
I.形成所有可能的聚类中心（注：在红色，绿色和蓝色直方图中每个组件聚类中心只能产生一个主导峰值。

因此，形成许多（x*y*z）可能的聚类中心的数目。

）
Ii.将每个图像的像素分配到最近的聚类中心，将每一个像素分配到相应的聚类中心。

iii.消除所有分配给它们的像素数小于阈值V的聚类中心（注：减少初始聚类中心数，v值设置为0.006n 到0.008n ，n是图像中的像素的总数。

）
iv.重新将每一个像素分配到最近的聚类中心。

（注：c1是聚类中心设置的l元素，x1是分配到c1的像素。

）
V.分别根据像素xl的模型更新每一个聚类中心cl.
2.1.3合并
该区域的初始化算法后，根据他们各自的聚类中心得到统一的区域。

为了产生一个更简明的代表均匀区域的聚类质心，这些区域在感知上很接近，可以合并在一起。

因此需要一个算法基于颜色的相似性合并这些区域。

一个最简单的颜色相似性度量方法是欧氏距离，它被用来测量两个均匀区域之间的颜色差异。

让C=（C1，C2，...，Cm）是一系列聚类中心，M是聚类中心的数目。

在本文中，合并算法可描述如下：
I.设置欧氏距离的最大阈值dc为一个正整数。

Ii.根据以下方程计算任何两种M 聚类中心的距离D ：
222(,)()()(),,D cj ck Rj Rk Gj Gk Bj Bk j k =-+-+-∀≠ （8）这里1j M ≤≤和1k M ≤≤。

Rj ，Gj 和Bj 分别是红色，绿色和蓝色分量的第j 个聚类中心，和Rk ，Gk 和Bk 分别是红色,绿色和蓝色的第k 个聚类中心。

iii.找到最近的聚类中心之间的最小距离。

如果它们之间的最小距离小于dc 那么合并这些最近的聚类质心形成新的聚类中心。

否则，停止合并过程。

iv.通过合并分配给这些最近的聚类中心的像素集,更新设置新的聚类中心的像素。

V.通过像素的模式设置更新新的聚类中心。

vi.减少聚类中心的数目从M 到（M - 1），重复步骤ii 到vi 直到最近的聚类中心之间的最小距离不小于dc 。

（注：通过对大量数字图片的分析，大多数的图像将dc 设置为24至32时聚类中心的数目保持不变。

）
2.2C 聚类
FCM 算法本质上是一个爬山的技术，它在是1973年由邓恩提出[ 32 ]并且1981年由贝兹德克改进[ 33 ]。

在计算机视觉和模式识别的图像分割中，该算法已被用来作为一种流行的聚类技术。

在FCM 算法中，每个像素具有一定的和每个聚类中心相关的隶属度。

这些隶属度值范围在[0,1]之间，表明图像的像素和一聚类中心之间的关联强度。

FCM 算法试图根据一些给定的标准将每个图像像素分为M 个模糊聚类中心的类中[ 34 ]。

设 N 是图像的总像素数而M 是隶属度的指数权重。

FCM 的目标函数是定义为Wm:
211(,)N M m
ji ji
i j Wm U C u d ===∑∑ (9)
这里uij 是第i 像素到第j 个聚类中心的隶属度dij 是第i 像素到第j 个聚类中心之间的距离。

设Ui=（U1i ，u2i ，...，UMI ）是与各聚类中心相关联的第i 个像素的隶属度集，xi 是图像的第i 个像素，Cj 是第j 个聚类中心。

U=（U1，U2，...，Un ）是隶属度矩阵C=（C1，C2，...，Cm ）是一系列聚类中心。

隶属度和聚类中心的均匀程度，在很大程度上取决于FCM 的目标函数。

一般来说，一个较小的FCM 的目标函数意味着一个更紧凑的和均匀的聚类中心集。

但是，没有封闭形式解产生目标函数的最小值。

实现目标函数的优化，必须由FCM 算法进行迭代过程。

在本文中，使用FCM 来提高利用直方图阈值模块产生的集群紧凑性。

FCM 可以描述如下：
i 设置迭代终止阈值，e 的范围在[0,1]的一个小的正数和迭代次数从q 到0。

Ii.用下面的公式根据C （q ）计算U （q ）：
2(1)11
()ij M m ji ki k u d d -==∑ (10) 这里1j M ≤≤，1i N ≤≤。

注意如果dji=0,uji=1则把其他的像素隶属度设为0。

Iii.用下面的公式根据U （q ）计算C （q+1）：
11N m ji i
i N m ji i u x cj u ===∑∑ （11）
这里1j M ≤≤。