聚类分析简单介绍 - 360文档中心

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

因为混合模型是一个灵活且强有力的概率建模工具,在理论和实践中得到了

极为广泛的应用,它具有以下的优势

(1)提供了用简单的结构模拟复杂分布的一个有效的模型。正态分布在实践中

应用很广,主要因为它形式较简单并且有很强的理论支持,因此它是最重要、最

基本的分布。理论己经证明,利用混合正态分布模型可以逼近任何一个光滑分布, 即只要项数it足够大,有限混合分布模型可以用于描述任何复杂现象,从而有利于解决实际生活中的许多难题。

(2)提供了模拟同质性和异质性的一个自然框架。当)t = l时,该模型是一个单一分布,因此数据具有相同的性质;当时,(1-1)式就反映了混合数据的异质

性。

(3)即使现象比较复杂时,混合模型在参数的框架内也提供了一个可行的建模

环境,它综合了参数模型的解析优势和非参数模型的灵活性,因而具有更多的建

模优势。

综上所述,混合分布模型是大量数据部分特征的比较有效的模拟。

高斯混合模型(Gaussian Mixture Model, GMM)是一个常用的描述混合密度分

布的模型,即多个高斯分布的混合分布ti5]。高斯混合模型是一种半参数的密度估计方法,它融合了参数估计法和非参数估计法的优点,既不局限于特定的概率密

度函数的形式,而且模型的复杂度仅与所求解的问题有关而与样本集合的大小无关。高斯混合模型的一个重要特性是,如果模型中的成员足够多,它能够以任意

精度逼近任意的连续分布。所以高斯混合模型在许多领域得到了广泛的应用。

复杂度这对矛盾,促使基于聚类分析的图像分割方法在实际图像分割应用中不仅可以得到正确的分割结果还可以满足计算效率的要求。

其二,制约软划分聚类算法在图像分割中应用的一个主要因素是算法对图像

中噪声干扰的抑制能力。在图像分割中,由于各种因素造成的不同程度的噪声存在于真实图像中,例如,核磁共振图像和计算机断层图像中由于部分容积效应产生的噪声,热红外图像中由于温度散射造成的噪声等等。这些图像的内容已经很复杂了并且具有很高的不确定性,再加之噪声的存在,影响了图像分割的效果,

干扰了感兴趣区域的提取。因此,通过分析和研究对软划分聚类算法引入和加强来自于图像像素间的空间信息能够提高算法在图像分割中对噪声的抑制能力。在空间信息的约束下,基于聚类分析的图像分割方法能够产生对噪声更加不敏感的分割结果并且提取出更加完整和平滑的感兴趣区域。

大化参数的似然函数的过程中搜索最优划分或解,例如模糊K均值算法[11],模糊J 均值算法[12],FMM[13-15], SVFMM[16]等。

对于图像分割问题来说,这两类聚类算法的关系是非常密切的。首先,硬划

分聚类算法先被提出并且对具有较简单内容的图像进行图像分割。经过一段时间的发展,通过引入不确定性分类思想,衍生出了软划分聚类算法,并且将它应用

于解决具有较复杂内容的图像分割问题。这说明这两类算法在解决图像分割问题上具有相同的核心思想,即基于相似性划分的图像分割。其次,由于引入了不确定性分类理论,软划分聚类算法可以解决硬划分聚类算法所不能解决的具有不确

定性的图像分割问题,弥补了硬划分聚类算法在一些应用上的不足。这说明这两类算法还存在互补关系。在对于一些具有较简单内容和确定性分割的图像上,采用基于硬划分聚类分析的图像分割方法,能够得到更高效的图像分割结果;在对

于一些具有较复杂内容和不确定性分割的图像上,采用基于软划分聚类分析的图像分割方法,能够得到更准确的图像分割结果。下面将两类基于聚类分析的图像分割方法的特点在表1.1中进行比较。

表1.1两类基于聚类分析的图像分割方法概述

Tab. 1.1 the summary of two kinds of image segmentation method based on clustering analysis

分割特性分割类型分割内容计算速度

基于硬划分聚类分析的图像分割方法相似性划分确定性较简单S~

基于软划分聚类分析的图像分割方法相似性划分不确定性较复杂gs~

然而,在这些聚类算法中还存在一些尚未完全解决的问题,这些问题影响了

基于聚类分析的图像分割方法在实际应用中发挥其固有的优势。

其一,在硬划分聚类算法中,高聚类精度与低计算复杂度往往是一对矛盾。

尤其是在最小化目标函数的过程中,为了避免陷入局部最小,聚类算法通常会牺

牲计算效率来提高聚类精度。在实时图像分割中,这对矛盾限制了聚类算法的应用范围。因此,通过研究硬划分聚类算法的搜索策略来调和高聚类精度与低计算3

基于聚类分析的图像分割

方法主要具有三大特点,无监督性,高效性和自适应性。

无监督性主要是在图像分割过程中,相对于一些监督的图像分割方法而言,

它不需要人为地调整一些参数来产生图像分割结果,而是根据像素间的相似性进行分割,使图像分割方法具有一定的自动化和智能化的特点。

高效性是通过聚类算法中高效的搜索策略在很短的时间内搜索出最优划分而

体现出来的。

对于自适应性而言。在某些实际应用中,往往一些目标或者感兴趣区域在不

同的成像环境下的特征是不同的。举例来说,在航空遥感输电线路部件监测应用中,虽然每次拍摄的部件和它的背景是不变的,但是由于天气和光照的原因,可

能会造成每次成像的图像在对比度,明暗度以及一些特征信息上出现了较大的变化。这对于一些图像分割方法来说,需要重新调整参数甚至需要重新建模来适应感兴趣区域和非感兴趣区域特征发生的变化;然而,对于基于聚类分析的图像分

割方法而言,即使感兴趣区域和非感兴趣区域的特征数值都发生了变化,只要它

们自身特征的相似性没有发生很大的改变,图像分割的结果就不会发生很明显的变化,这体现了该方法的自适应性。

聚类算法可以被分为硬划分聚类算法和软划分聚类算法。对于图像分割问题,

硬划分聚类算法直接利用像素的特征值(例如灰度,颜色,纹理等)进行相似性划分, 并且在最小化目标函数的过程中搜索最优划分或解,例如经典的K均值算法[7], H均值算法[8],J均值算法[9],全局K均值算法[10]等。软划分聚类算法利用像素的归属度或者概率间接地对像素进行相似性划分,并且在最小化目标函数或者最2