基于模糊Bayes-Gauss判别法的遥感影像的聚类

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于模糊Bayes-Gauss判别法的遥感影像的聚类
颜军;陈水利;吴云东
【摘要】针对Fisher线性判别法和传统的Bayes判别方法在遥感影像聚类问题研究中存在的不足,提出一种以隶属度代替先验概率的模糊Bayes-Gauss聚类算法,并将此算法应用于真彩色(RGB)图像中的草地、道路、裸土地和建筑物的聚类.实验结果表明,本算法在聚类中与Fisher线性判别法和传统Bayes判别法相比,具有精确度较高、误识率和拒识率较低、适用性较强的特点.
【期刊名称】《集美大学学报(自然科学版)》
【年(卷),期】2011(016)002
【总页数】5页(P154-158)
【关键词】遥感影像;加权Fisher判别法;Bayes判别法;模糊Bayes-Gauss判别法【作者】颜军;陈水利;吴云东
【作者单位】集美大学理学院,福建,厦门,361021;集美大学理学院,福建,厦
门,361021;集美大学影像信息工程技术研究中心,福建,厦门,361021;集美大学理学院,福建,厦门,361021;集美大学影像信息工程技术研究中心,福建,厦门,361021【正文语种】中文
【中图分类】O29;P231
从20世纪60年代开始,尤其是80年代以后,航天技术、传感器技术、计算机技术等的发展,极大地推动了遥感技术的发展,遥感影像也因此得以广泛应用.传统的遥感影像数据聚类一般都是基于多光谱或高光谱进行的,目前最简单的聚类方
法为目视解译聚类法[1].由于从目视聚类的角度来说,高光谱或多光谱遥感影像中并非每个波段的信息都有利于影像数据的聚类,往往依据实际应用的具体要求选取最佳的几个波段信息进行聚类[2].而人眼对彩色敏感且分辨能力强,故利用信息丰富的地物RGB真彩色图像就可以很好地聚类出各地物,再者,RGB彩色相机相对较轻,便于无人机的搭载.高光谱和多光谱相机相对较重,往往超出了低空无
人机的承载限度,不利于携带.因此,相对于高光谱和多光谱影像而言,RGB彩色
影像更易于为人们所获取,因而基于RGB真彩色遥感影像的判别应得到重视.
在RGB彩色图像中,经典的聚类算法均为基于像元单独处理,地物聚类结果整体
效果不是很好.K-近邻判别法[3]是直接基于样本点之间的最小距离来进行聚类,结果比较粗糙;快速FCM算法[4]和模糊ISODATA聚类算法[5]都基于预先
确定的阈值来聚类,阈值的好坏直接影响聚类结果的好坏,效果也不是很好.目前,对Fisher线性判别法 (Weighted fisher linear discriminant)[6]的研究比较深入,虽然它也是基于阈值进行聚类,但其阈值综合了各样本的信息,具有较好的合理性,得到的聚类效果虽有所改善,但仍不理想.传统Bayes判别法 (Bayes Algorithm)需要在聚类之前确定先验概率[7].而在实际的聚类过程中,各类占总类的比例无法确切地知道.一般是由经验丰富的专家得出,这种方法虽然简便,但
是存在很强的主观性,因而降低了聚类的效果.为了改善聚类效果,提高聚类整体
的精确性,本文在传统Bayes聚类算法的基础上做了进一步的改进,提出了模糊Bayes-Gauss聚类算法 (Fuzzy Bayes-Gauss Criterion),并将其应用到真彩色图像的地物聚类中,以求得到比较好的聚类效果.
Fisher线性判别法的基本思想是通过寻找一个最好的投影方向,将特征向量x由d 维压缩到一维,在这一维空间中,同类样本间的距离尽可能的小,而异类间的距离尽可能的大.但是,Fisher线性判别聚类的好坏由投影方向ω决定,因此ω将直
接影响线性判别聚类的性能.而投影方向ω由总类内离散度矩阵Sω和两类样本的
均值向量之差(m1-m2)共同决定.假若各模式类满足独立同分布,则各类样本的均值向量与样本的个数无关,即投影方向ω由总类内离散度矩阵Sω唯一决定.设两类的样本协方差矩阵分别为∑1和∑2,于是Fisher线性判别中的总类内离散度矩阵Sω=S1+S2变形为分别为两类样本的总数).若两类样本个数不平衡(N1≪N2),则可得到N2∑2对Sω的贡献远远大于N1∑
1对Sω的贡献,从而致使得到的投影方向ω不利于少数样本类的分类.为消除样本个数不平衡的影响,对两类的类内离散度矩阵Si分别进行加权,得到加权Fisher线性判别法.即:加权的Fisher线性判别法通过对两类的类内离散度矩阵Si 分别进行加权后,两类样本的协方差矩阵对Sω的贡献就达到了平衡[6].
传统Bayes判别聚类的基本思想为:抽取样本之前各模式类的先验概率已经知道,然后通过抽取的样本再对先验知识作修正,得到后验概率.最后,基于后验概率对未知样本进行聚类[8].将Bayes聚类的思想用于判别分析,就得到Bayes判别法.
利用传统Bayes判别法对样本进行聚类,必须满足以下两个条件[7]:1)决策聚类的类别数是一定的.2)各模式类总体的概率分布是已知的.即:明确聚类问题有c个模式类,分别用wi(i=1,2,…,c)表示;已知待识别样本x的特征向量所对应的状态后验概率p(wi|x),或者已知对应于各个类别wi出现的先验概率p(wi)和类条件概率密度函数p(x|wi).
对于两类模式聚类问题,基于最小错误率贝叶斯聚类的判别准则为:对于待识别样本x,如果它属于模式类w1的概率大于属于模式类w2的概率,则判决样本x属于模式类w1;反之,判决模式x属于模式类 w2.即,若则x∈w1;反之,则x∈w2.由于从而得贝叶斯公式:分别是w1类和w2类下待识别样本x的类条件概率密度. 在传统的Bayes判别法中,选择的概率密度函数不一样,往往得到的结果也大不相同.一般感兴其中趣的是当概率密度函数为高斯概率密度函数 (PDF)的情形.由数
学知识可得n维高斯密度函数(PDF)的计算公式为:
其中,Cj和mj分别为模式类wj(j=1,2,…,c)的样本族的协方差矩阵和均值向量,是Cj的行列式.
Nj表示获取模式类wj的样本数量,wjk表示模式类wj的第k个样本.因此,传统Bayes判别法的判别准则亦可写为:若
为了克服先验概率确定的主观性、欠合理性,又基于待识别对象判属于各模式类的先验概率不确定性且满足先验概率和为1的特点,本文将先验概率看作是一个模糊隶属度,于是确定先验概率的问题就转化为寻找模糊隶属度函数的问题.设样本集为X,由于样本集的每一模式类wj可看作是X的模糊集合,故wj可由X上的一个实值函数uj:X→[0,1]来表示.对于c类聚类问题,设待识别对象为x,uj(x)称为x隶属于模式类wj的隶属度,称uj为wj的隶属度函数[9].通过大量的实验,本文选取如下形式的函数作为隶属度函数:
显然0≤uj(x)≤1,并且满足各模式类的先验概率和为1.通过这样的转化,在进行聚类之前就无需人为主观地确定各模式类的先验概率,而是在对各待识别对象判别时进行实时的确定.由于隶属度的确定综合了各样本块中元素的重要信息,同时也克服了人为主观因素的影响,从而提高了模糊Bayes-Gauss判别法的精确性和合理性,也克服了传统Bayes判别法中先验概率确定的主观性与不合理性,使得本算法具有较强的适用性.
模糊Bayes-Gauss判别可通过判别准则来表达,其表述为:若
则把 x归属于模式类 wj.
若将待识别样本分为c类,则模糊Bayes-Gauss判别的算法步骤为:
1)选取各模式类的样本,利用式 (2),求出模式类wj的样本族的协方差矩阵Cj和均值向量mj;
2)按式 (3)给出的隶属度函数,求出待识别对象x隶属于各模式类wj的隶属度
uj(x);
3)根据步骤1)得到的协方差矩阵Cj和均值向量mj,利用式 (1)计算待识别对象x
的后验概率
4)由模糊Bayes-Gauss判别准则对待识别对象进行聚类.
为了验证本文算法的有效性和适用性,用来源于低空遥感系统获取的厦门新客站影像数据 (图像分辨率为2 496×1 664)做了大量的实验,分别比较了加权Fisher线性判别法、传统Bayes聚类算法与本文算法的精确性.
实验1:分别利用传统的Bayes判别法和模糊Bayes-Gauss判别法对图1a进行
聚类,图1b、图1c是得到草地类的结果,其中白色区域即为草地.对比图1b和
图1c可以得到,两种聚类判别法都能够很好地识别草地整体.由于传统的Bayes
判别法在聚类之前,各模式类的先验概率已唯一确定,在判别中固定不变,因此,对于先验概率带来的误识率显得无能为力.本文算法克服了在聚类之前必须确定先
验概率的缺陷,它是在判别过程中综合各样本信息动态地确定隶属度.由表1可知,本文算法较好地降低了聚类结果的误识数量,显示出了较好的抗误识性能.
实验2:分别利用加权Fisher线性判别法和模糊Bayes-Gauss判别法对图2a进
行聚类,图2b、图2c是得到草地类的结果.对比图2b和图2c可以得到,加权Fisher线性判别法的误识数几乎没有,但拒识数较多,致使得到的草地类整体不
够好,而模糊Bayes-Gauss判别法能够很好的识别出草地整体.由表2的数据可知,模糊Bayes-Gauss算法能够较好地减少聚类的拒识数,显示出了其具有较
强的降低拒识率的优点.
实验3:图3b、图3c是分别利用传统的Bayes判别法和模糊Bayes-Gauss判别
法对图3a进行聚类得到建筑物的结果.由图3b和图3c,结合表3可以看出:在真
彩色 (RGB)图像的聚类中传统的Bayes判别法的抗误识性能比较差,聚类结果中
包含有太多的误识点,与理想的聚类结果相差较大,而本文算法考虑了判别中样本
隶属于各模式类具有动态性,较好地减少了结果中误识的数量,聚类结果较传统Bayes判别法具有更高的精确度,且更适用于实际聚类中.同时,也显示出了本文
算法具有较强的适用性.
本文提出的模糊Bayes-Gauss判别法,直接对真彩色 (RGB)遥感影像数据进行
聚类,能避免传统的Bayes判别法先验概率的确定,较好地降低了聚类的误识率
和拒识率,提高了聚类的可信度与合理性,而且也克服了传统的Bayes判别法使
用的局限性,具有较好的适用性.但是,本文算法仍存在少许的误识,从而有待进
一步考虑遥感影像的纹理和结构特征来进行聚类.
【相关文献】
[1]钱乐祥.遥感数字影像处理与地理特征提取[M].北京:科学出版社,2004.
[2]刘建平,赵英石,孙淑玲.高光谱遥感数据最佳波段选择方法试验研究[J].遥感技术与应用,2001,16(1):6-13.
[3]于一.K-近邻法的文本分类算法分析与改进[J].火力与指挥控制,2008,33(4):143-145. [4]杨勇,郑崇勋,林盘.基于改进的模糊C均值聚类图像分割新算法[J].光电子·激光,2005,16(9):1118-1122.
[5]万建,王继成.基于ISODATA算法的彩色图像分割[J].计算机工程,2002,5(28):135-136.
[6]尹军梅,杨明.一种面向单个正例的Fisher线性判别分类方法[J].南京师范大学学报:工程
技术版,2008,8(3):61-65.
[7]付丽,孙红帆,杨勇,等.基于贝叶斯分类器的图像分类技术[J].长春理工大学学报:自然科学版,2009,32(1):132-134.
[8]边肇棋,张学工.模式识别[M].北京:清华大学出版社,2001.
[9]陈水利,李敬功,王向公.模糊集理论及其应用[M].北京:科学出版社,2005.。

相关文档
最新文档