混合像元分解技术的研究进展与主要问题

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

混合像元分解技术的研究进展与主要问题
陈晋陈学泓
地表过程与资源生态国家重点实验室(筹) ,北京师范大学,北京,100875
摘要:遥感影像中一个像元常常覆盖超过一种地物类型,这种包含几种地物光谱信息的像元
被称为混合像元。

混合像元在遥感影像中普遍存在,解决该问题对遥感定量解译具有重要的
意义,是遥感由定性向定量化发展中不可回避的问题。

因此,在过去几十年中,遥感学者们
开展了不少对混合像元问题的研究。

但是混合像元分解技术仍然存在一些不确定性和误差。

本文从以下四个方面综述当前关于混合像元分解的研究成果:(1)混合模型的建立;(2)线性
混合模型中端元选取方法;(3)端元内光谱异问题;(4)混合像元分解精度评价。

并总结了现
存的主要问题与可能的研究方向。

关键词:混合像元分解;光谱混合模型;端元提取;端元内光谱差异;精度评价
Review of advancement and prospects of Spectral Mixture
Analysis
Chen Jin Chen Xueh ong
State Key Laboratory of Earth Surface Processes and Resource Ecology,
Beiji ng Normal Uni versity, Beijing 100875, Chi na
Abstract: The phe nomenon that in dividual pixel covers more tha n one gro und cover type commonly exists in remotely sensed images. This is called as mixed pixel, which not only results in lower accuracy for the land cover discrim in ati on and classificati on, but also greatly hin ders the developme nt of qua ntitative remote sensing. In past decades, a nu mber of algorithms for Spectral Mixture An alysis(SMA) have bee n developed to solve this problem. However, there are still some un certa in ties in the research of Spectral Mixture An alysis. This paper reviewed four issues of the SMA: (1) Establishment of spectral mixture model; (2) Endmember identification in linear spectral mixture model; (3) Effect of en dmember spectral variability; (4) Accuracy assessme nt of SMA. In the end, a summary about the problems and the prospective studies in the SMA was con cluded.
Keywords: Spectral Mixture An alysis; Spectral Mixture Model; En dmember Determ in ati on; En dmember Spectral Variability; Accuracy Assessme nt
*本研究得到国家高技术研究发展计划(863计划)(2006AA12Z103资助。

第一作者:陈晋(1967-),工学博士,教授,在国内外遥感期刊发表论文80余篇,Email: chenjin@。

1.引言
遥感影像通常以像元为单位获取地物信息,它所记录的是像元内所有地物的混合光谱。

在遥感图像中,一个像元往往覆盖几米甚至上千平方米的地表范围,其中可能包含着多种地物类型,这就形成了混合像元。

混合像元的存在主要有以下两个原因[1]:一是传感器的空间分辨率较低,不同的地物可能存在于一个像元内,这种情况一般发生在遥感平台处于比较高的位置或者拥有宽视角;二是不同的地物组合形成同质均一化的地表类型,这种情况的发生不依赖于传感器的空间分辨率。

混合像元问题在遥感影像中普遍存在,不仅会影响地物识别和分类的精度,而且是遥感科学向定量化发展的主要障碍。

因此,混合像元分解一直是遥感科学发展的热点问题,也是利用遥感技术提取地表信息无法回避的步骤之一。

同时,随着多光谱、高光谱传感器的发展,人类已能够获取上百个波段的光谱信息,这使得混合像元分解具备足够的技术可行性[1]。


过去的二十年里,不少混合像元分解技术被提出,并在环境监测[2, 3]、水质监测[4]、土地覆
盖变化检测[5]、植被制图[6]以及月球表面物质制图[7]等各个领域得到成功的应用,但同时也暴露出现有混合像元分解技术本身具有的若干不确定性和不精确性。

目前,对混合像元分解的研究主要集中在以下四个方面:一是混合模型的建立;二是线性混合模型中端元选取方法;三是混合模型中如何考虑端元内光谱差异;四是混合像元分解精度的评价。

本文在系统整理近年来相关研究文献基础上,从这四个方面重点综述研究最新进展和面临的主要问题。

2. 混合像元分解的基本原理混合像元分解技术假设:在一个给定的场景里,地表由少数的几种地物(端元)组成,并且这些地物具有相对稳定的光谱特征,因此,遥感图像的像元反射率可以表示为端元的光谱特征和它们的面积比例(丰度或盖度)的函数:
r F(f1, f 2 ,... f m,x1,x2,...,x m)(1)
其中r向量表示混合光谱,X i,X2,…,X m表示m个端元的光谱,f l, f2,…f m表示各端元的面积比例,F 为混合模型函数,混合像元分解途径一般通过建立光谱的混合模型实现。

由于假设地物(端元)具
有相对稳定的光谱特征, 场景中不同像元间光谱的差异主要是端元比例变化的结果。

3.光谱混合模型
定量的光谱混合模型是混合像元分解技术的理论基础。

由于地表的复杂性,光谱混合过程与光源-地物-传感器的几何关系、地物的三维结构(比如树高、冠层大小等)与散射特征、大气状
况等都有关系,因此目前尚无统一的模型可以适用于各种类型的地球表面。

光谱混合模型可以分为线性模型和非线性模型。

3.1 线性模型
线性混合模型(Linear MiXing Model, LMM )[8,9]是最简单,也是应用最广泛的光谱混合模型。

在线性模型中,混合光谱等于端元光谱与端元面积比例的线性组合。

该模型基于以下
假设[10]:到达遥感传感器的光子与唯一地物发生作用(即不同地物间没有多次散射)。


果存在m个端元,L个波段,线性模型的数学表达式如下:
m r f i x i w
XF w (2)
i1
其中r是L 1的向量,表示混合光谱;X是L m矩阵,表示端元光谱;F是m 1向量,表示各端元的面积比例;w是L 1向量,表示观测误差。

为使LMM具有物理意义,需要受
m 到两个约束条件限制:一是端元面积比例之和为1,即f i 1;二是所有的端元比例都为
i1
非负的,即f i 0,i 1,..., m 。

3.2 非线性模型
当到达传感器的光子发生多次散射时,就会产生非线性混合。

非线性光谱混合现象很早就在矿物研究领域被发现[11],遥感学者们发现在很多地表情况下都存在非线性光谱混合现象,这也催生了多种非线性混合光谱模型。

目前,常见的非线性模型有:几何光学模型、概率模型、模糊模型、神经网络以及高次多项式模型。

下面主要介绍应用较为广泛的高次多项式模型和几何光学模型。

(1)高次多项式模型
高次多项式模型通过考虑端元之间的交叉项来描述光谱混合的非线性效应。

二次多项式的混合模型的数学表达式为:
mm
r f i x i f ij x i T x j (3)
i 1 i 1,j 1
其中X j T X j表示i类地物和j类地物之间的多次散射光谱。

Ray等(1996)[19]首次提出该模型,并将其应用于沙漠植被盖度反演,Zhang 等(1998)[20]将该模型用于潘阳湖地区的土壤、
植被盖度研究。

该模型尽管可以很好地模拟混合光谱中多次散射的贡献,但是所计算得到的
端元比例却不能直接对应于地物的盖度,需要将多次散射项的虚拟比例(命)合理分配到各
端元的盖度上。

一般认为,多次散射主要发生在植被内部,故将多次散射项的虚拟比例全部分配给植被端元[]。

Ben Sorners等(2009)[21]通过地面实验发现将交叉项的虚拟比例(f j )按计算得到的一次散射项的比例(f i)分配给各个端元能够取得更好的精度。

(2)几何光学模型
几何光学模型[12]适用于植被覆盖地区,它将植被简化为一系列规则的几何体(如圆锥、椭球体等),进而假设地表由四种组分(端元)构成:植被光照面(C)、植被阴影面(T)、光照背景面(G)、背景阴影面(Z)。

则混合像元的反射率可以表示为:
r f C X C f T X T f G X G f Z X Z (4)其中r表示混合光谱的反射率,X c、X T、X G、X Z分别为四个基本组分的反射率,f c、f i、
f G、f Z 分别代表它们所占的面积比例。

这些组分所占的面积比例与树冠、树高、树密度、太阳入射角、观测角都有关。

因此,在实际应用中,往往要对地表特征进行简化,假设树冠具有相同的规则几何形状,假设树木的高度,位置满足一定的分布。

几何光学模型基于植被景观的三维几何特征,需要关于植被的详细几何参数。

(3) 其他非线性模型
概率模型基于Marsh 等人( 1980)[13]提出的近似最大似然法。

该模型将端元比例求取问题转化为分类概率问题。

通过各端元光谱与混合光谱的相似性判别分析,产生一个判别值,根据判别值决定端元所占的比例。

该模型只考虑两种地物混合的情况。

另一个有代表性的工作是由Ju 等( 2003)
[14]提出的MDA (Mixture Discriminant Analysis )方法。

MDA 方法将混合像元光谱分布用多个高斯分布的端元光谱曲线叠加来表示,其中分布的参数估计由期望最大算法(Expectation Maximization, EM) 算法完成,进而根据贝叶斯原理得到像元归属于各类端元的后验概率。

由于后验概率满足非负且总和为 1 的两个约束条件,因此可以直接用后验概率来表示混合像元的端元比例。

模糊模型由Wang( 1990)[15]提出,其基本原理与概率模型相似,即将端元比例求取问题转化为模糊分类的隶属度问题。

该模型根据模糊数学的运算法则确定各端元光谱的模糊均值和模糊协方差矩阵,进而得到混合像元对各端元的隶属度,隶属度即可对应于相应的端元比例。

神经网络本质上是一种机器学习算法。

与基于神经网络的硬分类方法不同点在于:用于混合像元分解神经网络的输入层为混合像元光谱,输出层为像元归属于各类端元的判别值,即相应的端元比例。

而用于混合像元分解的神经网络的训练样本不再只归属于某一类,而是将训练样本的端元比例作为输出层的值进行学习。

由于神经网络是非线性加权模型,适当的神经网络能够模拟出非线性混合过程。

但是神经网络的表现效果与其自身的结构有很大的关系,常见的用于混合像元分解的神经网络结构有:BP 神经网络( back-propagation neural network ) [16]、ARTMAP [17]、ART-MMAP [18]等。

3.3 光谱混合模型评述
线性模型建立在像元内相同地物都有相同的光谱特征以及光谱线性可加性基础上,同时忽略了多次散射过程。

其优点是物理意义明确、构模简单。

但其基本假设光谱线性可加性和对多次散射过程的忽略处理是对现实情况的粗略近似,可能直接影响到像元分解的精度。

非线性模型中的高次多项式模型和几何光学模型考虑了多次散射过程。

高次多项式模型通过考虑端元之间的交叉项来描述光谱混合的非线性效应,几何光学模型则把地面当成三维物体考虑多次散射。

而其他非线性模型则主要将将端元比例求取问题转化为软分类问题。

这些模型虽然简单方便,但缺乏清晰的物理意义。

在不同的情况下使用不同的混合模型是非常重要的。

有研究表明[22],将线性模型用于
非线性光谱混合的数据,反演的端元比例误差会达到30% 。

然而,已有研究尚未给出各种
混合模型的适用条件及其定量判据,模型的选择只能根据使用者的经验进行判断。

如何根据地物端元特征选择混合模型的研究仍需要大力加强。

同时,尽管在特定的表面使用特定的非
线性模型有明显的优点,但非线性模型并没有得到广泛的应用,主要原因是地物的详细散射参数通常很难获取,而这些参数往往会对最后的反演结果有着相当大的影响[1]。

4. 线性混合像元分解算法
由于线性模型是应用最广泛,也是研究最多的算法,本文重点介绍基于线性模型的混合像元分解算法。

一般而言,混合像元分解算法包括数据降维、端元选取和反演三个步骤。

4.1 数据降维
尽管数据降维不是混合像元分解算法的一个必需步骤,但由于大多数算法都将其作为一个流程,我们也将其当作一个步骤。

常用的降维算法有主成分分析( Principle Component Analysis ,
PCA )、最大噪声比变换 ( Maximum Noise Fraction ,MNF )和奇异值分解 (Singular Value Decomposition ,SVD )。

(1) 主成分分析
遥感图像各波段之间经常是高度相关的,因此所有的波段参加分析是不必要的。

PCA 就是一种去除波段之间相关性的变换。

PCA 通过对原数据进行线性变换,获得新的一组变量,即主成分。

其中前几个主成分包含了原数据主要方差,同时各个主成分之间是不相关的。

(2) 最大噪声比变换
最大噪声比变换(Maximum Noise Fraction , MNF ) [23]由Green 等(1989)提出,该变换通过引入噪声协方差矩阵以实现对噪声比率的估计。

首先,通过一定方式 (比如对图像进行高通滤波) 获取噪声的协方差矩阵,然后将噪声协方差矩阵对角化和标准化,即可获得对图像的变换矩阵,该变换实现了噪声的去相关和标准化,即变换后的图像包含的噪声在各个波段上方差都为1,并且互不相关。

最后对变换后的图像再做主成分变换,从而实现了MNF 变换,此时得到的图像的主成分的解释方差量对应于该主成分的信噪比大小。

(3) 奇异值分解
奇异值分解( Singular Value Decomposition, SVD )也是遥感图像处理中常用的变换,与PCA类似,SVD能够找出包含原始数据大部分方差的特征方向,不同的是,SVD特别适合于
波段间高度相关的数据,而PCA在这种情况下很有可能会失败I24】。

4.2 端元选取
选取合适的端元是成功的混合像元分解的关键[25, 26]。

端元选取包括确定端元数量以及端元的光谱。

理论上,只要端元数量m小于等于L+1( L表示波段数),线性方程组就可以
求解。

然而实际上由于端元波段间的相关性,选取过多的端元会导致分解结果更大的误差,尽管此时残差会减少[27]。

在能够描述一个场景内光谱的大部分方差的前提下,越少的端元数量是越好的选择[28]。

对于城市地区,最常用的端元选取方式是由Ridd 等(1995) [29]提出的植被-不透水层-土壤端元模型(Vegetation - Impervious surface - Soil, V-I-S ), V-I-S 模型在很多研究中得到应用[2,30-34]。

而在非城市地区,一般采用植被-土壤-阴影(或干植被)端元模型。

端元的数量和类型确定后,下一步是确定端元的光谱。

端元光谱的确定有两种方式:(1) 使用光谱仪在地面或实验室测量到的“参考端元”;(2) 在遥感图像上得到的“图像端元” 。

参考端元虽然可以精确测量,但由于各种因素 (包括不同传感器、大气影响、辐射条件及物候等) 造成的噪声,可能会导致其与图像上像元光谱的不一致。

要将二者匹配起来需要进行复杂的校正,而且参考端元的微弱噪声就可能引起最后计算得到的端元比例有很大误差。

相对而言,直接从图像上寻找端元更加直接方便,因而得到广泛研究。

图像端元选取的方法大致可以分为两类:交互式端元提取和自动端元提取。

421交互式端元提取
从图像上选取端元的各种方法, 都基于这样一种思想: 在特征空间中,所有的混合像元
都存在于由端元连接而成的多边形(或多面体)内(如图 1所示),这样的混合像元才能满足 端元面积比例为正值并且总和为 1的条件。

因此,最简单的交互式提取方法就是在特征空间
中(通常是前两个或三个主成分构成的特征空间)
目视寻找多边形的顶点作为端元。

为了减
少目视选取的主观性,一些定量化方法被引进作为选取端元时的参考,
这些方法的特点是仍 然需要人工参与,所以被称为交互式提取。

(1) PPI 指数[35]:像元纯度指数(Pixel Purity Index )是最成功的方法之一。

首先对图像进
行MNF 变换以实现数据降维,接着在由 MNF 的前几个主要成分组成的特征空间中,随机生 成穿过数据云的测试向量,然后将数据点投影到测试向量上。

投影在测试向量两端的数据点
有较大的可能性属于端元, 用一个阈值选出在这个测试向量两端的极值点。

继续生成新的随
机向量,重复上述步骤,记录图像中每个像元作为极值点的频度,即为
PPI 指数。

PPI 指数越 高意味着像元的纯度也越高。

(2) MEST 算法[36]: MEST ( Manual Endmember Selection Tool )算法通过主成分分析来确 定混合物中端元的数目。

对于三维及三维以内的数据而言, 可以直接通过目视选取多边形的 顶点来确定端元,但对于更高维数的数据,显示上存在困难。

MEST 提供了一种在高维空间 中寻找端元光谱的方法。

(3) CAR 和EAR 指数[37]:由于端元内的光谱差异,一类端元往往对应很多条光谱,这两
个指数用于解决从多条光谱中选择最具代表性的光谱问题。

CAR ( Class Average RMSE )计 算A 类端元光谱用B 类端元光谱来分解产生的残差 ,显然残差越小,A 、B 两类端元的混淆性越 大。

EAR (Endmember average RMSE )计算A 端元内某一条光谱用 A 端元内其他光谱来分解 产生的残差。

显然EAR 越低表明这条光谱的代表性越好,
如果很高则证明这条光谱可能是离 群点,没有代表性。

因此,利用
CAR 和EAR 指数可以为端元的合并或分离提供依据,进而 指导端元选取。

4.2.2自动端元提取
[1] 自动端元提取指不需要人工参与的端元提取方法。

相对于交互式提取方法, 自动方法的
图1端元选取示意图[1]
Fig.1 Schematic of en dmember determ in ati
on
提取结果不受个人的主观性影响,但是由于自动提取方法一般采用纯数学判据,有时可能产
生不具有物理意义的端元。

常见的自动提取方法有:N-FINDR、IEA、CCA和ORASIS。

(1) N-FINDR [38]: N-FINDR寻找这样一组像元,它们在特征空间中构成的单形体具有最大的体积。

首先对图像作MNF变换,随机选择m个像元作为端元,则这些像元构成的单形体的体积为:
1
V ------------ abs(E) ( 5)
(m 1)!
1 1 (1)
其中E ;s,i 1,…,m为端元的光谱向量。

然后依次将每个像元光S l S2 ... S m
谱代入各个端元位置,计算体积,若体积增大,则将该像元光谱替换为端元。

不断循环直至体积不再增大,此时得到的端元即最终的端元。

(2) IEA [39]: IEA ( Iterative Error Analysis )寻找端元使得最小二乘法的拟合残差最小。

IEA无需对数据进行降维,它首先选择图像均值作为初始向量,根据这个向量开始进行第一
次分解,得到一幅残差图像。

选择一定数量的残差最大的像元形成像元集,对该集合中光谱
角较小的像元光谱求平均作为第一个端元。

然后,以第一个端元为初始向量开始第二次分解,
重复以上步骤得到了第二个端元。

以此类推,最后直到得到了规定数量的端元或残差图像小
于某个阈值,停止运算,所得到的端元即为最终的端元。

(3) CCA [40]: CCA( Convex Cone Analysis)寻找特征空间中散点图构成的单形体的角点。

该算法首先计算图像相关系数矩阵的m个特征向量(m为端元数量)P1,p2…,P m,则所有的
像元光谱可以表示为
x P1 a®2 ... a m 1P m 0 ( 6)
其中印,…,a m1至少满足一个为零的像元点为数据云的角点,被当作端元光谱。

⑷ ORASIS [41]:在ORASIS (Optical Real-time Adaptative Spectral Identification System) 系统中,有一个称之为“样本选择”的算法来选择端元。

首先选择一组样本像元,再与图像的其他数据作光谱角匹配,去除光谱角相近的像元,只保留光谱角超过某个阈值的像元作为新的样本光谱。

接着利用修正的Gram -Schmidt正交化过程得到数目较少的一组基来构成子空
间,再将样本光谱投影到子空间中,利用最小体积算法找到子空间中包含所有数据点的外接单形体,单形体的角点即为端元。

由于外接单形体的角点并不一定是图像上的数据点,因此即使图像上没有包含纯像元,ORASIS也可能找到端元光谱。

(5)结合空间信息的方法:上述几种方法都只是利用了像元的光谱信息,近年来一些学者提出了结合空间信息的方法。

Plaza等(2002) [42]提出了一种基于数学形态学的AMEE 算法(Automated Morphological Endmember Extraction)。

它首先将建立在二值图像上的腐蚀和膨胀算子拓展到多光谱图像中,Plaza等证明了腐蚀算子能够寻找到结构元里的混合最严重
的像元,而膨胀算子则可寻找到其中的最纯像元,并提出MEI指数用于表示结构元中纯像
元的纯度。

将结构元依次通过图像中的每个像元,可以在结构元定义的邻域中找出最纯的像
元及其MEI指数。

不断增加结构元的大小,重复计算像元的MEI,并将不同大小结构元的
MEI作平均得到最终的MEI图像。

MEI指数大于一定阈值即为纯像元。

另外,Rogge等(2007) [43]提出的SSEE算法(Spatial-Spectral Endmember Extraction )通过结合先验的空间知识来获取更准确的端元光谱。

该算法的主要思想是:在图像的特定区域,混合像元包含特定的几个
端元组分,进而可以将特征空间中的数据按照真实空间位置划分成不同的组,再做端元提取,
以获取更高的精度。

Plaza等(2004)[44]比较了各种端元选取方法的优劣,结果表明结合空间信息的AMEE比其他单纯利用光谱信息的方法更具优势。

4.3反演
最简单的线性混合模型反演过程是无约束的最小二乘法,该方法假设观测误差w为高
2
斯白噪声,则对端元比例的最佳估计可以通过最小化r XF?U得到,此时估计的比例有
解析表达式:
F?U(X T X) 1X T r ( 7)
m
考虑到端元比例的物理意义,需要满足约束条件f i 1,则可通过拉格朗日乘子法求解
i 1
部分约束最小二乘法(abun da nee sum-to-o ne con strai nt,ASC),其解析解为
F U T 1 T T 1 T 1U
F F (X X) Z Z(X X) Z (ZF? b) (8)其中Z是1 m的向量,其所有的值为1,b=1。

如果考虑端元百比都为非负值,则需要利用非负最小二乘法(abundanee non-negativity constraint ,ANC)。

非负最小二乘法没有解析解,只能通过迭代的方法求得数值解。

Heinz等(2001)[45]提出全约束最小二乘( fully constrained least squares, FCLS)的求解方法。

由于该方法能够同时满足两个约束条件以及高效的运算效率,因而得到广泛认可。

但是也有学者认为,准确的混合像元模型的分解结果应当自动满足两个约束条件,强加的约束条件可能会导致新的误差[46,47]。

5. 端元内光谱差异问题
一般的混合像元分解算法假设相同地物都有相同的光谱特征,因而对整幅图像采用相同
的端元光谱。

但由于同物异谱现象的存在,端元的光谱并非恒定的值,这就是端元内光谱差异现象。

这种现象的存在常常会导致分解结果的误差。

目前,解决该问题的方法可以分为四
类:
(1) 多端元方法
多端元方法指对每一类地物选取多个端元光谱参与混合像元分解。

其中最典型的方法是
由Roberts 等(1998)[48]提出的MESMA(Multiple Endmember Spectral Mixture Analysis) 方法。

该方法首先为每类地物选取多条光谱,并以此生成多个端元组合(每个端元组合由不同地物
中的某一条光谱组成),接着对每个像元寻找最小二乘法误差最小的端元组合,进而求出每个像元的端元比例。

该方法在很多研究中被证实是十分有效的[49-53]。

Bates on等(2000)[54]提出了一种端元束的方法,该方法对每类地物生成端元束(一个端元束由许多同一类地物的光谱组成),将所有端元束的光谱作为端元进行混合像元分解。

因为端元数目超过光谱波段数,
方程组欠定,所以只能求解出每一类地物(也就是一个端元束内所有光谱的比例之和) 的最小值和最大值,再对其作平均得到每类地物的比例。

该方法的优点在于可以得到每类地物比
例的误差范围。

多端元方法机制明确,但计算复杂,耗时过长。

⑵光谱变换
在很多情况下,同类地物的光谱的差别来自绝对值的变化,而光谱形状是相似的。

因此通过对光谱进行一定的变换可以减少端元的光谱差异。

Wu( 2003)[55]提出将光谱除以各个。

相关文档
最新文档