遥感地学分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

湖南师范大学研究生课程论文

论文题目基于专家知识的决策树遥感影像分类

课程名称遥感地学分析

姓名乔方毅学号 201202131079 专业人文地理学年级 2012级

学院资源与环境科学学院日期 2012-03-05

研究生课程论文评价标准

湖南师范大学研究生处制

基于专家知识的决策树遥感影像分类摘要:决策树分类作为一种基于空间数据挖掘和知识发现的监督分类方法在遥感影像分类中应用广泛。本文首先回顾了基于决策树的遥感影像分类的基本概念、主要算法以及应用特点。在此基础上,以Landsat TM数据和DEM数据构成多源数据进行在ENVI软件中进行试验,探讨基于专家知识的决策树分类方法的主要应用特点。

关键词:遥感影像分类;决策树;专家知识;C4.5算法

1 引言

随着计算机技术的快速发展,遥感影像的计算机分类已经成为遥感影像信息提取和分类的主要手段。传统的基于统计模式识别的遥感影像分类(如最大似然法分类等)、人工神经网络分类、模糊聚类分类等在遥感影像分类中获得了广泛地应用。但这些分类方法都是以影像的光谱特征为基础,由于遥感影像“同物异谱”和“异物同谱”现象的大量存在,导致分类结果出现较多的错分、漏分情况,致使分类精度降低。众多研究表明,结合影像光谱信息以及其它辅助信息,则可以大大提高遥感影像的分类精度[1]。而决策树分类作为一种基于空间数据挖掘和知识发现的监督分类方法,突破了以往分类仅仅依靠影像光谱信息,不需要满足正态分类,可以充分利用GIS数据库中的地学知识辅助分类,大大提高了分类精度[2]。

2 决策树分类

2.1 概念[3]

决策树(Decision Tree),顾名思义就是一个类似于流程图的树形结构。一个决策树由一个根节点(Root nodes)、一系列内部节点(Internal nodes)组成,每个内部节点只有一个父节点和两个或多个子节点,节点和子节点之间形成分支。其中,每个分支代表测试的一个结果,不同属性值形成不同的分支;而每个叶节点就代表一个类别,即图像的分类结果。树的最高节点称为根节点,是整个决策树的开始。图1就是一棵用于遥感影像分类的二叉树决策树分类器的简单示意图。

决策树是一种直观的知识表示方法,同时也是高效的分类器。它以信息论为基础,将复杂的决策形成过程抽象成为易于理解和表达的规则或判断。此方法利用信息论中的信息增益寻找示例数据库中具有最大信息量的属性字段,形成一条规则以此建立决策树的一个节点,依据这条规则对指定遥感影像图像进行运算,所产生的逻辑值(真或假)派

生出两类结果,即形成两个分支,或根据属性的不同取值形成多个分支,该过程可向下继续拓展,直至图像分出类别(叶节点)。这种自顶向下递归的方式构造判定决策树的方法称之为“贪心算法”。

图1 决策树分类简单示意图

理想的决策树有3个要求:①最优覆盖问题(MCV)——生成最少数目的公式(合取式);②最简单公式问题(MCOMP)——生成具有最少数目选择子及属性值的公式;③最优示例学习问题——生成具有最简单公式的最优覆盖。

2.2 决策树分类的主要算法

1) 分类回归树[1]

分类回归树(CART, Classification and Regression Tree)是一种通用的树生长算法,由Breiman等人提出,是一种监督分类算法,它利用训练样本来构造二叉树进行决策树分类。其特点是充分利用二叉树的结构(Binary Tree-structured),即根节点包含所有样本,在一定的分割规则下根节点被分割成两个子节点,这个过程又在子节点上重复进行,成为一个回归过程,直至不可再分成子节点为止。构造CART树采用的思路:在整体样本数据的基础上,生成一个多层次、多叶节点的大树,以充分反映数据之间的联系(这时树生长为考虑噪声,往往反映的是训练过度情况下的数据联系),然后对其进行删减,产生一系列子树,从中选择适当大小的树,用于对数据进行分类,具体可分为树生长和树剪枝两部分。

2) C4.5算法[4]

C4.5算法基本原理是从树的根节点处的所有训练样本开始,选取一个属性值来区分这些样本。对属性的每一个值产生一个分支,分支的属性值相应样本子集被移到新生成的子节点上,这个算法递归地应用于每个节点上,直到节点的所有样本都分区到某个

类中,到达决策树的叶节点的每条路径表示一个分类规则。该算法采用了信息增益比例来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性不足,并且在树构造过程中或树构造完成后进行剪枝,能够对连续属性值进行离散化处理。

3) Boosting算法[1]

Boosting算法(增强算法)是一种提升任意学习算法准确率的集成学习方法,可将准确率仅比随机猜测略好的弱学习算法提升为强学习算法,它的思想来源于可能近似正确(Probably Approximately Correct, PAC)学习模型。它利用某种学习算法生成一系列的基分类器,每个基分类器的训练依赖于在其之前产生的分类器的分类结果,对训练失败的训练样本赋予较大的权值,让学习算法在后续的学习中“更加重视”。最终分类器通过多个基分类器的加权投票得到最后的结果,减少了单个分类器的误差,提高了分类器的分类精度。

2.3 决策树分类的主要特点[3]

基于决策树的分类模型进行遥感影像分类具有巨大的优势:

1) 决策树进行遥感图像分类时,在每个节点处只根据一个属性值或几个属性的线性判决函数值对图像进行划分。由于分类判据已知,即依据划分的标准(属性)已经明确,而且在节点处划分的类别一般较少,可以更加有针对性地选择判别函数进行分类,以提高其分类精度。同时,由于每次只对一个或几个属性进行运算,这样大大简化了参加分类的自变量的维数。

2) 决策树分类法便于地物的几何特征、结构特征和纹理特征等参与图像的分类过程。例如参考地物的几何形状、纹理等特征可将农田和草地进行区分,即使两者的光谱统计特征相似也不会错误的将其划为一类。

3) 决策树分类法可操作性强。可以根据不同的目的确定和调整各个属性之间的相互关系(层次关系、权重关系等)。例如,光谱特征相似的类别之间可先进行几何特征的区分,而几何特征相似的地物之间又可以先进行光谱特征的比较。

4) 由于决策树分类法对训练区内的统计并非基于任何“正态或中心趋势”假设,因而它比传统的统计分类法更适合于处理非正态、非同质(分布不均)的数据集,并对于特定的类别可以产生不止1个(多个)终端节点。

3 实验与分析

基于专家知识的决策树分类时基于遥感影像数据及其他空间数据,通过专家经验总

相关文档
最新文档