决策树影像分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

决策树分类法

概念:决策树(Decision Tree),也就是一个类似于流程图的树型结构。一个决策树由一个根节点(Rootnodes)、一系列内部节点(Internal nodes)和分支以及若干个叶节点(Terminal nodes)组成,每个内部节点只有一个父节点和两个或多个子节点,节点和子节点之间形成分支。其中树的每个内部节点代表一个决策过程中所要测试的属性;每个分支代表测试的一个结果,不同属性值形成不同分支;而每个叶节点就代表一个类别,即图像的分类结果。树的最高层节点称为根节点,是整个决策树的开始。图1就是一棵用于遥感影像分类的二叉决策分类器的简单示意图。从中可以看到决策树的基本组成部分:根节点、分支和叶节点[18,19]。

决策树是一种直观的知识表示方法,同时也是高效的分

类器。它以信息论为基础,将复杂的决策形成过程抽象成易于

理解和表达的规则或判断。此方法利用信息论中的信息增益

寻找示例数据库中具有最大信息量的属性字段,形成一条规

则以此建立决策树的一个节点,依据这条规则对指定遥感图

像进行运算,所产生逻(真或假)派生出两类结果,或根据属性

的不同取值形成多个分支, 该过程可向下继续拓展,直至图

像分出类别(叶节点)。这种以自顶向下递归的方式构造判定

决策树的方法称之为“贪心算法”。

树的质量取决于分类精度和树的大小。一般来说,决策树

进行遥感图像分类主要有三个阶段组成:第一阶段为准备阶

段,输入图像,确定地物类型,统计训练区内各地物类型的信息

(光谱和非光谱信息); 第二阶段为构造阶段,选取具有较大信

息量的属性形成规则建立决策树的内部节点,直到每个叶节

点包括相同的类别为止;第三阶段为调整阶段,检查分类结果

是否能正确分出所需类别,如果不能,需要对决策树进行调整

(剪枝和增加节点)直到建立一棵正确的决策树。

1

决策树是一种直观的知识表示方法,同时也是高效的分类器。它以信息论为基础,将复杂的决策形成过程抽象成易于理解和表达的规则或判断。此方法利用信息论中的信息增益寻找示例数据库中具有最大信息量的属性字段,形成一条规则以此建立决策树的一个节点,依据这条规则对指定遥感图像进行运算,所产生逻(真或假)派生出两类结果,或根据属性的不同取值形成多个分支, 该过程可向下继续拓展,直至图像分出类别(叶节点)。这种以自顶向下递归的方式构造判定决策树的方法称之为“贪心算法”[20]。

决策树分类步骤

树的质量取决于分类精度和树的大小。一般来说,决策树进行遥感图像分类主要由三个阶段组成:第一阶段为准备阶段,输入图像,确定地物类型,计训练区内各地物类型的信息(光谱和非光谱信息); 第二阶段为构造阶段,选取具有较大信息量的属性形成规则建立决策树的内部节点,直到每个叶节点包括相同的类别为止;第三阶段为调整阶段,检查分类结果是否能正确分出所需类别,如果不能,需要对决策树进行调整(剪枝和增加节点)直到建立一棵正确的决策树[21]。

具体实现步骤如下:

①输入遥感图像,确定图像待分区域中的主要地物类型;

②统计训练区内各地物类型的特征,包括光谱特征,每个地类信息各个波段的统计分析(均值、方差、协方差等)以及波段间各个地类之间的可分性;还包括非光谱特征:各个地类的几何信息(形状、大小等)、高程信息、纹理信息等;

③根据②步的统计分析,确定可分性最大的特征及波段(或波段组合)作为根节点,选择分类器开始进行分类;

④对上一步得到的每一个类别分别选择可分性相对较大的特征及波段(或波段组合)建立决策树的一个内部节点,依据不同属性值进行分类;

⑤重复④步的过程,递规的形成每个划分上的样本子决策树,直到出现下列情况之一,停止递规:该节点上的所有像元属性值相同或没有剩余的属性能进行下一步的划分或分支中没有样本;

⑥检查分类结果是否满足①确定的地物类型,如果不能满足要求,需要对决策树进行调整,如剪枝或增加节点,直到建立一棵正确的决策树。

决策树优缺点

1)决策树法的主要优点:

①决策树进行遥感图像分类时,在每个节点处只根据一个属性值或几个属性的线性判决函数值对图像进行划分。由于分类判据已知,即依据划分的标准(属性)已经明确,而且在节点处划分的类别一般较少,可以更加有针对性地选择判别函数进行分类,以提高其分类精度。同时,由于每次只对一个或几个属性进行运算,这样大大简化了参加分类的自变量的维数;

②决策树分类法不仅可以基于单波段光谱特征值分类,还可以基于波段组合的光谱特征值进行分类。例如参考NDVI值(NDVI=(近红-红)/(近红+红))

③由于决策树分类法对训练区内的统计并非基于任何“正态或中心趋势”假设,因而它比传统的统计分类法更适合于处理非正态、非同质(分布不均)的数据集,并对于特定的类别可以产生不止1个(多个)终端节点;

④决策树分类法可操作性强。可以根据不同的目的确定和调整各个属性之间的相互关系。例如,各单波段的光谱特征相似的类别之间可先进行NDVI值比较,而NDVI值相似的地物之间又可以先进行某个波段光谱特征值比较。当发现分类结果不能满足要求时,只需要对决策树进行调整,就可重新运行。

2)决策树法的主要缺点:基于决策树得人分类方法目前在国内仅仅处于研究阶段,并且存在样本依赖度大、分类决策规则与专家系统不易结合、不能充分利用分类地物的空间特征

2

等缺点,需要通过进一步深入研究,改善分类效果,提高分类效率,实现更友好方便的人机界面,满足计算机自动分类流程化自动化的要求。

3

相关文档
最新文档