基于LandSet8数据的决策树分类
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于LandSet8数据的
决策树分类
—以平潭地区为例
1、引言
早在20世纪70年代,人们就开始靠目视解译进行遥感影像的分类判读。20世纪80年代,主要利用统计模式识别方法,依据地物的光谱特征对影像进行计算机分类。20世纪90年代以来,出现了大量的遥感影像分类方法,如面向对象的分类方法、多源信息的复合分类法、遥感与GIS的结合法、人工智能分类法等。由于目前遥感影像的分类方法多而杂,故本文结合课程需要,仅对辅以纹理、NDVI、MNDWI、MNDBI、地表温度、DEM等数据的决策树分类方法进行讨论,并对分类的精度进行了评估。
2、实验原理
本文采用决策树分类方法进行地物类别的划分,目前决策树分类法包括:1)CLS 算法。CLS算法于1966 年提出,成为后来许多决策树学习算法的基础改进算法。它的主要思想是通过不断增加新的判定结点改善原决策树的分类性能,直到训练样本集被正确分类为止。2)ID3 算法。ID3算法是最早和最有影响力的决策树算法之一,绝大多数决策树算法都是在它的基础上加以改进得以实现的。ID3 算法具有描述简单、分类速度快的优点,计算量相对较小,适合于大规模数据的处理。但效率非常低,而且学习简单,逻辑能力较差,难以表达复杂概念,抗噪性差。3)CART 算法。CART 算法是一种数据勘测和预测算法。CART 算法具备多种决策树算法的功能和优点,并且能处理其他算法不能处理的非数值型数据,是决策树模型的典型代表。4)C4.5及C5.0算法。C4.5算法是目前被普遍采用的分类算法。其分类的方法是从大量样本中提取分类规则的自上而下的决策树。C5.0是在C4.5基础上发展起来的决策树生成算法。它和算法C4.5基本相似,只是对C4.5的一些局限做了改进。C5.0增加了Boost技术,较C4.5可以更好地处理大数据库,最后生成更准确的决策树,提高分类精度。而本次分类则采用ENVY软件中的C4.5决策树分类算法。
3、相关研究进展
目前对于运用决策树分类方法进行行业应用与研究,也存在着大量的示例,如Chasmer[1]等以加拿大西北地区的Scotty Creek流域为研究区,借助机载激光雷达和高分辨率的光谱数据集,研究不连续冻土区的土地覆盖类型,并与WorldView-2的土地覆盖监督分类结果进行对比;在该研究中Chasmer等采用决策树的土地覆盖分类方法,把研究区分为冻土高原、沼泽、沼地、高地和水(池塘、湖泊)等5类;结果表明,与平行六面体分类方法相比,决策树这种分层次的分类方法分类精度高,能解释研究区内土地覆盖类型88%-97%的区域范围。Teodoro[2]等运用决策树分类方法,利用Ikonos-2影像进行葡萄牙西北海岸的海滩特性/模式分类;其根据沿海特性的相关知识,把研究区域分为海洋、悬浮沉淀物、断裂区、滩面、海滩等五大类;研究过程中数据被随机分为训练数据集和验证数据集,通过对比几种决策树算法的混淆矩阵、总体精度和Kappa系数的值,发现CART算法是最适用于本次研究的;同时把该算法的分类结果与神经网络算法进行了比较,发现分类结果基本一致,因此Teodoro 等认为CART算法可用于海滩特性/模式分类的进一步研究。Sharma[3]等借助开源技术的支持,构建了一个决策树分类算法进行遥感卫星数据(LandsatTM)的分类;该算法是利用开源的数据挖掘软件WEKA根据训练数据集光谱特性进行递归分区;将该算法的分类结果与传统的ISODATA聚类方法和最大似然分类法进行比较,发现决策树分类算法的分类结果明显优于比其他两种方法。
4、实验方案
4.1数据来源
美国地质勘测局(/)
Landset8数据(成像时间:2013年8月4日2点34分;行列号为119,42;云量覆盖度为1.21%)
传感器:OLI(Operational Land Imager ,陆地成像仪)
TIRS (Thermal Infrared Sensor,热红外传感器)
OLI陆地成像仪
序号波段(um)空间分辨率
(m)
1 0.433-0.453 30
2 0.450-0.515 30
3 0.525-0.600 30
4 0.630-0.680 30
5 0.845-0.885 30
6 1.560-1.660 30
7 2.100-2.300 30
8 0.500-0.680 15
9 1.360-1.390 30
TIRS热红外传感器
10 10.6-11.2 100
11 11.5-12.5 100
地成像仪(OLI)包括9个波段,空间分辨率为30米,其中包括一个15米的全色波段;热红外传感器(TIRS)包括2个热红外波段,空间分辨率为100米,下载自地理空间数据云的level1数据已经重采样成30米。
4.2研究区域
研究区域为平潭地区的海坛岛,卫星过境时间为2013年7月12日02时28分35秒。
4.3技术流程图
4.4数据预处理
4.4.1辐射校正(包括辐射的定标和大气校正)
A、辐射定标前影像植被区域的光谱信息
B、辐射定标后影像植被区域的辐射亮度值
C、大气校正(采用ENVY中的FLAASH大气校正模型)
注:在上图的1中输入影像的中心经纬度坐标;在2种输入影像所在区域的平均高程;在3中输入卫星的过境时间;在4种输人大气模型,这里选择中纬度夏天;在5种输入气溶胶模型,这里选择沿海。
D、大气后影像植被区域的光谱反射曲线
E、植被光谱曲线在辐射定标前、辐射定标后、大气校正后的对比:
原始影像辐射定标后大气校正后从上图植被的光谱反射率在辐射定标前后和大气校正后的光谱曲线可以看出,经过FLAASH校正的影像基本去除了空气中水汽颗粒等因子的影响,植被的波谱曲线趋于正常。
4.4.2 植被指数NDVI计算
NDVI=(NIR-R)/(NIR+R);对应于landsat8中的OLI传感器为第5波段和第4波段。