基于CART决策树分类的江苏省湿地提取

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于CART 决策树分类的江苏省湿地提取
冯婉玲,何立恒,杨强
(南京林业大学土木工程学院,江苏南京210037)
摘要:针对湿地环境复杂、类型多样且难以从景观尺度进行识别的特点,为解决遥感影像“同物异谱、异物同谱”的难点,探讨湿地遥感信息提取方法,可为湿地管理保护提供基础数据。

以江苏省为研究区,高分一号影像为数据源,结合不同地物的环境特征和空间特征,采用CART 决策树法进行地物分类,并提取湿地信息;选取影像纯净像元为训练样本,根据样本数据特征,制定分类规则。

集成高分影像的光谱特征、植被指数、水体指数、土壤调整植被指数、纹理信息、主成分分析波段和辅助地形数据,构建CART 决策树模型,实现地物分类,最终采用混淆矩阵和分类精度指标进行评价,并与最大似然分类方法进行对比。

结果表明,分类总体精度达到86.77%,Kappa 系数为0.85,精度较最大似然分类提高了将近16%,Kappa 系数提高了近0.2;遥感解译成果统计表明,2016年江苏省湿地总面积为14053.12km 2;其中,水域面积12585.59km 2,沼泽574.18km 2,滩涂893.35km 2,分别占湿地总面积的89.56%、4.09%、6.35%。

研究发现,CART 决策树分类精度高于最大似然监督分类,具有较强的实用性和优越性,对大面积湿地信息提取具有借鉴意义。

关键词:湿地类型;CART 决策树;特征指数;纹理信息中图分类号:X835
文献标志码:A
文章编号:1674-3075(2022)03-0035-09
收稿日期:2020-03-09修回日期:2022-04-01
基金项目:江苏省测绘地理信息科研项目(JSCHKY201806)。

作者简介:冯婉玲,1994年生,女,硕士研究生,研究方向为遥感技术。

E-mail:**************
通信作者:何立恒,1973年生,女,副教授,主要从事自然资源监测理论与应用技术教研工作。

E-mail:****************
湿地是位于陆生生态系统和水生生态系统之间的过渡性地带,在抵御洪水、调节径流、补充地下水、改善气候、控制污染、美化环境和维护区域生态平衡等方面有着不可替代的作用(Mitsch et al ,1993;陈有明等,2014),掌握湿地分布状况有着重要意义。

传统人工方法监测湿地效率低下且成本较高,遥感技术对湿地信息的提取被广泛应用,并取得了显著的成果(颜凤芹等,2014;邱煌奥等,2016;由佳等,2016)。

高分辨率遥感影像有着丰富的光谱信息和纹理信息(和晓风等,2015;黄帅等,2016;麻锴等,2016),传统的目视解译对高分辨率影像处理存在分类精度不高、效率低下等缺点。

决策树分类法结合特征信息波段,通过简单的数理统计和归纳方法获得分类规则,可以有效解决“同物异谱、异物同谱”的问题,具有原理简单、易于实现、解译精度高等优点(韩忻忆和颉耀文,2015;张楼香和阮仁宗,2015;杨冬等,2016);其中,CART (Classification and Regres⁃sion Tree )是由Breiman 等提出的决策树构建算法(Huete,1988),其基本原理是通过分析样本的属性特
征,设定分类规则,将数据集往下细分,形成二叉树
形式的决策树结构。

CART 决策树制定分类规则时,会设定一个特定阈值,当数据集的属性值达到该阈值范围时会生成一个树杈节点,否则将从众多数据集的属性中重新进行排列和分组,直至其属性值在阈值范围为止(Li et al,2014)。

该算法具备多种决策树算法的功能和优点,自动制定分类规则并设定阈值,实用性强,分类精度高,功能强大,操作简单;能够明确指出变量对于分类的重要性,选择与分类相关的变量;运行速度快、易于理解、结构清晰。

许多学者采用CART 决策树分类法对不同湿地信息进行了提取研究,实现了湿地高效自动化提取(乔艳雯等,2013;马宇龙和林志垒,2017;潘庆榜等,2017)。

但大多应用TM 影像等中低分辨率影像,运用光谱特征指数较少,未充分利用CART 决策树的贪心算法,且主要针对于某个湖泊或小范围流域进行研究(孙楠,2018;张莹莹等,2018)。

本文以高分一号影像各波段光谱信息为基础特征变量,结合江苏省湿地空间特征和影像纹理特征,选取NDVI 、NDWI 和SAVI 等指数以及DEM 辅助地学特征,并对影像进行主成分分析,将前3个主成分波段也作为辅助特征变量参与分类,采用CART 决策树分类法,对江苏省2016年遥感影像进行湿地信息的提取,为深入探讨湿地遥感信息统计等问题提供有效的技术手段,并为湿地管理保护和生态恢复提供参考。

2022年5月
水生态学杂志
第43卷第3期
1数据获取与分类系统
1.1研究区概况
江苏省位于中国东部沿海(30°45′~35°20′N,116°18′~121°57′E),地处江、淮、沂沭泗流域下游,横跨暖温带和北亚热带,境内地势平坦,湖泊众多,河流纵横,水系复杂(杨秀春等,2004;翟可等,2013)。

江苏不仅拥有太湖和洪泽湖大型淡水湖及中小型湖泊,还有长江、淮河、京杭大运河等河流及里下河水网地区的沼泽以及众多水库和沿海滩涂。

1.2数据源
研究所用影像数据为2016年2月8日、16日、27日和3月2日共10景高分一号卫星WFV1影像,空间分辨率为16m。

全色影像(450~900nm),多光谱影像对应4个波段,分别是蓝波段(450~520nm)、绿波段(520~590nm)、红波段(630~690nm)和近红外波段(770~890nm)。

1.3数据预处理
本研究所用的遥感影像已经过辐射校正、大气校正和几何校正,但研究区跨10景影像需要对校正好的影像进行镶嵌,再用江苏省行政区划图进行裁剪,最后对遥感影像进行线性拉伸增强处理,使其能更好地识别地物(图1)。

高分影像RGB
Band_4
Band_3
Band_2
100km
图1高分一号影像
Fig.1GF-1image
1.4湿地分类系统
依据中国地质调查局“环境地质遥感监测技术要求”并参照土地利用现状分类(GB/T21010-2017),结合湿地遥感影像特征,将江苏省湿地进行分类(表1)。

2研究方法
2.1样本选取
样本选择应具有代表性、典型性和完备性。

CART 决策树是一种通过数据采样构建模型的过程,训练样本的选择直接影响分类精度(Grajski et al,1987;吕利利等,2017;戴莉莉等,2019)。

根据地形图及土地利用现状,将其分为水域、水田、林地、建设用地、沼泽、旱地和滩涂7种类型。

7类地物各选取纯净像元共265631个样本点,其中一部分作为训练样本参与决策树的分类,另一部分作为验证样本对分类结果进行精度评价。

表1江苏省湿地遥感分类
Tab.1Remote
sensing classification system of
Jiangsu Province wetlands
注:文中水田、盐田算作耕地类,没有考虑沿海滩涂及沟渠,江苏省内无红树林地及灌丛沼泽。

Note:In this paper,paddy fields and salt fields are classified as cultivated land,without considering coastal beaches and ditches.There is no mangrove land or scrub swamp in Jiangsu Province.
2.2分类特征选取
CART决策树使用贪心算法(熊平,2011),从大量属性中选择最优组合构成分类模型,增加数据特征变量可能会改变分类规则,但最终得到的决策树一定最优。

因此,在遥感影像的分类中,尽可能提供有效特征变量,提高决策树分类精度。

2.2.1遥感影像光谱特征分析光谱特征是利用遥感影像进行地物分类最重要的信息源,各地物类别由于物质组成和结构差异而具有独特的光谱特性。

本实验采用高分影像4个波段(B1、B2、B3、B4)作为测试变量,并选择对高分影像主成分变换后的前3个波段(图2-a)作为分类特征变量参与分类,另选归一化植被指数NDVI(图2-b)、归一化差异水体指数NDWI(图2-c)和土壤调整植被指数SAVI(图2-d)进行分类实验,各特征指数计算公式如下:
NDVI=(ρnir-ρred)/(ρnir+ρred)①
NDWI=(ρgreen-ρnir)/(ρgreen+ρnir)②
SAVI=(ρnir-ρred)×[(1+L)/(ρnir+ρred+L)]③
式中:①式利用红波段和近红外波段构建植被指数,用来描述植被状况;②式通过水体反射率较弱波段与较强波段构建水体指数,能够忽略水体无关地物信息;③式通过引入土壤调节系数(L),修正土壤背景对光谱指数的敏感度。

36
2022年第3期
对研究区的7类地物进行训练样本选择,统计各个地物的光谱亮度均值,得出各地物的光谱响应特征曲线(图3-a )。

可见水域在第4波段亮度值远低于其他地物,水田在第4波段亮度值远高于其他地物,这是因为水田在冬季仍种有农作物,而高分一号影像第4波段属于近红外波段,对植被密度有很高的敏感性,同时又是水体的强吸收区,该波段水体轮廓清晰,是分辨水体与植物的重要波段。

高分一号原始影像的4个波段都有其敏感的地物,对地物有一定的区分能力,但区分能力有限,尤其对含有湿度分量的沼泽、滩涂不易区分,因此选择NDVI 、DNWI (McFeeters ,1996)、SAVI (Huete ,1988)植被指数和水体指数参与分类,并绘制地物特征指数光谱曲线图(图3-b )。

其中,NDVI 由于受低密度植被覆盖地区的土壤背景影响较大,且高密度植被覆盖地区易饱和,故适合中密度植被覆盖地区植被信息提取。

SAVI 由于引入土壤调节因子(L ),能减
弱土壤的背景差异,消除土壤的噪声影响,适合低植被覆盖区的研究,本文L 值为0.5。

水体在可见光和绿光波段的反射率均较强,且随波长的增加而逐渐减小,而NDWI 可以最大程度抑制植被信息,突出水体信息,且该指数对于土壤湿度很大的沼泽和滩涂反应较弱,更易区分河流湖泊退后形成的湿地。

研究发现,由NDWI 和SAVI 相减得到的指数(图2-e )对湿度很敏感,水域的值很小,为负值。

鉴于此,将NDWI-SAVI 指数加入决策树的构建中。

由于研究区土地利用类型复杂,除了利用以上光谱特征易提出的建设用地、水域及水田外,其余地物复杂难分,对影像进行主成分分析(PCA )能有效区分上述地类。

主成分分析是通过坐标轴的旋转来使数据的方差达到最大(Li et al ,2014),生成互不相关的输出波段,达到减少噪声的目的。

最后的主成分波段由于包含很小的方差,显示为噪声,本文应用第1、第2和第3主成分。

图2光谱特征变量
Fig.2Images of spectral characteristic variable
NDWI 100km
2090(c)NDWI
SAVI 100km
888.7330(d)SAVI
NDWI-SAVI 100km
208.730-888.733(e)NDWI-SAVI
主成分分析
影像RGB Band _2Band _3100km
Band _1NDVI 0.744100km
-0.780(a)主成分变换
(b)NDVI
2.2.2遥感影像纹理特征分析纹理是物体表面灰度变化内容的表征,描述了图像区域的平滑、稀疏、规则性等特性,包含了地物的排列结构、与周围地物的关系等大量信息,被广泛用于遥感图像分类(Huang et al ,2013;潘旭冉等,2019)。

本研究利用灰度共生矩阵生成纹理特征。

灰度共生矩阵是由图像灰度值之间二阶联合条件概率密度所构成的矩阵,反映图像中任意两点间灰度的空间相关性,在此基础上定义均值、方差、均匀性等8个特征值。

由于建设用地在第1波段中有着较高的辐
冯婉玲等,基于CART 决策树分类的江苏省湿地提取
37
2022年5月
水生态学杂志第43卷第3
期0
像元亮度值
P i x e l b r i g h t n e s s v a l u e
200400600800
12
34
0像元亮度值P i x e l b r i g h t n e s s v a l u e
100NDWI
特征指数Feature index
-100
200300400500
100*NDVI SAVI
(a)
(b)
波段Band
图3典型地物光谱曲线(a)和地物特征指数光谱曲线(b)
Fig.3Spectra (a)and spectral indices (b)for typical land feature
射亮度值,植被在第4波段有着较高的辐射亮度值,土壤在第3波段有着较高的辐射亮度值,本文针对原遥感影像,计算出第1、3和4波段均值(图4-a 、b 、c );其中,移动窗口为3×3,移动步长为1,移动方向为0°,均值计算公式如下:
ME=∑i ,j =0
N -1
i ×P i ,j ;
P i ,j =V i ,j
∑i ,j =0
N -1V i ,j

式中:V i,j 表示第i 行第j 列位置上的像元亮度值,N 表示计算纹理测度时移动窗口的大小和尺寸。

纹理均值光谱曲线见图5。

可以看出,各地物在第4波段纹理均值差异较大,第1波段纹理均值除了建设用地外其他地物光谱亮度值差距不明显。

2.2.3辅助地学特征江苏省水网密集,许多湖泊和河流受河湖泛滥的影响,造成常年或季节性的洪涝洼地。

沼泽主要是指里下河地区的沼泽冲积平原,该区地势低洼,地下水位高,外来水量大,沼泽地植被以大面积芦苇群落为主。

由于土壤湿度和水文状况与坡度、高程密切相关,预测变量引入江苏省DEM 数据。

图5地物纹理均值光谱曲线
Fig.5Spectral curves of texture band means
for typical land features
图4不同波段的纹理均值
Fig.4Textural means of different wavebands
第1波段纹理均值100km
891.1110第3波段纹理均值100km 1021.4400第4波段纹理均值100km
876.1110
(a)
(b)(c)2.3CART 决策树分类
CART 分类回归树算法采用二分递归分割的技术,将包含测试变量与目标变量构成的训练数据集进行循环迭代分为两个子样本集。

CART 使用如下结构的学习样本集:
L ={X 1,X 2…}
X m Y ⑤
X 1=(x 11,x 12,…x 1t 1
),…,X m =(x m 1,x m 2,…x mt n
)⑥Y =(y 1,y 2,…,y k )

式中:X 1,X 2…X m 称为属性向量(Attribute Vec⁃
tors),Y 称为标签向量(Label Vectors)。

CART 算法采
像元亮度值P i x e l b r i g h t n e s s v a l u e
200400600800
滩涂
旱地水域
水田林地
沼泽建设用地
1
23
波段
Band
38
2022年第3期
图例
100km 江苏省界
100km
沼泽滩涂水域
建设用地水田林地旱地
图例
江苏省界沼泽滩涂水域
图6土地利用类型(a)和湿地类型(b)分布
Fig.6Map of land use types (a)and distribution of different wetland types (b)
(a)
(b)
用GINI 系数度量选择测试属性,选取GINI 系数最小的属性作为根节点的分裂属性。

GINI 系数的计算公式如下:
Gini(S )=1-∑i =1
n ρ2i

式中:假设S 为样本集,类别集为{C 1,C 2,…},C n ,共n 类,每个类对应1个样本子集S i (1≤i ≤n );令||S 为样本集的样本数,||C i 为样本集S 中属于类C i 的样
本数,则ρi =||C i ||S 为样本集中样本属于类C i 的
概率。

3结果与分析
3.1CART 决策树模型构建
根据选取的变量,利用ENVI5.1软件下CART 决策树自动分类算法扩展模块,根据训练样本的特点和参与分类的测试变量,自动选择分类特征,进行赋值运算,得出最优二叉树。

CART 决策树采用二元切分法,把数据切成两份在分支节点上进行布尔测试,判断条件为真划归右分支,否则划归左分支,最终形成一棵二叉树。

运行决策树模型,得到研究区土地利用类型和湿地类型分布(图6)。

研究区域较大且地物复杂,水体浑浊程度不一,不能只靠光谱特征区分。

NDWI 水体指数可以大致区分水体及其他地物,之后利用主成分第2、3分量和第1波段纹理均值可精确提取水域。

滩涂和沼泽是江苏省湿地重要组成部分,且这两类地物与水域均有着湿度分量,因此先设置SAVI 阈值为184.6,将水域地类剔除。

由于沼泽在高分一号假彩色影像中呈现深浅不一的淡红色,而滩涂呈现黄褐色或褐色,设置第3波段纹理均值阈值为358.9能较好地将二者区分开来。

但也有部分滩涂、沼泽在其交界的区域形成混合像元,同时旱地与滩涂、沼泽与水田光谱颜色极其相似,需要NDVI 、第1波段纹理均值和主成分第1、3分量等对其进行区分。

研究区非湿地类型有水田、建设用地、林地和旱地。

江苏省经济发达,城镇分布密集,尤其是苏州、南京等地,而林地大多分布于海拔较高的区域。

首先根据DEM 数据确定阈值为48.85,将林地分离出来,然后利用第1波段纹理均值阈值为480.7,将大部分建设用地分离出来,再设置第4波段纹理均值阈值为331和NDVI 阈值为-0.138,将建设用地从水田和湿地中分离出来。

滩涂和旱地在高分一号假彩色影
像中都显示为黄色、黄褐色或者褐色,光谱相似,不易区分,但旱地相对于滩涂SAVI 指数较大,设置SA⁃VI 阈值为128.4,将二者大致区分;再利用第3波段纹理均值可以精确分区滩涂与旱地。

由于遥感影像时间为2-3月,是当地典型冬季,植被覆盖率较低,植被的NDVI 指数不高,但仍种有农作物的水田NDVI 值明显高于其他地物,根据这一特征将水田分离出来。

水田和沼泽虽都有植被覆盖,但沼泽湿度较大、含水量更多,设置NDWI 阈值为32,可以将这两者区分。

部分决策树如图7所示。

为对比验证CART 决策树分类法的精度,依据同样的训练样本对研究区淮安市分别进行CART 决策树分类和最大似然监督分类(Maximum Likelihood Classification ,MLC ),结果如图8所示。

3.2分类解析
从遥感解译图可以看出,江苏各水系之间相互连接,水网发达,河流分布较为均匀;境内湖泊众多,集中在江苏西部地区,另外一些分布于里下河湖泊湿地群,而东北部和东部沿海区域则基本没有湖泊分布;受沼泽湿地淤积加速和围垦等因素影响,沼泽面积小且分散,主要保存在太湖、洪泽湖等大型湖泊
冯婉玲等,基于CART 决策树分类的江苏省湿地提取
39
2022年5月
水生态学杂志第43卷第3期
以及长江沿岸河滩。

总体而言,江苏省湿地类型多样且分布不均,具有明显的地域性特征。

据遥感解译统计,2016年江苏省湿地总面积为
14053.12km 2,
其中水域面积为12585.59km 2,沼泽574.18km 2,
滩涂893.35km 2,分别占湿地总面积的89.56%、4.09%、6.35%。

图7CART 决策树Fig.7CART decision
tree
图8淮安市CART 决策树分类(a)与最大似然监督分类(b)
Fig.8CART decision tree classification (a)and maximum supervised classification (b)of Huai ′an City
图例
100km 淮安市界100km
(a)
(b)
沼泽滩涂水域建设用地水田林地旱地
图例
淮安市界沼泽滩涂
水域建设用地水田林地
旱地表2CART 分类精度评价
Tab.2Accuracy assessment of CART decision tree classification
冯婉玲等,基于CART
决策树分类的江苏省湿地提取3.3精度评价
为评估江苏省CART 决策树分类方法的结果精度,采用混淆矩阵和分类精度指标(表2)进行评价(侯西勇等,2018)。

通过混淆矩阵可知,水域和建设用地存在混分现象,这是由于江苏省城镇密集,影像中建筑群阴影和部分水域混淆;由于高分
一号影像缺少湿度分量信息,而旱地和滩涂拥有相似的土壤信息,因此两者存在一定混分;沼泽与林地、水田都有植被覆盖,也存在一定混分。

由精度评价表可以看出,运用CART 决策树方法对湿地信息提取精度较高,总体精度为86.77%,Kappa 系数为0.85。

40
2022年第3期
4讨论
对研究区内淮安市采用最大似然监督分类,并与CART 决策树分类对比,二者精度评价见表3。

由表3可知,最大似然分类总体精度为72.73%,Kappa 系数为0.66;CART 决策树分类总体精度为88.65%,Kappa 系数为0.86,精度提高了将近16%,Kappa 系数提高了0.2。

只依靠光谱特征的监督分类将部分水域划分为滩涂,较多的水域划分为建设用地、旱地划分为水田、滩涂划分为旱地和水域,沼泽的分类效果也
较差。

这是由于目视选择样本时,受到人眼分辨的限制和光谱相似性的影响,很难区分过渡带地区的地表覆盖类型,分类结果显得粗糙;而CART 决策树采用“贪心算法”,能充分挖掘数据中潜在的定量阈值信息。

加入植被指数、水体指数和纹理信息等的CART 决策树分类,综合考虑地物的光谱、纹理、色彩等属性,能够有效解决上述错分问题。

NDVI 、SAVI 和NDWI 指数可以有效区分沼泽中的绿色水体和滩涂的灰色泥沙,DEM 可以精确区分林地和其他地物,具有较强的实用性和优越性。

表3CART 分类和MLC 分类精度对比
Tab.3
Accuracy comparison between CART classification and MLC classification
杨秀春等(2004)利用遥感技术按照湿地公约进行影像分类,得出1997年江苏省湿地总面积有
11576.61km 2
(不含水田)。

由于采用普通人机交互解译方法,精度不高,且工作量大。

张莹莹等(2008)以洪湖为研究对象,利用影像的光谱特征、植被指数、水体指数、纹理特征等特征变量,构建CART 决策树对Landsat 8-OLI 影像分类,总体精度为88.02%,Kappa 系数为0.82,精度高于支持向量机和最大似然分类,但其研究区范围较小;而本文研究成果有大尺度的科学意义和湿地管理价值。

5小结
(1)以高分一号遥感影像作为主要数据源,其多个植被指数、水体指数、纹理信息、主成分分析影像以及地形数据为辅助数据进行的CART 决策树分类,分类总体精度为86.77%,Kappa 系数为0.85,分类精度远高于最大似然监督分类。

(2)2016年江苏省湿地总面积为14053.12km 2,其中水域面积为12585.59km 2

沼泽574.18km 2
,滩涂893.35km 2

湿地类型齐全、分布广泛,但空间分布不匀,呈现明显的地域特点。

参考文献
陈有明,刘同庆,黄燕,等,2014.长江流域湿地现状与变化遥感
研究[J].长江流域资源与环境,23(6):801-808.
戴莉莉,李海涛,顾海燕,等,2019.特征优选下的遥感影像面向
对象分类规则构建[J].测绘科学,44(2):26-32.
韩忻忆,颉耀文,2015.基于决策树的干旱区湿地信息自动提
取—以疏勒河流域为例[J].遥感技术与应用,30(6):1146-1152.
和晓风,林辉,孙华,等,2015.基于GF-1卫星东洞庭湖湿地类
型信息提取[J].中南林业科技大学学报,35(11):10-15.侯西勇,邱向红,侯婉,等,2018.中国海岸带土地利用遥感制图
及精度评价[J].地球信息科学学报,20(10):110-120.黄帅,丁建丽,李艳华,2016.面向对象的国产GF-1遥感影像
水体信息提取研究[J].人民长江,47(5):23-28.
吕利利,颉耀文,黄晓君,等,2017.基于CART 决策树分类的沙
漠化信息提取方法研究[J].遥感技术与应用,32(3):499-506.
麻锴,查东平,王宝健,2016.基于高分一号宽幅多光谱影像的
鄱阳湖湿地分类研究[J].测绘与空间地理信息,39(6):107-110.
马宇龙,林志垒,2017.基于面向对象和CART 决策树方法的
遥感影像湿地变化检测研究—以龙祥岛地区为例[J].福建师范大学学报(自然科学版),33(6):69-80.
冯婉玲等,基于CART 决策树分类的江苏省湿地提取
41
2022年5月
水生态学杂志
第43卷第3期
潘庆榜,那晓东,臧淑英,2017.兼容多源数据的森林湿地信息提取和比较分析[J].测绘科学,42(4):173-178.
潘旭冉,杨帆,潘国峰,2019.基于空频域纹理特征的高分辨率遥感图居民地提取[J].科学技术与工程,19(8):151-156.乔艳雯,臧淑英,那晓东,2013.基于决策树方法的淡水沼泽湿地信息提取—以扎龙湿地为例[J].中国农学通报,29(8): 169-174.
邱煌奥,程朋根,甘田红,等,2016.多光谱遥感影像湿地水体提取方法综述[J].江西科学,34(1):60-65.
孙楠,2018.利用GF-1和Landsat遥感数据监测长江口海岸带湿地近40年变化及其驱动因子分析[D].杭州:浙江大学.
熊平,2011.数据挖掘算法与Clementine实现[M].北京:清华大学出版社.
颜凤芹,于灵雪,杨朝斌,等,2014.基于Landsat8影像的湿地信息提取最佳波段组合[J].地球环境学报,5(5):339-343.杨冬,李恩宝,张亚男,等,2016.利用决策树模型的湿地提取与分类[J].辽宁工程技术大学学报(自然科学版),35(5): 543-547.
杨秀春,朱晓华,黄家柱,等,2004.江苏省湿地资源现状及其可持续利用研究[J].经济地理,24(1):81-84.
由佳,张怀清,陈永富,等,2016.基于“高分四号”卫星影像洞庭湖湿地信息提取[J].航天返回与遥感,37(4):116-122.
翟可,徐惠强,姚志刚,等,2013.江苏省湿地保护现状、问题及对策[J].南京林业大学学报(自然科学版),37(3):175-180.张楼香,阮仁宗,2015.基于决策树的洪泽湖湿地信息提取[J].
测绘与空间地理信息,38(2):87-91.
张莹莹,蔡晓斌,宋辛辛,等,2018.基于决策树的洪湖水生植物遥感信息提取[J].湿地科学,16(2):213-222. Grajski K A,Breiman L,Prisco G V D,et al,1987.Classifica⁃tion of EEG Spatial Patterns with a Tree-Structured Meth⁃odology:CART[J].IEEE Transactions on Biomedical En⁃gineering,33(12):1076-1086.
Huang Y,Yue A,Wei S,et al,2013.Texture feature extraction for land-cover classification of remote sensing data in land consolidation district using semi-variogram analysis [J].Wseas Transactions on Computers,7(7):857-866. Huete A R,1988.A soil-adjusted vegetation index(SAVI)[J].
Remote sensing of Environment,27(3):119-126.
Li C F,Dai Y Y,Zhao J J,et al,2014.Volcanicash cloud de⁃tection from remote sensing images using principal com⁃ponent analysis[J].Computers&Electrical Engineering, 40(8):204-214.
McFeeters S K,1996.The use of normalized difference water index(NDWI)in the delineation of open water features[J].
International Journal of Remote Sensing,17(7):1425-1432.
Mitsch W J,Fiedler P L,Lee L C,et al,1993.Wetlands[J].
Quarterly Review of Biology,3(3):535-544.
(责任编辑万月华)
42
2022年第3期
冯婉玲等,基于CART决策树分类的江苏省湿地提取43 Extraction of Remotely Sensed Wetland Information for
Jiangsu Province Based on CART Decision Tree Classification
FENG Wan⁃ling,HE Li⁃heng,YANG Qiang
(School of Civil Engineering,Nanjing Forestry University,Nanjing210037,P.R.China)Abstract:Wetland environments are complex and diverse,making it difficult to identify features at the landscape scale using remote sensing image technology.To solve the difficulty of“same objects with differ⁃ent spectra and different objects with the same spectrum”,we explored extraction of wetland remote sensing information using the CART(Classification And Regression Tree)decision tree method.The results pro⁃vide basic data for wetland management and protection,as well as technological support for remote sensing of wetland conditions.Jiangsu Province was the study area and GF-1images from2016was the data source.Environmental and spatial characteristics of different physical features were used to identify land⁃scape types and wetland information was extracted using CART.First,pure pixels were selected as training samples,and classification rules were formulated according to the characteristics of sample data.The CART decision tree model was constructed by integrating the spectral characteristics of high-resolution images, vegetation index,water index,soil adjusted vegetation index,texture information,waveband by principal component analysis and auxiliary terrain data.Then the CART model was used to classify landscape type. Finally,the confusion matrix and classification accuracy index were used to evaluate the accuracy of classi⁃fication results,and the results were compared with those obtained by the MLC(maximum likelihood classi⁃fication)method.The overall accuracy of the classification reached86.77%with a Kappa(κ)coefficient of pared with the maximum likelihood classification,CART increased accuracy by nearly16%,and the Kappa coefficient by nearly0.2.The statistics obtained by interpreting remotely sensed images show that the total area of wetlands in Jiangsu Province in2016was14053.12km2and included12585.59km2of wa⁃ter(89.56%),574.18km2of swampland(4.09%)and893.35km2of tidal flats(6.35%).In conclusion,the ac⁃curacy of CART decision tree classification is higher than for MLC,indicating that the CART decision tree method is better for extracting information on large area wetlands from satellite imagery.
Key words:wetland type;CART decision tree;spectral indices;textural features。

相关文档
最新文档