基于多目标遗传随机森林特征选择的面向对象湿地分类_刘舒

合集下载

基于超高空间分辩率无人机影像的面向对象土地利用分类方法

基于超高空间分辩率无人机影像的面向对象土地利用分类方法

第36卷第2期农业工程学报V ol.36 No.22020年1月Transactions of the Chinese Society of Agricultural Engineering Jan. 2020 87 基于超高空间分辩率无人机影像的面向对象土地利用分类方法刘舒1,朱航2※(1. 吉林建筑大学测绘与勘查工程学院,长春 130118; 2. 吉林大学机械与航空航天工程学院,长春 130022)摘要:为明确基于无人机超高空间分辨率影像的土地利用分类方法,尤其是有效特征和算法的选择,该研究获取吉林省德惠市一农耕区超高分无人机影像,获取区域正射影像图和数字表面模型,计算地形指标,采用面向对象方法进行土地利用分类研究。

首先,采用随机森林算法,以光谱特征为基础,依次引入指数、形态、地形、纹理特征,建立5种特征选择方案,分析各类特征对分类效果的影响。

其次,以Boruta特征选择算法获取的优化特征集为基础,采用随机森林算法、朴素贝叶斯算法、逻辑回归算法和支持向量机算法分类,分析不同算法的分类效果。

结果表明:采用5种特征选择方案分类,引入形态特征时总体精度降低,引入其他特征时总体精度逐渐提高。

5种特征共同参与的分类效果最佳,总体精度为98.04%,Kappa系数为0.980。

错分主要发生在裸地和宅基地,漏分主要发生在草地、裸地、水渠和道路。

错分和漏分主要是因为这几种类型对象具有相似的光谱、形态、纹理特征或相似的分布位置。

采用优化特征集分类时,相比其他算法,随机森林算法更擅长处理高维特征集,获得最高的总体精度98.19%,最低的错分和漏分误差,分类效果最佳。

借助无人机超高空间分辨率影像提取地形信息、形态信息,可以有效辅助土地利用分类,并能提高传统分类方法精度。

关键词:遥感;土地利用;无人机影像;面向对象;特征选择;随机森林doi:10.11975/j.issn.1002-6819.2020.02.011中图分类号:TP79 文献标志码:A 文章编号:1002-6819(2020)-02-0087-08刘 舒,朱 航. 基于超高空间分辩率无人机影像的面向对象土地利用分类方法[J]. 农业工程学报,2020,36(2):87-94. doi:10.11975/j.issn.1002-6819.2020.02.011 Liu Shu, Zhu Hang. Object-oriented land use classification based on ultra-high resolution images taken by unmanned aerial vehicle[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2020, 36(2): 87-94. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2020.02.011 0 引 言实时可靠的土地利用信息,是土地利用变化监测的基础[1]。

基于无人机多源遥感数据的亚热带森林树种分类

基于无人机多源遥感数据的亚热带森林树种分类

基于无人机多源遥感数据的亚热带森林树种分类姚扬;秦海明;张志明;王伟民;周伟奇【期刊名称】《生态学报》【年(卷),期】2022(42)9【摘要】树种多样性是生态学研究的重要内容,树木的种类和空间分布信息可有效服务于可持续森林管理。

但在复杂林分条件下,获取高精度分类结果的难度大。

而无人机遥感可获取局域超精细数据,为树种分类精度的提高提供了可能。

基于可见光、高光谱、激光雷达等多源无人机遥感数据,探究其在亚热带林分条件下的树种分类潜力。

研究发现:(1)随机森林分类器总体精度和各树种的F1分数最高,适合亚热带多树种的分类制图,其区分13种类别(8乔木,4草本)的总体精度为95.63%,Kappa系数为0.948;(2)多源数据的使用可以显著提高分类精度,全特征模型精度最高,且高光谱和激光雷达数据显著影响全特征模型分类精度,可见光纹理数据作用较小;(3)分类特征重要性从大到小排序为结构信息,植被指数,纹理信息,最小噪声变换分量。

【总页数】12页(P3666-3677)【作者】姚扬;秦海明;张志明;王伟民;周伟奇【作者单位】中国科学院生态环境研究中心城市与区域生态国家重点实验室;云南大学生态与环境学院暨云南省高原山地生态与退化环境修复重点实验室;深圳市环境监测中心站;中国科学院大学;北京城市生态系统研究站【正文语种】中文【中图分类】TP3【相关文献】1.基于随机森林分类方法和多源遥感数据的r湿地植被精细分类2.基于多源遥感数据的森林树种准确识别方法研究3.基于多源遥感数据的森林树种准确识别方法研究4.基于多源遥感数据融合的土地利用类型及典型树种分类方法研究5.基于多源遥感数据的输电线走廊树种分类因版权原因,仅展示原文概要,查看原文内容请购买。

一种基于多源遥感信息的地表湿地水体提取方法

一种基于多源遥感信息的地表湿地水体提取方法

一种基于多源遥感信息的地表湿地水体提取方法邹业斌;杨娟;舒瑞【期刊名称】《数字技术与应用》【年(卷),期】2023(41)2【摘要】为了以中分辨率遥感影像检测植被、土壤与水体混合区域中的明水体,本研究提出了一种基于大气校正地表反射率、数字地形数据和土地覆盖产品的内陆地表湿地水体提取方法,将基于中分辨率遥感影像的光谱指数与土地覆盖类型栅格、地形指数和云/云阴影筛选规则相结合,应用于宁夏平原1990-2002年枯水期和丰水期的湿地水体数据提取和季节性动态监测。

经验证,水体分类提取总体精度为0.93,Kappa系数为0.83。

通过对湿、枯季湿地数据进行时间序列分析和空间叠加分析,揭示流域湿地水体的季节性变化特征。

季节性分析结果表明:(1)近30年来研究区丰、枯水期水体面积均呈整体上升趋势,水体面积季节性变化明显,丰、枯水期水体面积最大变化值达405.46km^(2),最大变化率达52.79%;(2)宁夏平原东北部为主要季节变化区,包括银北灌区以及黄河主河道两岸,平均面积变化值为142.31km^(2);(3)黄河径流量、降水和蒸发以及引黄灌溉和生态补水,是宁夏平原水体面积变化的主要影响因素。

【总页数】7页(P1-7)【作者】邹业斌;杨娟;舒瑞【作者单位】宁夏大学土木与水利工程学院;中国地质大学(武汉)公共管理学院;宁夏自然资源勘测调查院【正文语种】中文【中图分类】P951【相关文献】1.基于多尺度多源遥感信息的水体提取方法对比研究2.基于Landsat-8 OLI影像的黔西北高原地表水体提取方法研究3.基于Landsat-8 OLI影像的黔西北高原地表水体提取方法研究4.一种基于多源多时相遥感信息的城市水稻田分布提取方法5.基于深度学习的湿地遥感信息提取方法研究因版权原因,仅展示原文概要,查看原文内容请购买。

应用无人机可见光影像和面向对象的随机森林模型对城市树种分类

应用无人机可见光影像和面向对象的随机森林模型对城市树种分类

第52卷第3期东㊀北㊀林㊀业㊀大㊀学㊀学㊀报Vol.52No.32024年3月JOURNALOFNORTHEASTFORESTRYUNIVERSITYMar.20241)国家自然科学基金项目(31901298),西藏自治区科学技术重点研发计划项目(XZ202201ZY0003G),福建农林大学省级大学生创新创业训练项目(S202310389046),福建农林大学科技创新专项基金项目(KFb22033XA)㊂第一作者简介:陈逊龙,男,1998年10月生,福建农林大学林学院,硕士研究生㊂E-mail:1220496002@fafu.edu.cn㊂通信作者:张厚喜,福建农林大学林学院㊁南方红壤区水土保持国家林业和草原局重点实验室(福建农林大学)㊁海峡两岸红壤区水土保持协同创新中心(福建农林大学)㊁福建长汀红壤丘陵生态系统国家定位观测研究站,副教授㊂E-mail:zhanghouxi@126.com㊂收稿日期:2023年10月23日㊂责任编辑:王广建㊂应用无人机可见光影像和面向对象的随机森林模型对城市树种分类1)陈逊龙㊀孙一铭㊀郭仕杰㊀段煜柯㊀唐桉琦㊀叶章熙㊀张厚喜(福建农林大学,福州,350002)㊀㊀摘㊀要㊀为及时准确的了解城市树种空间分布信息,提升城市居民生活水平和推动城市生态系统可持续发展㊂以福州市仓山区城市森林为研究对象,应用无人机(UAV)监测城市树种空间分布及其动态变化的可见光影像,根据最佳尺度对影像进行分割,并提取分割对象的光谱㊁地形㊁指数㊁纹理和几何特征㊂通过对不同类型特征的组合构建不同的分类方案,利用递归特征消除法(RFE)筛选出优选特征子集,利用面向对象方法结合随机森林(RF)模型对城市树种进行分类㊂结果表明:在随机森林模型分类的过程中,利用光谱特征对树种分类的总体分类精度为82.12%;地形特征对树种分类的贡献度率为14.96%;指数特征和纹理特征的引入,在一定程度提高了树种的分类精度;几何特征的贡献较小,在分类过程中没有明显的贡献㊂特征优选子集的S10方案分类精度最高,总体精度达92.42%,Kappa系数为0.91㊂说明特征优选能够降低高维度特征的复杂性,在大幅减少数据冗余的同时提高了分类精度㊂在最优特征子集下,随机森林(RF)算法分类的总体精度比极致梯度提升(XGBoost)㊁轻量级梯度提升机(LightGBM)和k最近邻算法(KNN)分别提高了1.15%㊁1.81%和15.15%,Kappa系数分别提高了1%㊁2%和17%㊂关键词㊀城市树种;无人机影像;面向对象;随机森林模型;地形特征分类号㊀S771.8UrbanTreeSpeciesClassificationbyUAVVisibleLightImageryandOBIA-RFModel//ChenXunlong,SunYim⁃ing,GuoShijie,DuanYuke,TangAnqi,YeZhangxi,ZhangHouxi(FujianAgricultureandForestryUniversity,Fuzhou350002,P.R.China)//JournalofNortheastForestryUniversity,2024,52(3):48-59.Inordertoobtaintimelyandaccuratespatialdistributioninformationofurbantreespecies,improvethelivingstand⁃ardsofurbanresidents,andpromotethesustainabledevelopmentofurbanecosystems,thisstudytakestheurbanforestinCangshanDistrict,FuzhouCityastheresearchobject.Itappliesunmannedaerialvehicles(UAVs)tomonitorthevisiblelightimagesofurbantreespeciesspatialdistributionandtheirdynamicchanges.Theimagesweresegmentedbasedontheoptimalscale,andthespectral,terrain,Index,texture,andgeometricfeaturesofthesegmentedobjectsareextracted.Differentclassificationschemeswereconstructedbycombiningdifferenttypesoffeatures,andtheoptimalfeaturesubsetwasselectedusingtherecursivefeatureelimination(RFE)method.Theurbantreespecieswereclassifiedusingtheob⁃ject⁃orientedmethodcombinedwiththerandomforest(RF)model.TheresultsshowedthatintheprocessofRFmodelclassification,theoverallclassificationaccuracyoftreespeciesusingspectralfeatureswas82.12%.Thecontributionrateofterrainfeaturestotreespeciesclassificationwas14.96%.TheintroductionofIndexfeaturesandtexturefeaturesim⁃provestheclassificationaccuracyoftreespeciestoacertainextent.Geometricfeatureshaveasmallcontributionanddonothaveasignificantcontributionintheclassificationprocess.TheS10schemeoffeatureselectionsubsethadthehighestclas⁃sificationaccuracy,withanoverallaccuracyof92.42%andaKappacoefficientof0.91.Thisindicatesthatfeatureselec⁃tioncanreducethecomplexityofhigh⁃dimensionalfeatures,whilegreatlyreducingdataredundancyandimprovingclassifi⁃cationaccuracy.Undertheoptimalfeaturesubset,theoverallaccuracyofclassificationusingtheRFalgorithmwasin⁃creasedby1.15%,1.81%,and15.15%comparedtoextremegradientboosting(XGBoost),lightgradientboostingma⁃chine(LightGBM),andk⁃nearestneighboralgorithm(KNN),respectively.TheKappacoefficientwasincreasedby1%,2%,and17%,respectively.Keywords㊀Urbantreespecies;UAVimagery;Object-based;Randomforestmodel;Terrainfeature㊀㊀城市树木作为城市的重要组成部分是评估城市生态环境的重要指标之一,具有重要的生态㊁经济和社会效益[1]㊂随着城市化进程的不断深化,城市树木的生态效益也日渐凸显㊂然而,不同种类㊁种植结构和种植区域的城市树木会产生不同的生态环境效益[2]㊂因此,及时准确地获取城市树种的类别和空间分布信息对城市规划㊁城市树木的管理与维护具有重要意义[3]㊂传统的城市树种分类主要依靠地面调查,然而该方法存在成本高㊁耗时长且难以获取大尺度数据等不足[4]㊂近年来,遥感技术飞速发展,为城市树种的准确快速识别提供了新的途径㊂然而,传统的高分辨率卫星遥感影像易受天气和环境因素干扰㊁时效性较差且费用昂贵㊂此外,免费提供的卫星遥感影像空间分辨率低,难以适用于树种层面的识别研究[5]㊂相比传统的遥感平台,近地无人机(UAV)能在较小空间尺度上提供高分辨率的遥感影像和地理数据,具有更高的适用性,是遥感数据获取的重要手段之一[6]㊂然而,目前有关树种信息提取的无人机遥感研究多集中于多光谱㊁高光谱影像的分类领域,但由于搭载多光谱㊁高光谱传感器的无人机普遍价格昂贵,极大地限制了其在实际生产中的推广应用㊂随着数码技术的发展,通过搭载可见光传感器的无人机获取包含树种信息的遥感影像,具有获取方便㊁成本低㊁空间分辨率高等优点,已成为遥感影像识别树种研究方向上重要的数据源之一[7]㊂根据遥感影像分类单元的不同,可将分类方法归为基于像元和面向对象两类㊂基于像元的方法主要关注局部像素的光谱信息,在处理高分辨率遥感影像时对噪声比较敏感㊁稳健性差,极易出现错分㊁漏分现象[8]㊂为弥补基于像元方法的不足,面向对象的影像分析技术(OBIA)逐渐被用于处理高分辨率遥感影像[9]㊂OBIA方法综合考虑区域相邻像素的纹理㊁形态以及空间结构等多维特征,减少了 椒盐噪声 的同时,通常具有更高的准确率[10]㊂然而,随着特征维数的增加,数据处理的难度呈几何倍数增长,使得传统分类算法的应用受到一定限制㊂随机森林(RF)是一种基于集成学习思想集成多颗决策树的机器学习算法,通过对样本的决策树建模以及组合多棵决策树的预测,最终由分类树投票决定数据的分类[11]㊂随机森林算法不仅具有模型简单㊁分类精度更高㊁校正参数更少的特点,而且鲁棒性强,不易过拟合,在遥感领域高维特征分类中得到广泛应用[12]㊂面向对象方法可以有效减少 同物异谱 现象,而随机森林算法在处理高维数据时有其独特的性能优势,二者的结合在一定程度上提高了分类精度㊂宗影等[13]将面向对象方法和随机森林算法的有机结合,有效提高了滨海湿地植被的分类精度,总体精度达87.07%;赵士肄等[14]将面向对象方法和随机森林算法应用于耕地领域,并与其他机器学习分类算法进行对比验证,结果表明基于面向对象的随机森林模型取得了最高的耕地提取精度,并减弱了 椒盐 噪声,优化了分类结果;耿仁方等[15]研究结果表明,基于面向对象结合随机森林算法对岩溶湿地植被具有较高的识别能力,在95%置信区间内的总体精度为86.75%㊂虽然该方法的研究已经取得了一定的成功,但不同类型的特征对城市树种信息提取效果的影响尚不明确㊂因此,面向对象结合随机森林的方法对于城市树种分类的效果有待进一步探讨㊂此外,目前主流的数据源是大尺度的卫星影像和航空影像,或者是特征信息更加丰富的多光谱和激光雷达影像,而消费级无人机可见光影像在城市树种的精细分类方面还鲜有报道㊂因此,本文以福州市仓山区无人机可见光影像为研究对象,基于OBIA-RF模型,通过特征优选,构建最佳子集并比较不同机器学习算法的分类精度,并分析不同特征对城市树种分类的影响,构建该研究区城市行道树的最佳特征子集,比较不同分类算法对城市树种的分类效果,进一步评估OBIA-RF模型的分类性能和适用性,为城市生态系统保护及生态环境治理提供技术支持㊂1㊀研究区概况研究区位于福建省福州市仓山区(见图1),该区域属于南亚热带海洋性季风气候温暖湿润,冬季无严寒,夏季无酷暑㊂年日照时间1700 1980h,年降水量900 2100mm,气温20 25ħ㊂福州市仓山区典型树种包括白兰(Michelia✕alba)㊁荔枝(Li⁃tchichinensis)㊁芒果(Mangiferaindica)㊁南洋楹(Fal⁃catariafalcata)㊁榕树(Ficusmicrocarpa)㊁棕榈(Tra⁃chycarpusfortunei)㊁樟(Cinnamomumcamphora)等㊂研究区地势平坦,自然环境相对复杂,具备城市的基本特征,对研究城市树种分类具有一定的代表性㊂2㊀研究方法2.1㊀无人机数据采集与预处理实验数据于2020年2月8日采集,采用搭载FC6310S可见光镜头的大疆精灵4Pro(DJIPhantom4Pro)无人机进行航拍获取研究区影像,为削弱阴影对分类过程的干扰,选择天气状况良好无风有云的时间段进行作业㊂飞行相关参数设置如下:航高设置为60m,航向与旁向重叠率均为70%,镜头角度-90ʎ,光圈值f/5,曝光时间1/200s,IOS速度为IOS-400㊂本次飞行共获得450张航拍影像,照片分辨率为5472ˑ3078㊂通过瑞士Pix4Dmapper专业摄影测量软件对所采集的原始数据进行空中三角测量㊁点云重建㊁裁切以及镶嵌等操作,得到研究区的正射影像(DOM)和数字地表模型(DSM)㊂为了精确获得研究区的道路信息,采用天地图在线矢量影像作为辅助信息,并通过手绘的方式提取道路矢量数据㊂根据实际调查情况,利用缓冲分析,将缓冲距离设置为5m,得到了行道树的矢量分布图,然后,将矢量布图与原始影像叠加,最终裁剪出了研究区影像㊂2.2㊀地形特征提取归一化数字表面模型(nDSM)是一种反映地物绝对高度的高程模型[16],可为地物判别提供可靠依94第3期㊀㊀㊀㊀㊀㊀㊀陈逊龙,等:应用无人机可见光影像和面向对象的随机森林模型对城市树种分类据㊂使用ArcMap10.2软件进行地形特征提取㊂首先,通过人工目视解译方法从DSM中选取950个地面点,并批量提取栅格的高程信息,其中100个样本点的高程数据用以验证精度㊂其次采用插值的方法生成数字高程模型(DEM)㊂为获取更加精确的地面高程信息,比较常见的插值方法(克里金插值法㊁反距离权重法㊁样条插值法以及自然邻域法)生成的数字高程模型(DEM),以均方根误差㊁平均绝对值误差和决定系数(R2)作为评分指标(见表1)㊂4种插值方法均可得到较高精度的DEM数据,综合考虑决定系数(R2)㊁平均绝对值误差以及均方根误差,最终确定采用克里金插值法生成连续的DEM数据㊂最后,根据已生成的DEM数据,利用Arc⁃Map10.2软件中的栅格计算器,将DSM数据与DEM数据相减得到nDSM数据[17]㊂图1㊀研究区概况图表1㊀不同插值方法精度评价方㊀法决定系数(R2)平均绝对值误差均方根误差克里金插值法0.990.070.04反距离权重法0.990.080.04样条插值法0.990.080.05自然邻域法0.990.070.042.3㊀最佳分割尺度确定影像分割是面向对象方法中至关重要的初始环节,分割结果将直接影响分类精度[18]㊂本研究采用尺度参数评价工具(ESP2),结合目视解译的方法确定最佳分割尺度,所有图像分割过程均在eCogni⁃tion9.0Developer9.0软件完成㊂ESP2是用以评价不同尺度影像整体最大差异性的工具,通过计算整体局部方差均值随尺度变化率评估不同地物所对应的最佳尺度参数[19]㊂而ESP2计算出的尺度参数往往是多个值,需要结合人工目视才能确定最佳分割尺度㊂形状参数和紧致度参数是准确表示不同树种轮廓,使得对象内部同质性高的关键㊂综合考虑无人机影像的特点以及影像对象形状和紧致度因子的相互关系,将形状参数设置为0.5,紧致度参数设置为0.3㊂其他必要参数为:各波段的权重值设置为1㊁起始分割尺度为40㊁分割步长为1㊁迭代80次㊂随着尺度的增大,局部方差均值整体呈现上升的趋势,而尺度变化率呈现下降的趋势(见图2)㊂为了获得图像的过分割和欠分割之间的临界值,选取尺度变化率峰值为51㊁57㊁76㊁80㊁89㊁104㊁109和118作为相对最佳分割尺度参数,采用多尺度分割算法得到分割结果(见图3)㊂当分割尺度参数设置较大(分割尺度参数大于104)时,白兰㊁榕树和背景多处05㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀东㊀北㊀林㊀业㊀大㊀学㊀学㊀报㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀第52卷被划分为同一个对象,不同树种存在混淆现象难以被区分㊂当分割尺度参数设置较小(分割尺度小于76)时,不同地物内部出现了过分割现象,增加了数据冗余㊂当分割尺度参数设置76 89时,植被与背景区分相对明显,不同的树种之间能够被分割成独立的对象,整体分割效果较为理想㊂权衡分割效果与实际情况的吻合度,最终确定研究区无人机影像最佳分割尺度参数为76,并利用该分割尺度参数进行城市行道树提取㊂图2㊀ESP2最佳分割尺度估计图图3㊀不同尺度参数分割效果图2.4㊀对象光谱特征提取光谱特征是遥感影像的重要特征之一,地物通常具有不同的光谱特征,因此根据可见光影像中的地物光谱信息的差异可以用来区分不同的地物类型[20]㊂植被指数利用植被在不同波段下反射和吸收的特性,增强植被信息的同时使非植被信息最小化[21],被广泛应用于林业病虫害防治㊁农作物生长量估计㊁生态环境监测等领域[22]㊂在遥感图像中,不同地物通常具有复杂程度不同的边缘特征,因此,形状特征可以作为快速准确识别地物类型的有效手段[23]㊂纹理特征是遥感影像的底层特征,不受图像亮度的影响,能够综合反映像素的灰度分布和结构信息,利用纹理特征可以有效弥补可见光影像光谱信息的不足[6]㊂在面向对象的分类过程中,结合纹理特征对于提升分类精度效果显著[24]㊂地形特征能真实反映不同地物的高程信息,在影像分类过程中对于区分不同类型的地物具有重要意义㊂因此,本研究共选取光谱㊁指数㊁纹理㊁几何以及地形5大特征,剔除无效特征筛选出40个子特征,具体如下:(1)光谱特征(SPEC):主要包括:红色(R)波段的像元亮度的均值(MR)㊁绿色(G)波段的像元亮度的均值(MG)㊁蓝色(B)波段像元亮度的均值(MB)㊁最大差异值(Md)㊁亮度值(Br)㊂(2)指数特征(INDE):包括植被颜色指数(ICIVE)㊁可见光波段差异植被指数(IVDVI)㊁联合指数2(ICOM2)㊁超绿指数(IEXG)㊁超绿超红差分指数(IEXGR)㊁植被指数(IVGE)㊁归一化红绿差异指数(INGRDI)以及归一化绿蓝差异指数(INGBDI)(见表2)㊂(3)几何特征(GEOM):包括面积㊁边界长㊁宽度㊁长度㊁不对称性㊁长宽比㊁边界指数㊁圆度㊁像素个数㊁紧致度㊁体积㊁密度㊁椭圆拟合㊁主方向㊁形状指数㊁最大封闭椭圆半径㊁最小封闭椭圆半径以及矩形拟合㊂15第3期㊀㊀㊀㊀㊀㊀㊀陈逊龙,等:应用无人机可见光影像和面向对象的随机森林模型对城市树种分类(4)纹理特征(GLCM):基于灰度共生矩阵(GLCM)提取影像的纹理特征,包括对比度(TCON)㊁相关性(TCOR)㊁相异性(TDIS)㊁熵(TENT)㊁同质度(THOM)㊁均值(TMEA)㊁角二阶矩(TASM)和标准差(TSD)等特征值[6](见表3)㊂(5)地形特征:归一化数字表面模型(nDSM)㊂表2㊀植被指数及表达式指数特征公㊀式归一化红绿差异指数(INGRDI)[25]INGRDI=(MG-MR)/(MG+MR)归一化绿蓝差异指数(INGBDI)[26]INGBDI=(MG-MB)/(MG+MR)超绿指数(IEXG)[27]IEXG=2MG-MB-MR超绿超红差分指数(IEXGR)[28]IEXGR=MG-MB-2.4MR可见光波段差异植被指数(IVDVI)[21]IVDVI=(2MG-MR-MB)/(2MG+MR+MB)植被颜色指数(ICIVE)[29]ICIVE=0.44MR-0.88MG-0.39MB+18.79植被指数(IVGE)[30]IVGE=MG/MaRM1-aB,a=0.667联合指数2(ICOM2)[31]ICOM2=0.36IEXG+0.47ICIVE+0.17IVGE㊀㊀注:MR㊁MG㊁MB分别为红㊁绿㊁蓝波段像元亮度的均值㊂表3㊀纹理特征及表达式纹理指标公㊀式角二阶矩(TASM)TASM=ðNgi=0ðNgj=0p(i,j)2对比度(TCON)TCON=ðNgi=0ðNgj=0p(i,j)ˑ(i-j)2相关性(TCOR)TCOR=ðNgi=0ðNgj=0((i-ux)ˑ(j-uy)ˑp(i,j)2)/σxσy相异性(TDIS)TDIS=ðNgi=0ðNgj=0p(i,j)ˑ|i-j|熵(TENT)TENT=ðNgi=0ðNgj=0p(i,j)ˑlnp(i,j)同质度(THOM)THOM=ðNgi=0ðNgj=0p(i,j)ˑ(1/(1+(i+j)2))均值(TMEA)TMEA=ðNgi=0ðNgj=0p(i,j)ˑi标准差(TSD)TSD=ðNgi=0ðNgj=0p(i,j)ˑ(i-ux)2㊀㊀注:其中i,j是像元在图像中的行列坐标,p(i,j)为像素对的频数,Ng为灰度级数,ux㊁σx分别为px的均值和标准差,uy㊁σy分别为py的均值和标准差㊂2.5㊀试验样本选取本实验通过实地调查获取样本数据㊂调查者沿着研究区的主要道路记录了绿化树种,并排除了数量较少或被其他冠层遮挡的树种,最终确定了7类树种(白兰(Michelia✕alba)㊁荔枝(Litchichinensis)㊁芒果(Mangiferaindica)㊁南洋楹(Falcatariafalca⁃ta)㊁榕树(Ficusmicrocarpa)㊁棕榈(Trachycarpusfor⁃tunei)㊁樟(Cinnamomumcamphora))以及草地㊁灌木作为研究对象㊂根据遥感影像中不同地物类型的分布位置与大致面积比例,共选取了1100个样本点㊂为了避免较小的样本数量影响模型分类精度,将最小样本数量设置为60㊂采用Scikit-learn中内置的train_test_split函数进行分层抽样,按7:3的比例将数据划分为训练集和测试集(见表4),使各类别样本点数量大致与该类别的总面积成比例㊂训练集用于构建分类模型,测试集用于验证分类精度㊂表4㊀训练和验证样本地物总样本数训练样本数测试样本数白兰20014060草地503515灌木503515荔枝1409842芒果20014060南洋楹1208436榕树1409842棕榈604218樟1208436总计11007703302.6㊀分类模型与参数优化2.6.1㊀随机森林算法随机森林算法(RF)是一种通过集成学习的装袋思想将多棵决策树集合起来的算法,每棵决策树都充当预测目标类别的分类器㊂随机森林模型在样本数据和分类特征选择方面具有随机性,不容易过拟合,并且表现出良好的稳健性,即使在处理具有缺失值的高维数据时,仍能保持较高的分类精度㊂因此,它被认为是当今最好的算法之一[32]㊂目前,随机森林算法已经广泛集成在各种软件包中,使用Stata数据管理统计绘图软件㊁R语言统计软件可以轻松实现㊂在模型构造的过程中,通常只需要确定每个树节点包含的特征数量(M)以及决策树数量(N),就足以保证模型的性能[33]㊂本文采取递归特征消除法(RFE)[34]结合交叉验证(Cross-Validation)确定最佳特征数(见图4)㊂随着特征维数的增加,整体分类精度曲线经历 几何增长 ㊁ 缓慢上升 这个两个阶段后趋于平稳㊂当特征数为20时,各分类精度曲线均处于相对最高点,因此最终将特征数量的参数设置为20㊂在使用装袋方法生成训练集的过程中,随机森林算法会导致原始数据集中大约37%的数据未被抽到,这部分数据被称为袋外(OOB)数据㊂利用袋外数据对随机森林模型进行评估是一种无偏估计方法,且在一定程度上能减少计算量,提高算法的运行效率[35]㊂因此,本文采取遍历不同数量(1 1000)决策树的方法,通过比较袋外误差的大小,确定最佳的决策树数量(见图5)㊂当决策树数量小于85时,不同子集的袋外数据误差均随着决策树数量的增加而急剧下降,而后随着决策树数量的增加袋外数据误差的下降速度逐渐迟缓,当决策树数量为200时,袋外数据误差处于相对最低点㊂因此,选择决策树25㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀东㊀北㊀林㊀业㊀大㊀学㊀学㊀报㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀第52卷的最佳数量为200㊂图4㊀模型分类精度与特征数的关系曲线图5㊀袋外误差与决策树数量的关系曲线2.6.2㊀其他分类模型为充分探索随机森林算法对城市树种信息提取的适用性,引入当下流行的机器学习算法作为对照,包括极致梯度提升(XGBoost)㊁轻量级梯度提升机(LightGBM)以及k最近邻算法(KNN)㊂XGBoost是一种基于增强学习(Boosting)的集成算法,它通过在梯度下降方向上将弱分类器集成到强分类器中,并迭代生成新树以拟合先前树的残差㊂XGBoost能够自动利用中央处理器(CPU)的多线程进行分布式学习和多核计算,在保证分类准确度的前提下提高计算效率,尤其适用于处理大规模数据[36-37]㊂LightGBM也属于增强学习方法,基本原理与XG⁃Boost相似㊂但LightGBM使用基于直方图的决策树算法来减少存储与计算成本,并优化模型训练速度[38]㊂KNN算法是一种近似自变量与连续结果之间的关系的非参数方法[39],其基本思路是通过计算待分类样本与临近样本的距离(欧氏距离㊁曼哈顿距离)来确定所属类别,是一种简单而有效的分类算法㊂为了防止过拟合,本研究在JupyterNotebook平台上利用Scikit-learn库中的GridSearchCV包对这3种分类器参数进行了调优(见表5)㊂表5㊀不同分类器的超参数分类器参㊀数参数取值范围极致梯度提升(XGBoost)决策树数量[50,100,150,200]最大树深度[3,5,7,9]学习率[0.01,0.05,0.10]样本抽样率[0.6,0.8,1.0]特征抽样率[0.6,0.8,1.0]轻量级梯度提升机(LightGBM)学习率[0.01,0.05,0.10]决策树数量[50,100,150,200]叶子节点数[10,20,30,40]最大树深度[3,5,7,9]k最近邻算法(KNN)近邻数[1,2,3,4,5,6,7,8,9,10]2.7㊀试验方案构建不同树种之间单一特征的差异有限,难以满足树种分类的要求㊂因此,本研究采取增加特征数量的方式来提高分类精度,并探究不同特征组合对分类结果的影响(见表6)㊂表6㊀研究区各地物特征值地物特征不同地物的特征值草地灌木白兰荔枝芒果南洋楹榕树棕榈樟面积6859.673636.732928.797194.057200.108688.483457.752263.137325.01不对称性0.550.430.440.430.450.420.480.560.45边界指数1.741.462.011.971.991.842.062.191.79边界长578.70340.20431.95650.41669.29670.73488.16408.63601.00亮度值83.1078.79115.6974.0977.2081.1571.6396.8763.83植被颜色指数-29.14-33.17-47.78-21.15-18.89-21.62-29.96-17.74-20.18联合指数214.1116.2520.1911.7410.7511.6015.279.2511.82紧致度1.851.631.871.911.861.802.002.361.85密度2.032.102.042.102.102.161.971.822.09超绿指数76.6087.77117.8159.6253.9359.8280.8348.3158.52超绿超红差分指数-215.56-204.06-304.33-194.88-204.07-199.54-168.32-273.24-155.97椭圆拟合0.680.750.630.670.670.710.590.500.68角二阶矩000000000对比度556.77786.24877.55597.29614.12770.77714.25765.51514.11相关性0.870.820.820.880.880.840.850.860.90相异性17.1319.0521.6618.1218.6820.2819.7219.6216.64熵8.798.668.909.149.189.198.948.699.07同质度0.060.060.050.050.050.050.050.050.06均值127.03126.07125.67126.81126.68126.73126.23125.97126.8835第3期㊀㊀㊀㊀㊀㊀㊀陈逊龙,等:应用无人机可见光影像和面向对象的随机森林模型对城市树种分类续(表6)地物特征不同地物的特征值草地灌木白兰荔枝芒果南洋楹榕树棕榈樟标准差34.1734.6536.2336.4036.2335.7636.4037.6636.32长度143.4591.1085.96136.33136.90144.38100.0389.62138.31长宽比1.811.741.521.551.551.511.621.781.61主方向113.61130.6395.3296.5294.5694.5591.4883.5681.45最大差异值1.641.691.531.471.361.201.501.341.46蓝色(B)波段像元亮度的均值84.4766.8094.6274.2079.0881.7263.64105.5364.38绿色(G)波段像元亮度的均值136.22133.75189.36116.28116.90120.40118.79141.29101.72红色(R)波段像元亮度的均值111.38112.92166.2898.74100.7999.2693.11128.7580.55归一化数字表面模型0.321.7012.517.1612.0423.2010.9611.938.67归一化绿蓝差异指数0.210.270.270.200.170.180.260.130.21归一化红绿差异指数0.100.090.070.080.070.100.130.050.12像素个数6859.673636.732928.797194.057200.108688.483457.752263.137325.01最大封闭椭圆半径0.580.720.490.560.540.610.450.380.59最小封闭椭圆半径1.451.391.441.491.451.431.511.631.45矩形拟合0.820.860.800.820.820.830.780.740.82圆度0.860.670.950.930.920.821.061.250.86形状指数1.841.552.092.042.061.902.162.321.86可见光波段差异植被指数0.170.200.190.150.130.140.210.090.17植被指数1.361.431.381.301.261.301.461.181.37体积6859.673636.732928.797194.057200.108688.483457.752263.137325.01宽度80.7852.7558.0390.8190.4997.8862.9651.4688.94㊀㊀根据优选特征贡献率(见表7),将所选取的5大特征组合形成了10种试验方案(S1 S10)㊂光谱特征作为每幅遥感影像的基本特征,作为基础被纳入到这10种方案的构建中㊂其中,S1仅包含光谱特征;为了全面探究其他特征对分类结果的影响,在S1基础上引入了地形㊁指数㊁纹理等3个总体特征贡献率较高的特征,通过遍历这3个特征的各种组合得到了S2 S8;S9包含了所有的特征;根据20个优选特征组合建立S10,具体的分类方案见表8㊂表7㊀优选特征重要性优选特征重要性/%归一化数字表面模型14.96最大差异值12.41联合指数25.57植被颜色指数5.42绿色(G)波段像元亮度的均值4.84归一化绿蓝差异指数4.67超绿指数4.58亮度值4.36可见光波段差异植被指数3.42植被指数3.26红色(R)波段像元亮度的均值3.05角二阶矩2.90蓝色(B)波段像元亮度的均值2.86超绿超红差分指数2.78标准差2.25归一化红绿差异指数2.23熵2.03相关性1.97均值1.41边界指数1.28表8㊀分类方案方案特征子集特征数量S1光谱5S2光谱+地形6S3光谱+指数13S4光谱+纹理13S5光谱+地形+指数14S6光谱+地形+纹理14S7光谱+指数+纹理21S8光谱+地形+指数+纹理22S9光谱+地形+指数+纹理+几何40S10优选特征202.8㊀精度评价本文根据混淆矩阵对模型的分类精度进行定量评价㊂混淆矩阵也称为误差矩阵,是遥感影像二分类问题上的一种评价方法,反映了分类结果与真实地物类别之间的相关性[40]㊂混淆矩阵的评价指标包括总体精度(OA)㊁Kappa系数(Kp)㊁生产者精度(PA)以及用户精度(UA)㊂其中,总体精度指正确分类样本与总体样本的比值;生产者精度指分类结果与参考分类相符合的程度;用户精度指样本分类正确的可能性;Kappa系数是用于检验遥感影像分类结果的一致性,也可以用以均衡分类效果[41]㊂各指标计算公式如下:㊀㊀㊀㊀㊀OA=ðni=1xiiN;㊀㊀㊀㊀㊀Kp=Nðni=1xii-ðni=1xi+x+iN2-ðni=1xi+x+i;45㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀东㊀北㊀林㊀业㊀大㊀学㊀学㊀报㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀第52卷㊀㊀㊀㊀㊀PA=xii/x+i;㊀㊀㊀㊀㊀UA=xii/xi+㊂式中:N为参与评价的样本总数;n为混淆矩阵的行列数;xii为混淆矩阵第i行㊁第i列上的样本数;xi+和x+i分别为第i行和第i列的样本总数㊂3㊀结果与分析3.1㊀随机森林算法的不同分类方案精度由表9可知,随着不同特征类型数量的增加,总体分类精度和kappa系数整体呈上升趋势㊂其中,仅利用光谱特征作为分类依据的方案S1精度最低,总体精度和kappa系数分别为82.12%和0.79,说明光谱特征是遥感影像最重要的特征之一,但仅利用光谱特征难以达到所需的分类精度㊂方案S2 S4是在S1的基础上分别加上地形㊁指数和纹理特征,相比方案S1,这3个方案的总体分类精度分别提高了5.15%㊁4.55%㊁1.82%,kappa系数分别提高了0.06㊁0.06㊁0.03㊂在分类过程中,地形特征相较于指数和纹理特征扮演着更重要的角色,大幅提高了分类精度㊂方案S5 S7是在光谱特征的基础上加入地形㊁指数和纹理特征的两两组合,旨在研究它们之间的相互作用对分类精度的影响㊂整体而言,与S2 S4相比,这3个方案的总体分类精度呈上升趋势㊂其中,S6具有最高的总体精度和kappa系数,分别达到90%和0.88;其次是S7,和S1相比,总体精度和kappa系数分别提高了7.27%和0.09;而S5总体精度和kappa系数只增长了6.36%和0.08㊂表明地形与指数特征交互作用在分类过程中提供了更大的贡献度㊂方案S8是由特征重要性靠前的光谱㊁地形㊁指数以及纹理特征构成㊂与包含所有特征的方案S9相比,S8反而具有更高的总体分类精度和kappa系数,分别达到92.12%和0.91㊂表明几何特征对分类精度具有负向影响,它的加入降低了分类精度㊂方案S10由优选特征组成,其获得了所有子集中最高的分类精度和kappa系数,分别为92.42%和0.91㊂与S9相比,分类精度提高了0.60%㊂说明特征优选方法能消除高维复杂特征间的信息冗余,使模型仅利用较少特征数量并获得更高的运行效率和分类精度㊂表9㊀不同分类方案分类精度方案总体精度/%Kappa系数方案总体精度/%Kappa系数S182.120.79S690.000.88S287.270.85S789.390.88S386.670.85S892.120.91S483.940.82S991.820.91S588.480.87S1092.420.91㊀㊀由表10可知,虽然S1方案的用户精度与生产者精度整体上处于最低水平,但棕榈树的用户精度达到了100%,表明棕榈与其他树种存在明显的光谱差异㊂方案S2加入地形指数后,各类地物的用户精度与生产者精度相比S1都有不同程度的提高,用户精度提升幅度1.88% 8.18%,生产者精度提升幅度2.78% 11.11%,因为地形特征的加入更好的反映了不同地物之间的空间关系,从而大幅提高了分类精度㊂方案S3在S1的基础上加入了指数特征,荔枝㊁榕树以及樟的用户精度分别提升了10.95%㊁9.18%和8.72%,说明植被指数对荔枝㊁榕树以及樟分类效果显著,但对于其他树种的区分能力有限㊂方案S4加入纹理特征,芒果和樟的用户精度提升了8.85%和9.00%,而棕榈和榕树的生产者精度分别提升了22.22%和11.9%,说明这些树种的纹理结构特异性强与其他地物的差异显著,因此纹理特征的加入对分类精度有正向影响㊂方案S5与S2相比,荔枝和榕树的用户精度提升了7.05%和5.12%,而草地的精度下降了5.88%;与S3相比,灌木的用户精度提升了4.47%㊂总体而言,地形特征与指数特征的组合对分类精度的提升不显著,并且在某些树种的分类上精度出现不同程度的下降,说明这二者的组合产生了冗余信息影响了分类精度㊂方案S6与S2相比,芒果与樟的用户精度分别提升了6.44%和7.66%,而棕榈树和榕树的生产者精度分别提升了27.78%和11.90%,这个结果与方案S4类似,说明地形特征和纹理特征的组合与树种的分类精度呈正相关㊂方案S7与S6相比,除个别树种外,整体精度出现了不同程度的降低,波动范围为-6.21% 4.04%㊂然而,与方案S5相比,总体分类精度有一定的提升,波动范围是-0.58% 7.55%㊂方案S8与表现最好的方案S7相比,荔枝和榕树的总体分类精度分别提升了9.42%和6.67%,其他树种的总体分类精度保持稳定,这表明高维度的特征组合带来了更多的信息,在一定程度上提高了分类精度㊂综合所有特征的方案S9与S8相比,总体分类精度呈现出不升反降的现象,波动范围为-10.23% 4.74%,说明高纬度的特征产生了冗余信息,影响了随机森林模型的分类性能㊂优选特征子集S10与S9相比,总体分类精度有所提升,其中灌木㊁草地以及荔枝的用户精度分别提升了10.23%㊁5.88%和3.55%㊂由此可见,特征优选通过对高维数据集的降维和优化,使模型仅利用较少的特征仍能保证良好的分类效果㊂3.2㊀应用优选特征子集对不同分类模型的精度评价由表11可知,随机森林模型的分类精度最高,总体精度为92.42%,比k最近邻算法(KNN)㊁极致55第3期㊀㊀㊀㊀㊀㊀㊀陈逊龙,等:应用无人机可见光影像和面向对象的随机森林模型对城市树种分类。

湿地遥感分类方法评估——以玛多湖湿地自然保护区为例

湿地遥感分类方法评估——以玛多湖湿地自然保护区为例

湿地遥感分类方法评估——以玛多湖湿地自然保护区为例吕烨;史良树;田燕芹;张丽;闫敏;李一琼【期刊名称】《江苏海洋大学学报:自然科学版》【年(卷),期】2022(31)1【摘要】在全球变暖和人类活动不断加剧的影响下,湿地生态系统遭到严重破环,因此快速准确地获取湿地分布状况显得尤为重要。

以玛多湖湿地自然保护区为研究区域,采用随机森林、神经网络和支持向量机3种机器学习分类器,应用高精度多光谱Sentinel-2影像绘制玛多湖湿地利用分布图,并与加入DEM地形数据以及NDVI,NDWI,BI,RVI 4种光谱指数信息后的波段合成数据作对比。

研究结果表明,支持向量机分类方法和波段合成数据的组合在玛多湖湿地制图中表现出了最好的精度效果,总体精度为95.8%,Kappa系数为0.95。

两种数据源对分类结果的影响明显低于分类器的影响。

虽然支持向量机与随机森林分类方法间效果的差异较小,但相较于神经网络分类方法,分类精度有着明显提高。

该研究进一步证实了传统机器学习分类方法应用于高分辨率多光谱影像开展湿地信息提取研究的可靠性。

【总页数】6页(P31-36)【作者】吕烨;史良树;田燕芹;张丽;闫敏;李一琼【作者单位】中国国土勘测规划院;中国科学院空天信息创新研究院;苏州科技大学地理科学与测绘工程学院【正文语种】中文【中图分类】P237【相关文献】1.基于FDCT与ELM的遥感影像湿地类型分类——以黄家湖国家湿地公园为例2.结合GIS数据的神经网络湿地遥感分类方法:以上海崇明岛东滩湿地为例3.洪泽湖湿地退化成因及生态修复实践——以江苏泗洪洪泽湖湿地国家级自然保护区为例4.基于知识的洞庭湖湿地遥感分类方法5.基于高分一号卫星遥感数据的青藏高原高寒湿地信息提取方法研究——以玛多县为例因版权原因,仅展示原文概要,查看原文内容请购买。

基于国产高分遥感数据的黑龙江三江湿地分类

基于国产高分遥感数据的黑龙江三江湿地分类

基于国产高分遥感数据的黑龙江三江湿地分类潘煜琳;林辉【期刊名称】《中南林业科技大学学报》【年(卷),期】2022(42)9【摘要】【目的】湿地是重要的生态系统之一,实现湿地信息的自动提取和动态监测对湿地资源的科学管理和利用有重要的意义。

黑龙江三江湿地是我国最大的淡水沼泽湿地,具有丰富的野生动植物资源。

探究国产高分五号(GF-5)高光谱和高分六号(GF-6)多光谱遥感数据及其不同特征组合在中高纬度湿地信息分类中的能力,为三江湿地的可持续发展提供科学依据。

【方法】首先对获取的高分数据进行辐射定标、大气校正、地理配准、镶嵌和裁剪预处理后,然后采用主成分分析法(Principal Component Analysis,PCA)对高光谱数据进行降维和特征筛选,最终从GF-5遥感影像中选取了5个特征;在GF-6的8个原始波段基础上通过波段计算提取了指数特征(NDVI、NDWI),增加到10个波段,并将GF-5和GF-6影像提取特征进行组合,利用支持向量机(SVM)、随机森林算法(RF)和K-近邻算法(KNN)等3种分类器提取湿地信息。

【结果】基于GF-5和GF-6波段组合后的特征组合与SVM算法的结合获取的湿地信息总体分类效果最好,总体精度可达到88.96%,Kappa系数为0.85,能够合理地提取三江湿地的不同地类信息。

根据混淆矩阵的数据统计可知,湿地重要的地类草本和水域错分比例明显减少,此外大面积噪声情况有所改善并且细小狭长的水域能够被识别分类。

【结论】不同源数据和特征组合的湿地信息提取的精度表明高光谱和多光谱遥感数据的特征组合可以提供丰富的光谱信息,显著减少了“同物异谱,同谱异物”的情况;而且基于GF-5和GF-6特征组合,应用SVM算法,可以获得较高的分类精度,对比单一的GF-5和GF-6遥感数据,总体精度分别提高了16.74%和3.3%,为构建国产高分卫星数据的湿地信息智能提取理论和方法提供技术支撑。

基于加速遗传算法的人工湿地类型优选模型研究

基于加速遗传算法的人工湿地类型优选模型研究
殊生态 系统口 ] 它 利 用 自然 生 态 系 统 中 的 物理 、 , 化 学 和生 物 的三 重协 同作 用 , 通过 过 滤 、 附、 沉 、 吸 共 离
湿地类 型的权 重排序值 , 提高传 统层次 分析法 的准确 性 和可靠 性 , 为人 工湿地 类型优 选提供 一条新 的研究
途径。
潜流和垂直流 3种湿地类型 , 利用模糊层次分析法构建人工湿地类型优选模型 , 并采用模拟生物 自然进化 法则 的加速遗传算法统

求解各模糊判断矩阵, 得到各种人工湿地类 型的权重排序值 。实例研究结果显示 , 相对于其他两种 人工湿地类型 , 垂直流人工
湿地 具 有较 大 的优 势 。文 章 建 立 的基 于 加 速遗 传 算 法 的人 工 湿 地类 型优 选 模 型 , 提高 了人 为 主 观判 断 的准 确 性 , 人 工 湿 地 类 型 为
0 引

究 的基础上 , 出利用 模糊层 次分析 法构建人 工湿地 提
类型优 选模 型 , 并采用 模拟生物 自然进 化法则 的加速 遗传算 法l 统一求 解各模糊 判 断矩 阵 , 到各种人 工 _ 7 得
人工湿地 是一种 由人工建 造和监督 控制 的 , 处于 陆地 生态系统 与水生生 态系统 之间 , 类似 沼泽地 的特
基 于加速 遗传 算法 的人 工 湿地类 型优选 模 型研究
葛 军
( 肥 市 滨 湖新 区建 设 投 资 有 限公 司 , 徽 合 肥 合 安 20 6 ) 3 0 1

要 : 了提 高 传 统层 次 分 析 法 在人 工 湿地 类 型 优 选 中 的准 确 性 和 可靠 性 , 出 从技 术 、 济 和 环 境 3个 角 度 评 价 表 面流 、 平 为 提 经 水

基于多目标遗传随机森林特征选择的面向对象湿地分类_刘舒

基于多目标遗传随机森林特征选择的面向对象湿地分类_刘舒
2017年1月 doi: 10. 6041 / j. issn. 10001298. 2017. 01. 016
农 业 机 械 学 报
第 48 卷 第 1 期
ቤተ መጻሕፍቲ ባይዱ
基于多目标遗传随机森林特征选择的面向对象湿地分类
刘 舒
1
姜琦刚
1


1


1
李远华
1


2
( 1. 吉林大学地球探测科学与技术学院 ,长春 130026 ; 2. 大连海事大学航海学院 ,大连 116000 ) 摘要: 以多时相 Landsat8 影像和 SRTM DEM 为数据源, 对南瓮河流域进行了面向对象湿地分类 。 为削弱高维特征 集对分类精度的影响 , 提出一种多目标遗传随机森林组合式特征选择算法 ( MOGARF ) 进行特征集优化。 利用 Relief F 算法对完整特征集进行特征初选 , 再以基于随机森林的封装式多目标遗传算法进一步提取优化特征集 。 将所得特征集结合随机森林分类法提取湿地信息 。 并将结果分别与基于完整特征集和仅采用 Relief F 算法及 Boruta 算法提取的优化特征集的 3 种随机森林分类结果对比 。 试验结果表明, 采用 MOGARF 算法特征选择后, 特 征维度降低至原来的 10% , 且分类精度最高, 总体精度为 92. 61% , 比其他分类方案提高 0. 35% 数为 0. 907 5 , 袋外误差为 7. 77% , 比其他分类方案降低 0. 91% 类法是湿地分类的有效方法 。 关键词: 湿地分类; 多光谱遥感影像; 面向对象; 多目标遗传随机森林算法 ; 特征选择 中图分类号: TP79 文献标识码: A 1298 ( 2017 ) 01011909 文章编号: 10001. 94% , Kappa 系 1. 48% 。 利用 MOGARF 特征选择的随机森林分

基于CiteSpace_的湿地生态服务功能文献计量与可视化分析

基于CiteSpace_的湿地生态服务功能文献计量与可视化分析

文数量[17] ,计算后 4 m≈3. 09( 故 m 4 = 3),因此发文量在 3
篇以上就是核心作者。 从表 1 可以看出,崔丽娟发文量最
多,达到 17 篇,该学者主要致力于湿地生态过程与机理、湿
值分类和价值评估方面[5] ,各学者对不同地区湿地服务功能
快速发展,使湿地生态服务功能价值动态数据挖掘和采集的
准确性得到了提高[6] 。 目前,对湿地生态系统服务的研究已
经从自然湿地服务功能发展到城市湿地和小微湿地[7-8] ,从
湿地单 元 服 务 功 能 发 展 到 大 江 大 河 服 务 功 能 和 空 间 尺
究“ 十四五” 立项课题(23SK139) 。
作者简介 刘莎(1979—) ,女,江西宜春人,图书馆馆员,硕士,从事图
书参考咨询研究。 ∗通信作者,教授,博士,从事生态系统
生态学研究。
收稿日期 2022-09-13
题 = 湿地生态(精确) and 主题 = 服务( 精确)” 的方式进行检
索,时间为 2001 年 1 月 1 日—2021 年 12 月 31 日,从学术期
地服务可持续发展等。 湿地生态服务研究仍处于快速发展期,研究广度和深度不断增强。
关键词 CiteSpace;文献计量;湿地生态服务;知识图谱
中图分类号 S-058 文献标识码 A
文章编号 0517-6611(2023)13-0215-06
doi:10. 3969 / j. issn. 0517-6611. 2023. 13. 048
序号
Code
作者
Author
机构
Institution
量持续增加,处于初步阶段,年均发文量为 18 篇,尤 其 是
1

基于随机森林分类方法和多源遥感数据的r湿地植被精细分类

基于随机森林分类方法和多源遥感数据的r湿地植被精细分类

基于随机森林分类方法和多源遥感数据的r湿地植被精细分类崔小芳;刘正军
【期刊名称】《测绘与空间地理信息》
【年(卷),期】2018(041)008
【摘要】利用大丰市沿海滩涂湿地区域的高光谱影像和同时期的机载LIDAR数据,结合影像的光谱信息,采用随机森林算法(RF)对研究区进行湿地植被精细分类,并分析和评价分类模型参数设置对总体精度的影响,最后与SVM分类结果进行对比.结果表明:随机森林分类方法的总体精度为90.3%、卡帕(Kappa)系数为0.874;与传统的SVM分类方法相比,RF法均提高了4种湿地植被的生产者精度和使用者精度.通过分析RF分类模型参数设置对总体精度的影响,得出当生长树个数为30、生长树深度为30时,分类精度最高.
【总页数】4页(P113-116)
【作者】崔小芳;刘正军
【作者单位】辽宁工程技术大学,辽宁阜新123000;河南省丰华工程技术有限公司,河南郑州450000;中国测绘科学研究院摄影测量与遥感研究所,北京100830【正文语种】中文
【中图分类】P237
【相关文献】
1.基于多源遥感数据融合的土地利用类型及典型树种分类方法研究 [J], 张磊;冯博
2.基于随机森林方法的遥感影像分类方法 [J], 赵志国
3.一种融合纹理特征与NDVI的随机森林海冰精细分类方法 [J], 王志勇;张梦悦;于亚冉;泥萍
4.基于面向对象随机森林方法的滨海湿地植被分类研究 [J], 宗影;李玉凤;刘红玉
5.基于多源遥感数据的第四系覆盖物分类方法研究:以内蒙古旗杆甸子幅1∶5万填图试点为例 [J], 张艳;孙杰;于长春;孟鹏燕;郭锥
因版权原因,仅展示原文概要,查看原文内容请购买。

遥感测绘论文题目GIS测绘学论文题目测绘工程论文题目选题大全毕业论文开题报告参考文献

遥感测绘论文题目GIS测绘学论文题目测绘工程论文题目选题大全毕业论文开题报告参考文献

耕地土壤有机质与速效氮磷钾含量高光谱遥感反演研究 经验模态分解在高光谱遥感数据处理中的应用 面向对象的高分辨率遥感影像的分割与分类研究 多极化星载 SAR 森林覆盖变化检测方法研究 多特征融合的遥感影像变化检测方法研究 近 30 年上海海岸带土地利用变化分析与建模预测 基于矩阵对数累积量和非局部均值方法的极化 SAR 噪声抑制 基于高光谱数据的最大羧化速率遥感定量反演 高分辨率遥感影像道路网提取及变化检测 基于高分辨率遥感影像的城区建筑物提取方法研究 基于高分辨率遥感影像的团场小城镇土地利用变化分析与预测研究 面向对象的草原植被参数反演方法及应用 基于多特征的面向对象高分辨率遥感图像分类 定标缺失情况下的高光谱图像分类研究 基于多波段多极化 SAR 数据的草原地表土壤水分反演方法研究 粒子群优化算法在多时相遥感影像变化检测中的应用研究 基于 Sentinel-1 和 Landsat 8 数据的潮间带盐沼湿地分类研究 高分辨率遥感影像面向对象的绿地信息提取方法研究 基于 HJ-1A HSI 高光谱遥感数据的湟水流域典型植被分类 多源遥感图像融合技术研究 基于 CVA 与光谱解混的高光谱图像变化检测研究 小麦茎基腐与全蚀病高光谱遥感识别研究 基于 Sentinel-1 的近岸海表风场反演研究 雷达卫星 TerraSAR-X 精准测距高原湿地水位反演研究 基于数据挖掘技术的航摄影像土地利用变化检测研究 基于深度神经网络的遥感图像变化检测 基于多空间分辨率遥感数据的山区土地利用/土地覆被分类及变化检测 基于图谱理论的遥感图像分类方法研究 高光谱遥感协同处理黑刺沟岩矿蚀变信息方法研究 基于多核学习的高光谱遥感影像分类方法研究
遥感测绘论文题目 GIS 测绘学论文题目测绘工程论文题目选
题大全毕业论文开题报告参考文献 目录
一、选题技巧............................................................................................................................................1 二、热词分布............................................................................................................................................2 三、测绘学论文题目大全....................................................................................................................... 2 四、知网万方等如何利用................................................................................................................... 104

基于随机森林算法的遥感影像水体提取方法

基于随机森林算法的遥感影像水体提取方法

基于随机森林算法的遥感影像水体提取方法The water extraction in remote sensing images based on the RandomForest AlgorithmPU YongfengZHANG ZhouJI LinYIN TongLIAN Heng摘要:随机森林算法以其稳定性强、运行速度快等优点在遥感分类中广泛运用。

为提高复杂地物环境下水体提取精度,引入随机森林算法,利用Landsat8 OLI多光谱遥感影像通过有放回的随机选择训练数据子集构建决策树,使得Gini 指数最小的属性作为分裂节点的属性,通过绝对多数投票法获得最终分类结果。

结果表明该方法能较准确的识别提取图像中的水体目标,在复杂背景、细小河流等不利条件下分类结果较为理想。

关键词:随机森林;水体提取;遥感影像Keywords:random forest; water body extraction; remote sensing image中图法分类号:P2371引言水是环境中最活跃的自然要素之一,是物质能量交换中不可或缺的一环[1],在交通运输、农业灌溉、水产养殖等方面发挥了重要的作用。

准确提取水体分布信息在水资源开发利用、流域生态环境治理、防灾减灾等领域具有重要意义[2-3]。

利用遥感图像提取水体信息具有现势性强、范围广、成本低等传统方式不可比拟的优点[4],许多专家学者对遥感影像提取水体方法进行了研究,孙永军等提出了一种基于改进的Canny算子边缘的方法提取ETM+遥感影像中的河流信息,取得了较好效果[5]。

李飞等利用高分一号卫星遥感数据采用决策树法、单波段阈值法和归一化水体指数法提取水体信息,提取精度均达到95%以上[6]。

但现有研究大多集中在地物类型简单、河流较宽的地区,复杂背景下河流提取以及细小河流提取的研究相对较少。

近年来迅速发展的随机森林算法因其运算速度快、分类精度高、结果稳定性强等优点在遥感信息提取中广泛应用[7-8],以随机森林算法为理论基础提取水体信息,并将结果与传统提取方法进行比较,探索复杂背景下河流提取以及细小河流提取的新方法,为更加精准提取水体信息提供技术支撑。

基于多分类器组合的湿地类型信息提取

基于多分类器组合的湿地类型信息提取

基于多分类器组合的湿地类型信息提取
王迪;万鲁河;陈烁
【期刊名称】《哈尔滨师范大学自然科学学报》
【年(卷),期】2018(034)005
【摘要】针时如何提高遥感影像分类精度等问题,该文选取覆盖友好自然保护区的Landsat_5TM遥感影像为数据源,提出了将多个分类器进行组合的遥感影像分类方法.该方法将熵权法引入到湿地遥感分类研究中,选取最大似然、支持向量机(SVM)、神经网络(NN)3种分类器作为子分类器,利用熵权法确定组合分类器的组合规则,采用多分类器组合的方法对友好自然保护区进行湿地类型信息提取,以提高湿地的分
类精度.结果表明:与单一分类器相比,多分类器组合的遥感影像分类方法能够有效的提高分类精度.
【总页数】6页(P62-67)
【作者】王迪;万鲁河;陈烁
【作者单位】哈尔滨师范大学;黑龙江省普通高等学校地理环境遥感监测重点实验室;哈尔滨师范大学;黑龙江省普通高等学校地理环境遥感监测重点实验室;哈尔滨师范大学;黑龙江省普通高等学校地理环境遥感监测重点实验室
【正文语种】中文
【中图分类】P237
【相关文献】
1.基于GF-1卫星东洞庭湖湿地类型信息提取 [J], 和晓风;林辉;孙华;严恩萍;胡佳
2.基于多分类器组合面向对象遥感影像信息提取方法 [J], 王惠英;苏伟;周军其
3.10年间盐城滨海湿地类型信息提取及动态变化分析 [J], 蒋佳文;温小荣;王海龙;佘光辉;林国忠
4.一种基于多分类器集成的地表覆盖信息提取方法 [J], 瞿珊珊;康顺
5.一种基于多分类器集成的地表覆盖信息提取方法 [J], 瞿珊珊;康顺
因版权原因,仅展示原文概要,查看原文内容请购买。

基于多特征优选的Sentinel-2遥感影像林分类型分类

基于多特征优选的Sentinel-2遥感影像林分类型分类

闫国东1 ,左雪漫1 ,陈瑾1 ,胡喜生1 ,周成军1,2,巫志龙1,福州 350002;2. 国家林业和草原局杉木工程技术研究中心,福州 350002)
摘 要:为探究 Sentinel-2 遥感影像林分类型分类的优选特征组合,实现对阔叶林、马尾松林、杉木林和竹林的分类及其 效果评价,选取福建省长汀县为研究区,利用 Sentinel-2 影像提取 10 个原始波段( O) ,计算 9 个光谱指数( S) 、7 个红边光谱指 数( R) 和 8 个纹理特征( Te) ,以及基于数字高程数据计算 2 个地形特征指数( To) ,共计 36 个特征;利用随机森林算法分析不 同特征在林分类型分类中的重要性,并利用袋外样本( Out of Band,OOB) 数据与平均不纯度减少方法优选特征组合( Optimum Individuality Combination ,OIC) ;对 6 种不同试验方案( O、O+To、O+To+S、O+To+S+R、O+To+S+R+Te 和 OIC) 进行林分类型分 类,并利用混淆矩阵评价分类结果。 结果表明,参与林分类型分类的 36 个特征的重要性为 2. 11% ~ 5. 43%,其中,海拔因子的 重要性最高,红边波段、红边光谱指数、纹理特征中均值与相关性也具有较高的重要性;单独使用原始波段对林分类型进行分 类,分类精度不高,总体精度为 73. 26%,Kappa 系数为 0. 64;以原始波段为基础引入其他特征,除原始波段外,其他特征均可以 提高分类精度;优选特征组合( OIC) 为重要性前 27 个特征,包含海拔、8 个原始波段、7 个红边光谱指数和 3 个纹理特征,分类 精度最高,总体精度为 83. 13%,Kappa 系数为 0. 77,比其余 5 种试验方案的总体分类精度提高了 0. 82% ~ 9. 87%。 以 Sentinel2 影像为数据源,随机森林算法优选的特征组合综合多类型特征中对林分类型分类有重要贡献的特征,从而提高了分类精度。 研究结果可为 GEE 平台 Sentinel-2 影像在森林资源调查中林分类型信息的提取提供参考。

基于随机森林算法的黄河三角洲湿地提取

基于随机森林算法的黄河三角洲湿地提取

基于随机森林算法的黄河三角洲湿地提取发布时间:2022-10-09T07:04:26.495Z 来源:《科技新时代》2022年3月6期作者:徐娜吴静李云峰王慧敏王德冬[导读] 了解湿地的现状对监测保护湿地生态系统具有十分重要的意义徐娜 1,吴静1*,李云峰1,王慧敏1,王德冬11.山东省国土空间数据和遥感技术研究院,山东济南 250000摘要:了解湿地的现状对监测保护湿地生态系统具有十分重要的意义。

因此,本文以黄河三角洲作为研究区域,利用高分辨率遥感影像数据和其他辅助数据,结合面向对象的随机森林分类方法提取黄河三角洲的湿地类型。

实验结果表明,黄河三角洲拥有14个湿地类型,其中淤泥质海滩面积最大。

关键词:湿地信息提取;黄河三角洲湿地;随机森林中图分类号:文献标志码:Information Extraction of Yellow River Delta Wetlands Based on Random Forest AlgorithmA 1,2,B 1,2,C 1,21. College, University, Chengdu 610059, China;2. Key Lab, University, Chengdu 610059, China)Abstract: Understanding the status of wetland ecosystems is of great importance for monitoring and protecting wetland ecosystems. Therefore, this paper takes the Yellow River Delta as the study area and extracts the wetland types in the Yellow River Delta by using aerial photography data and other auxiliary data, combined with the object-oriented random forest classification method. The experimental results show that the Yellow River Delta has 14 types, e.g., inland marsh, river water, reservoir water, pond water, ditch, etc. The overall area of the Yellow River Delta wetlands is 1164.40 km2, of which the largest area is the silty beach.Key words: Wetland information extraction; sYellow River Delta wetlands; random forests0 引言湿地是陆地生态系统和水生生态系统之间的过渡区域,通常具有上述两种生态系统的特征[1-3]。

基于改进遗传算法的工程项目多目标综合优化研究

基于改进遗传算法的工程项目多目标综合优化研究
1 工期 -成本优化模型
在工程项目多目标优化研究中,对于工期 -成 本优化模型的研究已经相当成熟。本文所建立的工 期 -成本优化模型:在工期上以网络计划为基础,根 据传统的关键路径法计算工程完工的总时间。在成 本上,将项目成本分为直接成本与间接成本,并考虑 提前完工减少间接成本和拖延工期增加间接成本的 情况,对间接成本进行修正。同时考虑成本变动涉 及资金的流动,添加资金的时间价值更加符合工程 实际[6]。
行求解,优化结果证明了该模型的可行性和有效性:降成本、缩工期、提质量。
关键词:工程项目;多目标优化;价值工程;质量衡量体系
中图分类号:TU12 文献标识码:A
文章编号:1672—1144(2021)03—0063—06
MultiObjectiveComprehensiveOptimizationofEngineeringProject BasedonImprovedGeneticAlgorithm
第 3期 刘颖聪,等:基于改进遗传算法的工程项目多目标综合优化研究
65
时间。
2 质量量化模型
工程项目质量的量化工作一般是在项目结束后
由相关部门进行验收评定,然而工程项目多目标优
化工作则要求在项目前期展开。由于两者工作存在
时间跨度差且质量本身难以量化的特点等原因,导
致工程多目标优化工作难以开展。本研究在引入价
假设 2 压缩项目工期时,不可将关键工作变 成非关键工作,且关键工作持续时间不能小于完成 该工作所需的最短持续时间。
假设 3 各项工序的间接成本仅与工期产生关 系,并认为项目间接成本与工期之间的关系呈折线 型递增。本模型认定项目总成本为直接成本与间接 成本之和,并且不考虑环境、施工技术复杂度等不确 定因素对其产生影响。

一个中国湿地植物资源分类系统

一个中国湿地植物资源分类系统

一个中国湿地植物资源分类系统
刘胜祥
【期刊名称】《华中师范大学学报:自然科学版》
【年(卷),期】1998(032)004
【摘要】提出了一个中国湿地植物资源分类系统,并将我国湿地植物资源分为3大类24小类,这个系统根据湿地植物用途建立系统框架,将植物群落的建群种,分布广的植物,生物量大的植物,湿地特有植物和与水禽,野生动物栖息地,繁殖地,隐蔽地相关的植物作为选择资源植物类别的标准。

【总页数】4页(P482-485)
【作者】刘胜祥
【作者单位】华中师范大学生命科学学院
【正文语种】中文
【中图分类】Q949.9
【相关文献】
1.植株密度对湿地植物生长及湿地生态系统CO2排放通量的影响 [J], 卢妍;徐洪文;宋长春
2.两种湿地植物去除污染物性能研究及其在小型湿地系统中的应用 [J], 和莹;庞宗强;栾晓丽;张秦铭;马文鹏
3.长江江心岛湿地公园植物配置方法探究长江江心岛湿地公园植物配置方法探究--以南京市八卦洲湿地公园为例--以南京市八卦洲湿地公园为例 [J], 韩李荃;胡海波;鲁小珍;蔡祺
4.刍议湿地旅游资源分类与应用 [J], 陈金华;刘慧媛
5.浅析城市湿地公园植物景观规划浅析城市湿地公园植物景观规划——以杭州西溪湿地公园为例 [J], 关海莉;成超男;胡凯富
因版权原因,仅展示原文概要,查看原文内容请购买。

基于特征优选的GF-6WFV影像湿地信息提取

基于特征优选的GF-6WFV影像湿地信息提取

基于特征优选的GF-6WFV影像湿地信息提取
黄冰鑫;徐佳;张晓同;陈成
【期刊名称】《地理空间信息》
【年(卷),期】2024(22)4
【摘要】以洪泽湖湿地为研究对象,构建一种基于特征优选的湿地面向对象分类方法,利用高分六号宽幅多光谱(GF-6 WFV)影像进行湿地信息提取。

首先对GF-6 WFV数据进行预处理和多尺度分割;然后提取光谱、植被指数、水体指数、红边指数和纹理特征,利用基于平均准确度下降法(mean decrease accuracy,MDA)的递归排除算法生成最优特征集;最后,基于最优特征集进行湿地分类,通过对比4种特征优选算法发现基于MDA的递归排除算法能更有效地进行特征变量选择,使用6种方案开展湿地分类实验。

结果表明GF-6 WFV影像的红边波段和红边指数在湿地分类中具有重要作用,利用优选特征集的分类精度最高,为87.43%,比未进行特征优选的分类精度提高了1.55%。

研究成果将为GF-6 WFV影像在湿地监测方面提供技术参考。

【总页数】6页(P39-44)
【作者】黄冰鑫;徐佳;张晓同;陈成
【作者单位】河海大学地球科学与工程学院;江苏省测绘工程院
【正文语种】中文
【中图分类】P237
【相关文献】
1.基于特征知识的TM影像湿地信息提取方法研究
2.基于特征优选的面向对象毛竹林分布信息提取
3.基于特征优选的随机森林算法在湿地信息提取中的应用——以湖北洪湖湿地自然保护区为例
4.基于特征优选的多时相SAR数据水稻信息提取方法
5.基于多时相Sentinel-2影像多特征优选的湿地信息提取
因版权原因,仅展示原文概要,查看原文内容请购买。

多特征和多分类器组合的湿地遥感影像分类

多特征和多分类器组合的湿地遥感影像分类

多特征和多分类器组合的湿地遥感影像分类李畅;刘鹏程【期刊名称】《计算机工程与应用》【年(卷),期】2012(048)033【摘要】为了适应湿地遥感影像分类,选择了湿地影像的典型特征,提出了一种组合多分类器的湿地遥感分类方法.提取湿地遥感影像的独立分量、纹理、湖泊透明度、归一化水体指数、绿度指数和湿度分量特征;选择样本对最小欧氏距离、光谱夹角填图、贝叶斯和支持向量机分类器进行训练学习.根据各分类器的混淆矩阵对其赋权值,检验样本是否满足正态分布;根据权值和假设检验结果构建组合分类器决策网络.实验表明该方法较传统湿地分类方法具有更好的性能和更高的精度.%Taking features of wetland's remote sensing image into account, typical feature selection is discussed. The independent component, texture, lake clarity, NDWI, GVI and WI of wetland image are extracted. The classifiers of minimum Euclidean distance, spectral angle mapper, Bayes and supporting vector machine are trained by sample respectively. Weights of every classifier are given by confusion matrices, and whether the sample meets normal distribution is tested. Multi-classifiers combination based on decision network is generated by weights and hypothesis test result. The experimental results show presented method has better performance and higher accuracy than traditional single-classifier method.【总页数】5页(P9-13)【作者】李畅;刘鹏程【作者单位】华中师范大学城市与环境科学学院,武汉430079;华中师范大学城市与环境科学学院,武汉430079【正文语种】中文【中图分类】TP751;P237【相关文献】1.基于多分类器组合的遥感影像分类方法研究 [J], 彭正林;毛先成;刘文毅;何美香2.结合多分类器的遥感影像分类方法研究 [J], 杨斌;刘正军;邢颖3.基于多分类器组合的湿地类型信息提取 [J], 王迪;万鲁河;陈烁4.多分类器融合的遥感影像分类方法实验研究 [J], 孙皓;甘淑;袁希平5.多特征组合多分类器的方法用于“文本无关”的说话人辨认(英文 ) [J], 王岚;陈珂;迟惠生因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

120






2017年
OOB error of MOGARF was 7. 77% which was 0. 91% 1. 48% lower than those of the other schemes. All these indicated that the MOGARF feature selection method was an effective feature selection method when it was combined with random forest classifier. Key words: wetland classification; multispectral remote sensed imagery ; objectoriented; multiobjective genetic and random forest algorithm; feature selection 少, 将组合式特征选择算法应用于面向对象分类的 [4 ] 研究也相 对 较 少 。 本 文 将 Relief F Filter ( Relief F) 算法和基于随机森林的多目标遗传 Wrapper 算法 Wrapper 组合 结合, 提出多目标遗传随机森林 Filter式特征选择算法提取优化特征集, 并应用于南瓮河 流域, 实现基于 RF 的面向对象湿地分类。 将分类 结果与基于完整特征集 ( No_FS ) 和分别利用 Relief F 算法、 Boruta 算法提取的优化特征集的 RF 面向对 象湿地分类对比, 验证该方法的有效性。
Abstract: Recently,researchers adopted objectoriented method to extract wetland distributions. Multitemporal and multisources of data can facilitate the extraction process but meanwhile it enlarges the amount of features. It needs a large quantity of experiment based on the expert knowledge to determine the optimal feature sets and the threshold values. In order to improve the classification accuracy and relief the researchers from large amount of work ,a filterwrapper hybrid feature selection method combining relief F, multiobjective genetic algorithm and random forest was proposed , which was a twostep method. In the first step,relief F algorithm was adopted to select features with class separability. In the second step ,multiobjective genetic algorithm based on random forest ( MOGARF ) was built. Four measures such as outofbag ( OOB ) error of random forest algorithm,dimension of the feature space , correlations among features and the variable weight of relief F algorithm were acted as four objectives of MOGA. The probability whether the feature was expressed was determined by the variable importance measures from random forest algorithm. The crowded distance of each feature collection was calculated and the feature collection with the least crowded distance was the optimal feature set. Nanweng river basin was taken as the study site. Objectoriented classification using random forest classifier was conducted based on the optimal feature set. Then the result was compared with three other random forest classification schemes by using the entire feature set or the feature set selected by relief F algorithm or the Boruta algorithm. The classification scheme with MOGARF had the best performance and the feature dimension was reduced to 10% of the entire one. The overall accuracy reached 92. 61% which was 0. 35% 1. 94% higher than those of the other three schemes with Kappa coefficient of 0. 930 6. The
[2 , 5, 10 - 12 ] [8 - 10 ] [4 - 7 ]
1
1. 1
研究区数据
研究区概况
。但当特征维度过高时, 特征集中次要
特征仍会降低分类精度, 在分类前也需要优化特征 [13 ] 空间 。优化的特征空间应具有较低维度, 特征应 具有类内聚合性和类间可分性, 特征间相关度低, 能 [14 ] 得到较高的分类精度 。 目前与 RF 算法结合的特征选择算法主要分为 过滤式( Filter) 和封装式( Wrapper) 。 也有学者构造 FilterWrapper 组合 特 征 选 择 法, 发挥两种算法优 势, 兼顾多个特征空间评价因素, 寻求精度和效率的 [4 , 15 ] 。 平衡 Relief F 算法是一种过滤式多类别特征选择算 法, 通过计算特征权重, 判断特征重要性。 RF 目前基于 模型的面向对象湿地分类研究较
南瓮河流域位于大兴安岭地区东部, 地理坐标 为北纬 50ʎ 56' 12ᵡ 51ʎ 39' 40ᵡ, 东 经 124ʎ 24' 54ᵡ 126ʎ13'15ᵡ( 图 1 ) 。研究区内植被丰富, 乔木主要有 兴安落叶松、 柞树等; 灌木有兴安杜鹃、 丛桦等; 草本 植物主要为杜香、 大叶章等。 该区为寒温带大陆性 季风气候, 寒冷季节较长, 植物生长周期约为 110 d。 研究区湿地资源丰富, 主要包括森林湿地、 灌丛湿 地、 草本湿地、 岛状林湿地、 湖泊湿地和河流湿地, 人 工湿地为采矿后产生的积水地带。其内包含我国唯 一以寒温带森林湿地生态系统为保护对象的国家级 [7 ] 自然保护区 , 也是我国最大的森林湿地分布区之 一
2017年1月 doi: 10. 6041 / j. issn. 10001298. 2017. 01. 016
农 业 机 械 学 报
第 48 卷 第 1 期
基于多目标遗传随机森林特征选择的面向对象湿地分类
刘 舒
1
姜琦刚
1


1


1
李远华
1


2
( 1. 吉林大学地球探测科学与技术学院 ,长春 130026 ; 2. 大连海事大学航海学院 ,大连 116000 ) 摘要: 以多时相 Landsat8 影像和 SRTM DEM 为数据源, 对南瓮河流域进行了面向对象湿地分类 。 为削弱高维特征 集对分类精度的影响 , 提出一种多目标遗传随机森林组合式特征选择算法 ( MOGARF ) 进行特征集优化。 利用 Relief F 算法对完整特征集进行特征初选 , 再以基于随机森林的封装式多目标遗传算法进一步提取优化特征集 。 将所得特征集结合随机森林分类法提取湿地信息 。 并将结果分别与基于完整特征集和仅采用 Relief F 算法及 Boruta 算法提取的优化特征集的 3 种随机森林分类结果对比 。 试验结果表明, 采用 MOGARF 算法特征选择后, 特 征维度降低至原来的 10% , 且分类精度最高, 总体精度为 92. 61% , 比其他分类方案提高 0. 35% 数为 0. 907 5 , 袋外误差为 7. 77% , 比其他分类方案降低 0. 91% 类法是湿地分类的有效方法 。 关键词: 湿地分类; 多光谱遥感影像; 面向对象; 多目标遗传随机森林算法 ; 特征选择 中图分类号: TP79 文献标识码: A 1298 ( 2017 ) 01011909 文章编号: 10001. 94% , Kappa 系 1. 48% 。 利用 MOGARF 特征选择的随机森林分
0902 修回日期: 20161104 收稿日期: 2016: 基金项目 东北地区国土资源遥感综合调查项目 ( 85015B01009 ) Email: liushu8877@ 126. com 作者简介: 刘舒( 1988 —) , 主要从事遥感地学和环境遥感研究, 女, 博士生, Email: jiangqigang@ jlu. edu. cn 通信作者: 姜琦刚( 1964 —) , 博士生导师, 主要从事 GIS 与遥感地学环境研究, 男, 教授,
相关文档
最新文档