分类与回归树及其应用研究_温小霓
信息可视化技术的分类研究
信息可视化技术的分类研究
杨峰;李蔚
【期刊名称】《图书与情报》
【年(卷),期】2007(000)003
【摘要】信息可视化是情报学中快速发展的新领域.对其技术或系统进行分类有助于理解信息可视化.文章首先总结了早期一些分类的思想和方案,从可视化对象的不同层次出发,提出了新的分类方法,并总结了该分类的优点.
【总页数】5页(P81-85)
【作者】杨峰;李蔚
【作者单位】广东商学院广东省电子商务市场应用技术重点实验室,广东广
州,510320;广东商学院图书馆,广东广州,510320
【正文语种】中文
【中图分类】TP391;G354
【相关文献】
1.面向对象技术在管理信息可视化分类研究中的应用 [J], 张伟;王学义;马维宁
2.遥感信息专题分类不确定性的可视化研究 [J], 阿依姑丽·托合提;瓦哈甫·哈力克;玛依拉·麦麦提艾力
3.基于信息可视化技术的地理空间元数据可视化研究 [J], 徐少坤;宋国民;王海葳;陈令羽
4.专题地图量化信息图形可视化数学基础分类体系研究 [J], 张军海;胡文亮
5.可视化商品信息分类研究 [J], 余小鹏
因版权原因,仅展示原文概要,查看原文内容请购买。
我国科技型中小企业信用风险评价模型——基于MLP神经网络的实证分析
我国科技型中小企业信用风险评价模型——基于MLP神经网络的实证分析温小霓;韩鑫蕊【摘要】针对科技型中小企业,首先建立了一个多层次的信用风险评价指标体系,并利用t检验和因子分析对指标体系进行简化和降维,然后在此基础上构建基于MLP 神经网络的科技型中小企业信用风险评价模型.最后,以中小企业板的66家科技型上市公司作为研究样本进行实证分析,检验结果表明,本文建立的针对于科技型中小企业的信用风险评价模型具有较高的准确率.【期刊名称】《科技和产业》【年(卷),期】2017(017)012【总页数】8页(P159-166)【关键词】科技金融;神经网络;信用风险;评估模型【作者】温小霓;韩鑫蕊【作者单位】西安电子科技大学经济与管理学院 ,西安710126;西安电子科技大学经济与管理学院 ,西安710126【正文语种】中文【中图分类】F276.44随着信息技术的高速发展和大数据时代的到来,我国越来越重视科学与技术的创新和发展,科技型中小企业作为创新的微观载体和实体经济的中坚力量发挥着越来越显著的作用。
在科技型企业成长的过程中,金融支持扮演着不可或缺的角色,国际华人科技工商协会主席李大西曾表示,“科技是第一生产力,金融是第一推动力”,足以见得科技创新与金融创新的深度融合是推动技术进步与经济增长的重要引擎。
目前,很多地区都在践行着这一理念,各级政府也在扶植科技型企业方面发挥着积极的引导作用,付诸了切实的努力,如鼓励创建孵化器、设立技术创新基金以及提供政策支持、减税补贴等等。
然而,对于企业最根本的信贷、融资问题却一直没有得到很好地解决。
出现这种困境,一方面是因为其投资风险普遍高于传统企业,具体表现为:研发周期长、轻资产运营、缺乏抵押物、信贷记录少,且市场对于新开发的技术和产品是否认同和接纳存在很大不确定性,这违背了银行谨慎性经营的原则,降低了金融机构为其提供贷款的积极性。
另一方面是因为我国科技金融的发展起步较晚,在风险识别、度量等方面仍以经验分析为主,主观性较强,并且金融机构对科技型企业进行贷款审查时,仍参照传统企业的信用风险评价标准,不能客观公正的反应科技型企业真实的信用状况。
应用增强回归树对小兴安岭沼泽湿地构成信息的提取
than that for non⁃wetlands (0.803) , and the performance to predict wetlands is better than that of non⁃wetlands.
产品,对地球 表 面 水 体 制 图 及 动 态 变 化 监 测 分 析
等
[ 4-5]
。 将云计算和机器学 习 应 用 于 地 理 空 间 科
1) 黑龙江省省属本科高校基本科研业务费项目( 2021-KYYWF
-E006) ;国家自然科学基金项目( 41671100,42071079) ;牡丹江师范
保护提供准确的数据。
1 研究区概况
本文以小兴安岭区域为研究区,小兴安岭位于
黑龙江省北部( 45°50′ ~ 51°10′N,125°20′ ~ 131°20′
E) ,其山脉总体为西北 - 东南走向,北部多台地、宽
东 北 林 业 大 学 学 报 第 51 卷
为 0.11 ~ 21.55。
本研究使用的遥感数据为 30 m 的 Landsat8 OLI
光学数据,提取蓝光波段( B2) 、绿光波段( B3) 、红
光波段( B4) 、近红外波段( B5) 、归一化植被指数和
归一化水体指数等变量;搜集时间范围为 2015 年 5
月 1 日至 2015 年 9 月 30 日覆盖研究区的 Landsat8
该像元与邻域内的像元平均值接近。 地形位置指数
可可的新分类系统
可可的新分类系统
佚名
【期刊名称】《《世界热带农业信息》》
【年(卷),期】2009(000)006
【摘要】经过空前的、全面的研究,新筛选计划提出使用10个可可形态组(包含1200个个体),由法国国际农艺发展研究中心(CIRAD)联合执行。
该计划还集中了世界性的科研队伍,包括美国、法国、巴西和厄瓜多尔的研究人员。
【总页数】2页(P25-26)
【正文语种】中文
【中图分类】TU528.31
【相关文献】
1.慢性胃炎的新分类——悉尼系统与改订悉尼系统 [J], 杉山敏郎
2.中国苦苣苔科植物中王文采旧分类系统与Weber新分类系统的名实更替 [J], 符龙飞;黎舒;辛子兵;温放;韦毅刚
3.2018牙周病和植体周病国际新分类——牙周炎分期分级疾病定义系统临床应用体会 [J], 束蓉; 倪靖
4.刍议APG新分类系统在"树木学"教学中的应用 [J], 李蒙;段一凡;伊贤贵;王贤荣
5.六足总纲系统发育研究进展与新分类系统 [J], 袁锋;袁向群
因版权原因,仅展示原文概要,查看原文内容请购买。
近二十年来植物分类学的进展
近二十年来植物分类学的进展
徐炳声
【期刊名称】《《植物科学学报》》
【年(卷),期】1987(000)001
【摘要】过去近二十年中,可以看到在植物分类学和系统学领域里,异常丰硕的成果和各种不同形式的活动。
这些年在宏观系统学(macrosystematics)方面所获得的新资料和新的研究方法,充分说明这一领域的进展是令人鼓舞的。
本文主要以Heywood的近著《植物分类学当前的景象》为蓝本,对这一领域的新发展和新动向作一简要回顾。
【总页数】16页(P77-92)
【作者】徐炳声
【作者单位】复旦大学生物系上海
【正文语种】中文
【中图分类】G6
【相关文献】
1.莎草属植物分类学研究进展 [J], 田雪芬
2.润楠属植物分类学研究进展 [J], 钟义;程欢;邓雄;彭晓春;白中炎;陈志良;钟志强
3.近二十年来植物分类学的进展 [J], 徐炳声
4.铁线莲属植物分类学及园艺学研究进展 [J], 张燕;黎斌;李思锋
5.蜘蛛抱蛋属植物分类学研究进展 [J], 刘安莉;吕定豪;王霞;叶新;封帆;曾真;何顺志
因版权原因,仅展示原文概要,查看原文内容请购买。
分类回归树在高校计算机联考数据分析中的应用
条件 ∈ 下节 点 t 的杂度消减 。为使 节点 t 尽可能的钝 , 需选择分 支条件 , 使得该 节点杂度消 减尽可能大 。用 ∈(表 示所考虑的 t ) 分支 条件 ∈的 全体 , 则选择 分支 条件 应 为 ∈ r △1∈, 。 ag 【 t ) 使 用贪 心算法 , 根节点 分支得 到的左 右节点 作为根 节点 , 将 递 归进 行上述 分支操作 , 最终构建树 T m。 在 构建树 T 的过程 中 , 满足 以下三个 条件 之一 , 则不 再对
计 算机 时代 2 1 0 0年 第 1 期
・3 3・
分类回归树在高校计算机联考数据分析中的应用★
符保 龙 。陈如 云
( 州职 业技 术 学院 ,广 西 柳 州 5 5 0 ) 柳 4 06
摘 要 :分析 了分 类回归树 的基本结构及树 的构 建方法 , 并将其应 用到 高校 计算机联考 的数 据分析 中。结果表 明 , 方 该
值越 小 , 着该节点 中所包 含的样本越集 中 , 意味 即该节 点越 钝 。
设分支 条件 ∈ 节点 t 将 分成 t t两个子 节点 , 中分到 t L R 和 其 l _ 中的
概率 是 P ; 到 t的概 率是 P , Ai∈,=(一 t一 t为 分 R 称 ( t i )Pi Pi ) t () ()
FU o l n Ba —o g, CHE N Ru y n -u
( iz o V c t n & T c nia l g .L uh u Lu h u o ai o eh c lCol e iz o .Gu n i 45 O ,Chn e a gx 5 0 6 ia)
Ab t a t Th s c tu t e a d te c n tu t g m eh d f CART r a a y e ,a d i s p le o h d t n l ss f c l g sr c : e ba i sr cur n r e o sr c i t o o n a e n l z d n t a p i d t t e a a a a y i o o l e i e
基于迁移学习和逻辑回归模型的花卉分类研究
基于迁移学习和逻辑回归模型的花卉分类研究
陈卫国;莫胜撼
【期刊名称】《南方农机》
【年(卷),期】2024(55)1
【摘要】【目的】不同种花卉之间的相似性以及同种花卉内部的多变性加大了花卉图像分类难度,其难点是要人工设计出能充分体现花卉颜色、形状和花瓣形态等特征的特征提取方法。
传统的花卉图像分类方法的精度不高且模型的泛化能力较差,这些问题亟待解决。
【方法】课题组提出一种基于数据增强的VGG16迁移学习卷积神经网络提取花卉图像特征,再训练多类逻辑回归模型的花卉图像分类识别方法;并且通过在flowers17和flowers102花卉数据集上进行测试,来验证课题组所提出的花卉分类识别方法的有效性。
【结果】课题组所提出的花卉分类识别方法在flowers17和flowers102数据集中分别达到了97.89%和92.10%的分类精度,高于现有其他花卉图像分类方法。
【结论】通过预训练的深度人工神经网络提取的高区分度的花卉图像特征,优于人工设定的花卉图像特征,能训练出更高效精准的花卉识别分类器。
基于本研究内容,下一步可对VGG16网络进行降维改进,让模型参数减少,从而实现快速实时应用。
【总页数】6页(P139-143)
【作者】陈卫国;莫胜撼
【作者单位】广西机电职业技术学院电气工程学院
【正文语种】中文
【中图分类】TP391.4;S126
【相关文献】
1.基于显著性检测和迁移学习的花卉图像分类
2.基于卷积神经网络和迁移学习的花卉图像分类
3.欧盟内选民赞成脱欧的动机分析——基于政党分类与逻辑回归模型的实证分析
4.一种基于逻辑回归的柴油机工况分类模型
因版权原因,仅展示原文概要,查看原文内容请购买。
应用多时序特征的哨兵系列影像对南方丘陵区树种识别
第52卷第3期东㊀北㊀林㊀业㊀大㊀学㊀学㊀报Vol.52No.32024年3月JOURNALOFNORTHEASTFORESTRYUNIVERSITYMar.20241)国家自然科学基金项目(42161057)㊂第一作者简介:王洁,女,1999年10月生,江西理工大学土木与测绘工程学院,硕士研究生㊂E-mail:187****9219@163.com㊂通信作者:李恒凯,江西理工大学土木与测绘工程学院,教授㊂E-mail:giskai@126.com㊂收稿日期:2023年10月11日㊂责任编辑:王广建㊂应用多时序特征的哨兵系列影像对南方丘陵区树种识别1)王洁㊀李恒凯龙北平张建莹(江西理工大学,赣州,341000)㊀(江西省煤田地质局测绘大队)㊀(江西理工大学)㊀㊀摘㊀要㊀树种分类是森林资源调查和监测的重要工作,杉木和油茶作为袁州区主要经济树种,准确获取树种空间分布信息,对产量估算和资源管理具有重要意义㊂以江西省宜春市袁州区为研究区,试验融合时序哨兵-1(Sentinel-1)㊁哨兵-2(Sentinel-2)等数据,结合中国南方丘陵区树种特点,提取植被指数㊁红边植被指数㊁地形特征和纹理特征等构建特征变量组合,分别利用分离阈值法(SEaTH)和特征权重算法(ReliefF)进行特征重要性排序和特征优选,分析各特征对树种分类的影响㊂结果表明:①在使用光谱特征和植被-水体指数的基础上加入不同特征后,树种分类精度均有提升,其中纹理特征的加入更有利于树种分类㊂②结合随机森林算法和特征权重算法(ReliefF)对树种分类的精度最高,总体精度为85.33%,Kappa系数为0.81,优于相同特征组下的支持向量机算法和分类回归树算法㊂关键词㊀树种分类;哨兵-1;哨兵-2;特征优选;随机森林;中国南方丘陵分类号㊀S771TreeSpeciesIdentificationinSouthernHillyAreasUsingSentinelSeriesImageswithMulti⁃TemporalFeatures//WangJie,LiHengkai(JiangxiUniversityofScienceandTechnology,Ganzhou341000,P.R.China);LongBeiping(JiangxiProvincialCoalGeologyBureauofSurveyingandMappingBrigade);ZhangJianying(JiangxiUniversityofSci⁃enceandTechnology)//JournalofNortheastForestryUniversity,2024,52(3):60-68.Treespeciesclassificationisanimportanttaskinforestresourceinvestigationandmonitoring.IntheYuanzhouregion,Chinesefirandcamelliaoiltreestandoutastheprimaryeconomictreespecies.Accuratelyobtainingspatialdistributionin⁃formationoftreespeciesisofgreatsignificanceforyieldestimationandresourcemanagement.TakingthestudyareaofYuanzhouDistrict,YichunCity,JiangxiProvince,theexperimentfusedthedataoftime-seriesSentinel-1(Sentinel-1)andSentinel-2(Sentinel-2),andcombinedwiththecharacteristicsofthetreespeciesinthesouthernhillyareasofChi⁃na,andextractedthevegetationindices,thered⁃edgevegetationindexes,thetopographicfeaturesandthetexturalfeaturestoconstructthecombinationsofthecharacteristicvariables.Thefeatureimportancerankingandfeatureselectionwereper⁃formedusingtheSEaTHmethodandtheReliefFalgorithm,respectively.Theimpactofeachfeatureontreespeciesclassi⁃ficationwasanalyzed.Theresultsshowedthat:(1)Theadditionofdifferentfeaturesimprovedtheaccuracyoftreespeciesclassificationonthebasisofspectralfeaturesandvegetation⁃waterindex,withtexturefeaturesbeingmorebeneficialfortreespeciesclassification.(2)ThecombinationofRandomForestalgorithmandReliefFalgorithmachievedthehighestac⁃curacyintreespeciesclassification,withanoverallaccuracyof85.33%andaKappacoefficientof0.81,outperformingSupportVectorMachinealgorithmandClassificationandRegressionTreealgorithmwiththesamefeatureset.Keywords㊀Treespeciesclassification;Sentinel-1;Sentinel-2;Featureoptimization;Randomforest;Chinasouth⁃ernhills㊀㊀森林生态系统变化的长期调查监测与评价是实现经济㊁社会与环境和谐快速发展的保障[1]㊂中国南方丘陵地区位于秦岭-淮河以南㊁青藏高原以东的山地和丘陵分布区,区域内森林资源丰富,植被覆盖面积广㊁林分结构复杂㊁地形破碎,传统的森林资源调查方法成本高㊁周期长㊂通过遥感影像能快速㊁准确地进行树种识别和分类,已有多种类型遥感影像应用于树种识别和监测[2-5]㊂利用时序遥感影像提取和分析植被物候信息,能够准确的反映植被生长过程中明显的季节周期性变化,进而提升树种分类的效果[6-7]㊂近年来,欧洲空间局(ESA)哥白尼计划发布的哨兵-2(Sentinel-2)时间序列影像数据,为树种分类提供了具有高空间分辨率的数据源㊂其红边㊁近红外和短波红外等波段提供了多种光谱信息,在树种识别研究中具有巨大潜力[8]㊂然而,在大尺度多云雨的南方丘陵地区,光学影像数据的获取极易受到限制㊂合成孔径雷达(SAR)具有全天时㊁全天候等特点,雷达后向散射系数能够提供不同于光学影像的信息,包括植被的含水量㊁土壤含水量以及地表的几何特征等,广泛用于植被监测及分类㊂杨丹等[9]利用时序哨兵-1(Sentinel-1)数据和深度循环网络方法对植被进行分类制图,总体精度为82%㊂为了提高树种分类精度,将光谱数据和其它数据相结合,发现对树冠形状不同的树种,纹理特征具有重要作用[10]㊂不同空间分布的树种的地形特征也有所不同,地形特征对地形复杂区域树种的提取也具有重要作用[11]㊂黄翀等[12]利用Sentinel-2和Sentinel-1对人工林进行分类,总体精度为85%,验证了纹理特征㊁后向散射特征在树种精细分类上的能力㊂Maetal.[13]通过实验证明地形特征能提高树种提取精度㊂因此,利用雷达㊁光学影像数据和地形数据提取不同树种特征,可实现多源遥感互补[14]㊂除影像数据外,算法也是影响树种分类精度的重要因素,遥感数据和机器学习的结合已成为树种分类的主要方法㊂Wangetal.[15]使用随机森林(RF)算法结合多时相㊁多特征Sentinel-2数据对长白山树种进行分类,总体精度为99.79%;Huetal.[16]采用支持向量比(SVM)算法应用多源遥感数据对树种进行分类,总体精度为89%;Chenetal.[17]采用决策树算法(CART)和QuickBird图像进行树种分类,总体精度为80.50%㊂表明随机森林算法(RF)㊁支持向量机算法(SVM)㊁决策树算法(CART)等机器学习算法均可以用于树种分类㊂本研究以江西省宜春市袁州区为例,结合研究区林地实地调查数据,将时序Sentinel-1㊁Sentinel-2和数字高程模型(DEM)数据相结合,提取不同树种特征,利用分离阈值法(SEaTH)和特征权重算法(ReliefF)进行特征优选,通过RF㊁SVM和CART分类算法进行对比分析,构建适用于南方丘陵山地的最佳树种分类算法模型,并验证多源数据相结合对大范围树种分类提取的可行性㊂分析适合南方丘陵地区树种分类的最佳特征因子组合,提取不同树种的空间分布信息,提高森林资源调查和监测的时效性㊂1㊀研究区概况袁州区位于中国江西省宜春市西南部,地理坐标位于113ʎ54ᶄ 114ʎ37ᶄE㊁27ʎ33ᶄ 28ʎ5ᶄN,土地总面积2532km2㊂区域内地貌以山地㊁丘陵为主,地势西高东低,是典型的南方丘陵区㊂气候属亚热带季风湿润性气候,森林资源丰富,植被物种多种多样,森林覆盖率达60.15%㊂袁州区主要树种为杉木(Cunninghamialanceolata)㊁油茶(Camelliaoleif⁃era)㊁松树(Pinus)等㊂其中,杉木㊁松树和桉树(Eu⁃calyptus)并称为中国南方三大用材树种,具有较高的经济价值㊂油茶产业是袁州区的特色优势产业,其产量和面积均位于中国前列㊂根据袁州区林地实地调查数据提取边界,划分区域总面积为2221.5km2(见图1)㊂本研究采用的行政区划数据来源于全国地理信息资源目录服务系统(https://www.webmap.cn)㊂2㊀研究方法2.1㊀数据来源与处理本研究所使用的Sentinel系列数据来源哥白尼开放存取中心(https://scihub.copernicus.eu/),Sen⁃tinel-1为干涉宽幅模式(IW)的地距多视产品(GRD),分辨率为10m,极化方式为VV+VH㊂Sen⁃tinel-2拥有13个不同空间分辨率的光谱波段,试验选取10m和20m空间分辨率波段共10个㊂数字高程模型(DEM)数据下载于地理空间数据云平台(http://www.gscloud.cn)㊂影像数据采集时间见表1,研究所使用的Sentinel-2影像波段信息见表2㊂图1㊀研究区地理位置表1㊀影像数据采集时间表月份哨兵-1哨兵-21月2019-01-08㊁2019-01-20-2月2019-02-01㊁2019-02-13-3月2019-03-09㊁2019-03-21-4月2019-04-02㊁2019-04-14-5月2019-05-08㊁2019-05-20-6月2019-06-01㊁2019-06-13-7月2019-07-07㊁2019-07-19-8月2019-08-12㊁2019-08-24-9月2019-09-05㊁2019-09-172019-09-2210月2019-10-11㊁2019-10-232019-10-0211月2019-11-04㊁2019-11-162019-11-0112月2019-12-10㊁2019-12-222019-12-06表2㊀本研究使用的哨兵-2波段信息波段中心波长/nm分辨率/mB2(蓝光波段)㊀49010B3(绿光波段)56010B4(红光波段)66510B5(红边波段1)70520B6(红边波段2)74020B7(红边波段3)78320B8(近红外波段)84210B8a(狭窄近红外波段)86520B11(短波红外1)161020B12(短波红外2)219020㊀㊀Sentinel-1数据通过轨道校正㊁热噪声去除㊁辐射定标㊁滤波㊁地形校正和分贝化处理将其转化为后向散射系数图,最后进行裁剪得到研究区雷达影像㊂16第3期㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀王洁,等:应用多时序特征的哨兵系列影像对南方丘陵区树种识别Sentinel-2数据通过大气校正,将其从L1C级数据转化为L2A级别数据,剔除60m分辨率波段后,将20m分辨率波段重采样至10m分辨率,最后进行裁剪拼接㊂DEM数据经过拼接裁剪后重采样至10m分辨率,并生成地形因子㊂样本点数据来源于2019年袁州区林地实地调查数据㊂根据研究区植被覆盖情况,确定分类类别为油茶㊁杉木㊁松树㊁其它树种㊁耕地㊁裸地㊁水体和建设用地等8类㊂根据林地调查图生成油茶㊁杉木㊁松树和其它树种等4类样本随机点,然后通过谷歌地图(GoogleEarth)高分辨率影像和实地调查数据剔除异常点㊂通过目视解译得到耕地㊁裸地㊁水体和建设用地等4类样本㊂最后得到油茶样本2710个㊁杉木样本3184个㊁松树样本810个㊁其它树种样本2873个㊁耕地样本658个㊁裸地样本177个㊁水体样本128个㊁建设用地样本321个,按照7ʒ3的比例随机分为训练样本和验证样本㊂利用预处理后的Sentinel-1㊁Sentinel-2和DEM数据提取不同特征㊂在光谱特征㊁水体指数和植被指数的基础上,通过不同的特征组合,构建多特征随机森林树种分类模型,然后分别利用分离阈值法和特征权重算法(ReliefF)进行特征优选,筛选出最佳分类特征组合,然后与SVM和CART分类算法进行对比分析㊂利用混淆矩阵评估3种算法分类结果,选择最优树种分类模型(见图2)㊂图2㊀技术路线与特征变量组合方案信息2.2㊀树种分类特征提取选取Sentinel-2影像的B2(蓝光)㊁B3(绿光)㊁B4(红光)㊁B5(红边1)㊁B6(红边2)㊁B7(红边3)㊁B8(近红外)㊁B8a(狭窄近红外)㊁B11(短波红外1)㊁B12(短波红外2)波段作为研究波段,并提取水体指数㊁植被指数和红边指数(见表3)㊂采用灰度共生矩阵(GLCM)提取纹理特征(均值㊁方差㊁同质性㊁对比度㊁差异性㊁熵㊁二阶矩和相关性),为了避免数据冗余,首先对Sentinel-2数据进行主成分分析,提取第一主成分数据,根据第一主成分进行纹理特征提取㊂利用DEM数据提取高程㊁坡度㊁坡向作为地形特征㊂根据Sentinel-1雷达数据提取后采用VV和VH双极化方式的后向散射系数(后向散射系数VV㊁后向散射系数VH)作为雷达特征㊂共获取适应南方丘陵山区的35类特征变量[18]㊂2.3㊀树种分类特征优选综合利用多种特征分类,能够充分利用遥感数据信息,提高树种提取精度㊂但相关性较弱的特征在分类时会造成特征冗余,导致分类精度的降低㊂特征优选的原则是在确保分类精度的前提下使用较26㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀东㊀北㊀林㊀业㊀大㊀学㊀学㊀报㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀第52卷少的特征子集,对特征集进行特征优选能够有效提升分类效率㊂表3㊀各特征变量及表达式特征类型特征变量特征变量的表达式光谱特征光谱波段B2(蓝光)㊁B3(绿光)㊁B4(红光)㊁B8(近红外)㊁B8a(狭窄近红外)㊁B11(短波红外1)㊁B12(短波红外2)植被指数比值植被指数(IRVI)IRVI=B8a/B4归一化植被指数(INDVI)INDVI=(B8a-B4)(B8a+B4)绿通道植被指数(IGNDVI)IGNDVI=(B8a-B3)/(B8a+B3)植被差异指数(IDVI)IDVI=B8-B4改良版土壤调整植被指数(IMSAVI)IMSAVI=((2B8a+1)-(2B8a+1)2-8(B8a-B4))/2水体指数归一化水体指数(INDWI)INDWI=(B3-B8a)/(B3+B8a)改进归一化水体指数(IMNDWI)IMNDVI=(B3-B11)/(B3+B11)多波段水体指数(IMBWI)IMBWI=2B3-B4-B8a-B11-B12红边特征红边波段(B)B5(红边1)㊁B6(红边2)㊁B7(红边3)红边归一化植被指数(IRNDVI)IRNDVI=(B5-B4)/(B5+B4)红边近红外归一化植被指数(IREDNDVI)IREDNDVI=(B8a-B5)/(B8a+B5)改良红边土壤调整植被指数(IMSRre)IMRre=((B8a/B5)-1)/(B8a/B5)+1红边叶绿素指数(ICIre)ICIre=(B8a/B5)-12.3.1㊀分离阈值法的特征优选分离阈值法(SEaTH)采用贾弗里斯松下距离(JM)[19]对类间可分性进行分析,并确定最佳特征组合㊂JM距离的计算公式如下:㊀㊀B=18(m1-m2)22σ21+σ22+12ln(σ21+σ222σ1σ2);㊀㊀J=2(1-e-B)㊂式中:m1和m2分别为两个类别的特征均值;σ1和σ2分别为两类别特征值的标准差;B为巴氏距离;J为样本间的分离度,J值范围为[0,2],数值越大,代表类间可分性越好㊂2.3.2㊀ReliefF算法的特征优选Kiraetal.[20]提出的特征权重算法(Relief)通过赋予每个特征的权重判断特征的重要性,但特征权重算法只适用于二分类的特征选择㊂Kononenko[21]在其基础上提出了多类特征选择的ReliefF特征权重算法,特征权重算法在处理多类问题时,每次从训练集D中随机抽取一个样本R,然后从该样本的同类样本集中选择k个最近邻样本Hj(C)(j=1㊁2㊁ ㊁k),从样本的每个不同类样本集中选择k个最近邻样本Mj(C)(j=1㊁2㊁ ㊁k),分别计算样本R与同类和不同类样本的距离和,然后根据距离更新特征权重(WiA)㊂权重计算公式如下:㊀WiA=Wi-1A-ðkj=1dA(R,Hj(C))mk+ðCʂclass(R)p(C)1-p(class(R))ðkj=1dA(R,Mj(C))mk㊂式中:A为某个分类特征;C为样本类别;class()为与R不同的样本类别;dA()为2个样本在特征上A的距离;Hj(C)为样本R最邻近的同类样本;Mj(C)为样本R最邻近的不同类样本;p()为某类样本在训练集D中所占比例;m为迭代次数;i为权重更新时当前迭代次数(i=1㊁2㊁ ㊁m);k为最邻近样本个数㊂2.4㊀树种分类算法随机森林算法(RF)是以决策树为基本分类器的集成学习算法,适用于高维遥感数据集,比其它机器学习算法更加高效和低成本[22-23]㊂RF还可以解决过拟合的问题,适用于时间序列遥感林地植被分类[24];支持向量机算法(SVM)是将非线性分类问题转化为高维线性问题,并在高维特征空间中构造线性判别函数,同时引入核函数减少运算量;分类回归树算法(CART)是通过对由测试变量和目标变量构成的训练数据集的循环分析形成二叉树形式的决策树,CART算法生成的决策树没有人工干预,减少了主观误差㊂2.5㊀树种分类精度评价为评估树种分类的准确性,本研究利用混淆矩阵和验证样本对树种分类结果进行精度验证,精度评价指标为用户精度(UA)㊁生产者精度(PA)㊁总体精度(OA)和Kappa系数(KPa)㊂计算公式如下:㊀㊀㊀㊀UAi=NiiNi+;㊀㊀㊀㊀PAi=NiiN+i;㊀㊀㊀㊀OA=Niiðki=1NiiN+i;㊀㊀㊀㊀KPa=Nðki=1Nii-ðki=1Ni+N+iN2-ðki=1Ni+N+i㊂36第3期㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀王洁,等:应用多时序特征的哨兵系列影像对南方丘陵区树种识别式中:N为总样本数,k为总类别数,Nii为被分到正确类别的样本数,N+i为第i类的真实值,Ni+为第i类的预测值㊂3㊀结果与分析3.1㊀树种光学和雷达特征由表4可知,各树种9 12月归一化植被指数(NDVI)均值,整个时间段内变化趋势基本相同,均呈下降趋势,归一化植被指数值为0.4 0.6,树种分离程度不明显,原因是油茶㊁杉木㊁松树都属于常绿树种㊂表5展示了不同树种在各光谱特征下的像元均值,树种在光谱特征上没有明显差异,仅松树和油茶在比值植被指数和红边叶绿素指数上与其它植被有所区分㊂表4㊀不同时间各树种归一化植被指数树种各树种归一化植被指数均值9月22日10月2日11月1日12月6日杉木0.5840.5670.5280.511松树0.5260.5100.4740.467油茶0.5050.4820.4450.419其他树种0.5770.5480.5130.482表5㊀不同树种光谱特征光谱特征不同树种光谱特征的像元均值杉木松树油茶其他树种蓝色(B2)0.0260.0260.0340.024绿色(B3)0.0490.0510.0600.044红色(B4)0.0300.0300.0470.029近红外(B8)0.2950.2550.2850.269狭窄近红外(B8a)0.3050.2660.2990.281短波红外1(B11)0.1470.1250.1880.159短波红外2(B12)0.0670.0580.0980.074比值植被指数(IRVI)3.8953.2353.1913.777归一化植被指数(INDVI)0.5840.5260.5050.577绿通道植被指数(IGNDVI)0.7250.6770.6720.724植被差异指数(IDVI)0.2650.2250.2380.240改良版土壤调整植被指数(IMSAVI)0.4920.4260.4390.453归一化水体指数(INDWI)-0.725-0.677-0.672-0.724改进归一化水体指数(IMNDWI)-0.502-0.414-0.525-0.564多波段水体指数(IMBWI)-0.451-0.377-0.512-0.454红边1(B5)0.0800.0830.1000.075红边2(B6)0.2350.2100.2320.210红边3(B7)0.2820.2440.2720.255红边归一化植被指数(IRNDVI)0.4740.4710.4040.450红边近红外归一化植被指数(IREDNDVI)0.5840.5250.5070.576改良红边土壤调整植被指数(IMSRre)0.9670.7960.7750.939红边叶绿素指数(ICIre)2.8952.2352.1912.777㊀㊀由图3可知,根据Sentinel-1雷达数据统计不同树种在对应日期VV和VH极化下的树种时序后向散射系数曲线㊂不同植被全年时序后向散射特征与植被的生长物候和形态相关,所有树种在两种极化下的后向散射系数变化趋势基本相同㊂VV极化下,其它树种在6月中旬左右后向散射强度明显升高,其后向散射强度全年高于其它植被;1 9月松树后向散射强度持续低于其它植被,杉木后向散射强度在12月呈现同其它植被不同的下降趋势㊂VH极化下,油茶VH极化后向散射强度全年低于其它植被,2月左右出现明显增幅和减幅,9月末到12月初出现明显减幅,12月松树和杉木呈现同其它植被不同的下降趋势㊂图3㊀树种VV/VH极化时序特征曲线通过对不同特征变量的叠加分析,可以近似分离出不同树种,雷达数据弥补了光学影像的不足,结合光学和雷达数据可以增强对树种的识别能力和提高分类精度㊂3.2㊀南方丘陵山区树种特征优选结果本研究分别利用分离阈值法和特征权重算法(ReliefF)对所构建的树种分类特征集进行特征优选㊂树种分类特征集共171个特征变量,通过试验获取样本的特征均值和标准差,根据公式计算树种之间的分离度,计算单个特征的巴氏距离以及同类特征巴氏距离的均值㊂同类特征中选取高于均值的特征,完成同类特征优选㊂由表6可知,利用特征权重算法(ReliefF)进行特征优选及排序,排名前15和后15的特征,根据重要性对特征进行排序分组,并利用随机森林算法进行分类,共分为7组㊂由表7可知,分类精度随着分类特征的增加呈先上升后下降的趋势,第5组分类精度最高,因此选取第5组作为特征权重算法(ReliefF)最优特征集㊂3.3㊀南方丘陵山区树种分类精度评价由表8可知,方案1仅使用光谱特征㊁植被指数和水体指数,分类结果总体精度为80.97%㊂在方案1的基础上分别加入红边特征㊁雷达特征㊁地形特征㊁纹理特征,总体精度分别提高了2.75%㊁2.26%㊁3.93%㊁2.81%㊂方案6融合所有特征后,总体精度提高了2.35%㊂方案7在方案6的基础上分别利用46㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀东㊀北㊀林㊀业㊀大㊀学㊀学㊀报㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀第52卷分离阈值法与特征权重算法(ReliefF)对所有特征进行优选,不仅取得了更高的精度,而且有效降低了数据量,减少了运算时间㊂特征优选后的总体精度比方案6分别提高了1.89%和2.01%,其中ReliefF算法优选的结果精度最高,总体精度为85.33%,Kappa系数为0.81㊂表6㊀特征重要性排名排名特征名称重要性㊀19月22日红边叶绿素指数0.04222高程(DEM)0.041539月22日比值植被指数0.0399410月2日红边叶绿素指数0.0398510月2日比值植被指数0.0396611月1日归一化植被指数0.0392711月1日红边近红外归一化植被指数0.0392812月6日红边叶绿素指数0.0392912月6日改良红边土壤调整植被指数0.0391109月22日改良红边土壤调整植被指数0.03891111月1日改良红边土壤调整植被指数0.03871212月6日比值植被指数0.03701311月1日红边叶绿素指数0.03601412月6日归一化植被指数0.03541512月6日红边近红外归一化植被指数0.03541574月14日VH极化0.008515810月2日红光波段0.008415910月2日均值0.008316012月6日差异性0.008016111月1日方差0.00751629月22日方差0.007016310月2日方差0.00611649月22日对比度0.006116510月2日绿光波段0.005416611月1日均值0.005416710月2日对比度0.005216811月1日对比度0.004916910月2日蓝光波段0.004817012月6日对比度0.002817112月6日方差0.0012表7㊀分组情况及分类精度组别分组阈值特征个数随机森林(RF)分类精度/%10.0351571.0020.0303380.5930.0255082.5140.0206583.4150.0158485.3360.01012684.967017184.87㊀㊀由图4可知,水体在所有方案中都具有较高的分类精度㊂方案2在加入红边特征后,不同树种分类精度均有所提高,证明红边特征的加入有助树种提取;方案3加入雷达特征后树种精度提高,因为雷达波段能够穿透冠层获取树种信息,提高光谱特征相似的树种的类间差异;方案4在加入地形特征后,与其它方案相比杉木和油茶的生产者精度提升最大,南方丘陵山地山体阴影严重,不同树种混合分布㊁相互渗透,很难进行区分,地形特征变量能够有效减少错分概率;方案5加入纹理特征后,树种的分类精度提升没有地形特征高,主要是因为丘陵山区地形破碎㊁植被树冠茂盛,影像上纹理特征不明显,同时油茶在种植初期会和耕地存在误分㊂表8㊀各方案分类精度方㊀案总体精度/%Kappa系数方案180.970.75方案283.720.79方案383.230.78方案484.900.80方案583.780.79方案683.320.78方案7(SEaTH)85.210.81方案7(ReliefF)85.330.81㊀㊀由表9可知,随机森林算法比支持向量机算法和分类回归树算法总体分类精度分别提高了3.99%和4.55%,Kappa系数分别提高了0.05和0.06㊂结合各地物生产者精度,随机森林算法分类的松树生产者精度比分类回归树算法高了13.75%,油茶生产者精度比支持向量机算法提高了10.34%㊂表9㊀不同分类方法的分类精度分类方法总体分类精度/%Kappa系数随机森林算法85.330.81支持向量机算法81.340.76分类回归树算法80.780.75㊀㊀由图5可知,杉木和油茶作为袁州区主要树种,大面积混合分布,3种算法结果的树种分布区域大致一样,但某些区域的油茶和松树的提取结果存在明显差异;但对比不同分类方法的局部分类结果(见图6),随机森林算法与支持向量机算法和分类回归树算法相比,随机森林算法降低了分类结果的破碎度㊂4 讨论准确高效地获取树种的数量和分布信息对于林业的管理和监测至关重要㊂遥感影像为树种调查提供了有力的工具,Sentinel数据在树种分类上具有广泛的实用性[12,25],Sentinel-2影像的红边㊁近红外(NIR)和短波红外(SWIR)波段对于植被分类制图具有重要的作用[6,8,26]㊂本研究结合Sentinel影像和数字高程模型(DEM)数据,对南方丘陵山区的树种识别,结果发现重要性排名前15个特征中,红边特征所占比例最大,红边叶绿素指数在树种分类中56第3期㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀王洁,等:应用多时序特征的哨兵系列影像对南方丘陵区树种识别重要性最高㊂由于光谱特征相似,不同树种间存在不同程度的混淆,仅利用Sentinel-2光谱特征㊁植被指数㊁水体指数,树种的识别精度相对较低,将光谱特征与灰度共生矩阵(GLCM)纹理特征结合有效提高了树种分类精度[27]㊂本研究中纹理特征没有包含在最优特征集中,特征重要性排名中纹理特征处于靠后位置,由于研究区域过大导致细节纹理缺失,同时,树种纹理特征也受研究区地理位置和树种类别影响㊂不同树种受地形因子影响呈现不同的光谱特征,地形特征可有效降低山体效应带来的光谱差异,减少错分概率,地形特征比物候特征和纹理特征对树种分类更准确有效[15],地形特征在不同特征融合的南方丘陵山区树种分类中起着重要作用㊂图4㊀各地物生产者精度和用户精度㊀㊀加入雷达特征后,树种分类精度同样有所提升,证实Sentinel-1雷达特征能提高树种间的区分度㊂本研究只利用了Sentinel-1的雷达后向散射系数,杉木㊁松树㊁油茶都属于常绿树种,物候变化不显著,难以利用遥感提取植被物候[28]㊂由于雷达数据的特性,Sentinel-1数据同样含有丰富的纹理信息,可进一步提高纹理特征对南方丘陵山区树种的分类制图的精度㊂本研究最高准确率为85.33%,Kappa系数为0.81,仍有提升空间,可利用更有效的辅助数据或先进的深度学习技术,对大面积树种识别监测进行深入研究㊂5 结论以袁州区为研究区,结合Sentinel和数字高程模型(DEM)数据提取树种光谱特征㊁植被指数㊁水体指数㊁红边特征㊁雷达特征㊁地形特征和纹理特征,分别采用特征权重算法(Relief)和分离阈值法进行特征优选,通过不同特征组合对比,分析各特征对树种分类精度的影响,利用3种常用树种分类机器学习算法对最优特征集进行树种分类㊂树种在不同特征上具有一定差异性,可通过特征优选选取树种分类的有效特征,通过特征优选,能够在保证分类精度66㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀东㊀北㊀林㊀业㊀大㊀学㊀学㊀报㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀第52卷的同时减少数据冗余,提高运算效率和精度㊂根据最优特征集分别使用3种机器学习算法(随机森林㊁支持向量机和回归决策树)对树种进行分类,随机森林算法分类精度最高,总体精度为85.33%㊂Sentinel影像和DEM数据的结合应用可提高树种分类的准确性,可为南方丘陵山区大范围树种调查监测提供技术方法㊂图5㊀不同分类方法树种分类结果图6㊀不同分类方法的局部分类结果76第3期㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀王洁,等:应用多时序特征的哨兵系列影像对南方丘陵区树种识别参㊀考㊀文㊀献[1]㊀何兴元,任春颖,陈琳,等.森林生态系统遥感监测技术研究进展[J].地理科学,2018,38(7):997-1011.[2]㊀栗旭升,李虎,陈冬花,等.联合GF-5与GF-6卫星数据的多分类器组合亚热带树种识别[J].林业科学,2020,56(10):93-104.[3]㊀QIANC,YAOCJ,MAHC,etal.Treespeciesclassificationu⁃singairborneLidardatabasedonindividualtreesegmentationandshapefitting[J].RemoteSensing,2023,15(2).doi:10.3390/rs15020406.[4]㊀杨丹,李崇贵,常铮,等.应用U-Net模型和多时相Landsat-8影像对森林植被的分类[J].东北林业大学学报,2021,49(9):55-59,66.[5]㊀郑奕,王瑶,刘艳.基于高光谱数据季相特征的山地草甸植被分类识别[J].光谱学与光谱分析,2022,42(6):1939-1947.[6]㊀PERSSONM,LINDBERGE,REESEH.Treespeciesclassifica⁃tionwithmulti-temporalSentinel-2data[J].RemoteSensing,2018,10(11).doi:10.3390/rs10111794.[7]㊀LEIZL,LIH,ZHAOJ,etal.Individualtreespeciesclassifica⁃tionbasedonahierarchicalconvolutionalneuralnetworkandmul⁃titemporalgoogleearthimages[J].RemoteSensing,2022,14(20).doi:10.3390/rs14205124.[8]㊀IMMITZERM,VUOLOF,ATZBERGERC.FirstexperiencewithSentinel-2dataforcropandtreespeciesclassificationsincentralEurope[J].Remotesensing,2016,8(3).doi:10.3390/rs8030166.[9]㊀杨丹,周亚男,杨先增,等.LSTM支持下时序Sentinel-1A数据的太白山区植被制图[J].地球信息科学学报,2020,22(12):2445-2455.[10]㊀LIMJ,KIMKM,JINR.Treespeciesclassificationusinghype⁃rionandSentinel-2datawithmachinelearninginSouthKoreaandChina[J].ISPRSInternationalJournalofGeo⁃Information,2019,8(3).doi:10.3390/ijgi8030150.[11]㊀李巧玉,陈娟,张小晶,等.川西亚高山彩叶林群落数量分类㊁排序与物种多样性[J].应用与环境生物学报,2021,27(3):519-528.[12]㊀黄翀,张晨晨,刘庆生,等.结合光学与雷达影像多特征的热带典型人工林树种精细识别[J].林业科学,2021,57(7):80-91.[13]㊀MAMF,LIUJH,LIUMX,etal.TreespeciesclassificationbasedonSentinel-2imageryandrandomforestclassifierintheeasternregionsoftheQilianmountains[J].Forests,2021,12(12).doi:10.3390/f12121736.[14]㊀宁晓刚,常文涛,王浩,等.联合GEE与多源遥感数据的黑龙江流域沼泽湿地信息提取[J].遥感学报,2022,26(2):386-396.[15]㊀WANGMC,LIMJ,WANGFY,etal.Exploringtheoptimalfeaturecombinationoftreespeciesclassificationbyfusingmulti⁃featureandmulti⁃temporalsentinel-2datainChangbaiMountain[J].Forests,2022,13(7).doi:10.3390/f13071058.[16]㊀HUBX,LIQ,HALLGB.Adecision⁃levelfusionapproachtotreespeciesclassificationfrommulti⁃sourceremotelysenseddata[J].ISPRSOpenJournalofPhotogrammetryandRemoteSens⁃ing,2021.doi:10.1016/j.ophoto.2021.100002.[17]㊀陈丽萍,孙玉军.基于不同决策树的面向对象林区遥感影像分类比较[J].应用生态学报,2018,29(12):3995-4003.[18]㊀李恒凯,王利娟,肖松松.基于多源数据的南方丘陵山地土地利用随机森林分类[J].农业工程学报,2021,37(7):244-251.[19]㊀NUSSBAUMS,NIEMEYERI,CANTYMJ.SEATH⁃anewtoolforautomatedfeatureextractioninthecontextofobject⁃basedim⁃ageanalysis[C]//InternationalSocietyforPhotogrammetryandRemoteSensing.1stInternationalConferenceonObject⁃basedImageAnalysis(OBIA),Salzburg,Austria,2006.[20]㊀KIRAK,RENDELLLA.Thefeatureselectionproblem:Tradi⁃tionalmethodsandanewalgorithm[C]//AmericanAssociationforArtificialIntelligence.AAAI 92:Proceedingsofthetenthna⁃tionalconferenceonArtificialintelligence.SanJose:AmericanAssociationforArtificialIntelligence,1992:129-134.[21]㊀KONONENKOI.Estimatingattributes:AnalysisandextensionsofRELIEF[C]//BERGADANOF,RAEDTLD.Proceedingsofthe1994EuropeanConferenceonMachineLearning.Heidelberg:Springer⁃Verlag,1994:171-182.[22]㊀BREIMANL.Randomforest[J].MachineLearning,2001,45(1):5-32.[23]㊀LINWY,WANGF,CHENGMM,etal.CODE:Coherencebaseddecisionboundariesforfeaturecorrespondence[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,2017,40(1):34-47.[24]㊀PANGZH,ZHANGG,TANSQ,etal.Improvingtheaccuracyofestimatingforestcarbondensityusingthetreespeciesclassifi⁃cationmethod[J].Forests,2022,13(12).doi:10.3390/f13122004.[25]㊀LECHNERM,DOSTÁLOVÁA,HOLLAUSM,etal.Combina⁃tionofSentinel-1andSentinel-2datafortreespeciesclassifica⁃tioninaCentralEuropeanBiosphereReserve[J].RemoteSens⁃ing,2022,14(11).doi:10.3390/rs14112687.[26]㊀WESSELM,BRANDMEIERM,TIEDED.Evaluationofdiffer⁃entmachinelearningalgorithmsforscalableclassificationoftreetypesandtreespeciesbasedonSentinel-2data[J].RemoteSensing,2018,10(9).doi:10.3390/rs10091419.[27]㊀MOHAMMADPOURP,VIEGASDX,VIEGASC.VegetationmappingwithrandomforestusingSentinel2andGLCMtexturefeature:AcasestudyforLousãRegion,Portugal[J].RemoteSensing,2022,14(18).doi:10.3390/rs14184585.[28]㊀崔林丽,史军,杜华强.植被物候的遥感提取及其影响因素研究进展[J].地球科学进展,2021,36(1):9-16.86㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀东㊀北㊀林㊀业㊀大㊀学㊀学㊀报㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀第52卷。
洛阳市13种绿化树种叶面积的回归测算
洛阳市13种绿化树种叶面积的回归测算
赵燕;刘晶;王辉
【期刊名称】《江苏农业科学》
【年(卷),期】2016(044)010
【摘要】以洛阳市13种绿化树种为研究对象,采用回归的方法,构建各树种叶面积与叶长、叶宽以及与叶长、叶宽乘积的线性回归和幂函数回归方程。
结果表明,各树种叶面积的回归方程均存在差异,幂函数是估算各树种叶面积的最佳回归方程,并给出了各个树种的叶面积回归方程,为各树种叶面积的快速测定提供了简便科学的方法,有较好的应用价值。
【总页数】4页(P254-257)
【作者】赵燕;刘晶;王辉
【作者单位】河南科技大学林学院,河南洛阳471003;河南科技大学林学院,河
南洛阳471003;河南科技大学化工与制药学院,河南洛阳471003
【正文语种】中文
【中图分类】S718.42
【相关文献】
1.主成分回归在阔叶树种叶面积测定中的应用
2.四个葡萄品种叶面积的回归测算
3.回归分析在葡萄叶面积测算中的应用
4.温带地区几种绿化树木叶面积的回归测算
研究5.城市绿化树种叶面积测算新方法
因版权原因,仅展示原文概要,查看原文内容请购买。
基于GF-2号影像的森林优势树种分类
基于GF-2号影像的森林优势树种分类
随着遥感技术的不断发展和更新,遥感影像在生态环境调查、森林资源管理、景观格
局分析等方面的应用越来越广泛。
其中,通过遥感技术实现森林优势树种分类,成为了许
多森林资源管理者和研究人员的研究重点。
森林优势树种分类是根据植被类型、结构和化学成分等特征,对森林中的优势树种进
行分类和鉴定。
通过遥感技术实现森林优势树种分类,可以极大地提高森林资源管理的效
率和准确性,并为森林植被的研究和保护提供重要参考。
利用GF-2号卫星影像数据实现森林优势树种分类主要分为以下几步:
1. 遥感数据预处理
对GF-2号卫星影像数据进行预处理,主要包括辐射校正、大气校正、几何校正和噪声去除等操作。
遥感数据预处理的目的是提高数据质量和准确性,为后续的分类分析提供更
好的数据基础。
2. 特征提取
在预处理完成后,需要对影像数据进行特征提取。
常用的特征包括影像的光谱、纹理、形态等特征。
在森林优势树种分类中,常用的特征包括树冠、树干、枝干和叶子等特征。
通过对这些特征的提取和分析,可以得到不同树种之间的差异和特征,为后续的树种分类
和鉴定提供依据。
3. 树种分类和鉴定
在特征提取完成后,需要对不同树种进行分类和鉴定。
常用的分类算法包括最大似然
分类、支持向量机、决策树等。
根据分类算法的不同,可以得到各个树种的分类结果和准
确率。
在树种鉴定中,可以通过手动制定分类规则或利用样本库的方法进行鉴定。
通过对
遥感数据的分析和树种鉴定,可以准确地判断森林中各个优势树种的类型和分布情况。
基于分类回归树与小波分析的甲型H1N1流行性感冒气象敏感性研究
准化(公式②)。背景功率谱采用红噪声标准谱(公 式③)检验,检验过程为一阶自回归方程。
嘭(s)√孚。喜1褂蛾[(n 7一n)孚]
B=(I一Ⅱ2)/(I 1一Ⅱk一2耐12)
② ③
删牡订等嵩辫‰
2.分类回归树分析(classification
式中,s为伸缩尺度,&为时间步长,X。为时间 ①
223
组成㈩。
笔者通过CART法分析甲型H1 N1流感疫情暴
发与气象条件的关系,并基于裁剪后的回归树筛选 出甲型HlNl流感敏感的气象因素,回归树分析由
R软件实现(http://www.r—projoCt.org/)。 3.小波分析(wavelet analysis):小波分析可以 有效揭示非平稳时间序列的时频结构特征,已被应
【关键词】流感;流感病毒A型,人;统计学;分类回归树;小波分析
sensitivity of climatic faetors influenza
Study
On
On
A(HlNl 1 based on classification and regression Xiang・yu.GAO“・d‘,鸭,CHEN Bi一"yun,
Influenza;
features;and the se,rsitive climatic
effect”Oil the incidence of innuerlza
A(Hl N1).
A virus,human; Statistics; Classification
【Key words】
tree;
Influenza
to
negatively relevant
线性回归在分析马尾松生长量中的应用
C l v t n u d r Sa oe t ue u ut a o n e t e F rs y B ra ,G a g iK y L b rtr o ut ai fFn i e oe tR suc s i i t r u n x e a oao n C lv t n o ie Tmb r F rs eo re ) y i o
v r n e n — e t a a r d o t h r s l h we h t t e e i n e t mey sg i c n i e r r lt n h p ewe n t e a i c s a d t t ss a w s c ri u .T e e u t s o d t a h r s a x r e s e l i nf a t l a e ai s i b t e h i n o
对 马尾 松 胸 径 和 树 高进 行预 测 和控 制 。
关键词 : 性回 归; 线 马尾 松 : 长 量 生
中 图分 类 号 :7 1 4 S9. 8 2
文献 标 识 码 : A
文 章 编 号 :0 5 0 5 (0 2 0 — 0 7 0 2 9 — 12 2 1 )3 0 1— 3
Ap l a in o n a g e so n t e I c e e t An l ss o n s ma s n a a p i t f Li e r Re r s i n i h n r m n a y i f Pi u s o l n c o
MA C e g ba h n — i ,WE h a,C N n — h n o N J a U N u j I G Z i h a,Z U M - u HA G Mig S a e
(. 西 国有 田林县 乐里林 场 , 西 百 色市 ,33 02广 西林业勘 测设 计 院 ;. 西林 业科 学研 究 1 广 广 5 30 ;. 3广
互联网保险产品开发研究——基于平安互联网保险产品的聚类分析
[ 关键 词 ] 互联 网保 险 ;聚 类分析 ;保 险 产品 开发 [ 中图分 类号 ]F 8 4 2 [ 文 献标 识码 ]A
[ 基金项 目 ] 本文 由陕西省软科学重点项 目 “ 科技金融创新机 制研究 ( 2  ̄K R Z 0 1 0) ”资助。 [ 作者 简介 ] 温小 霓 ,博士 ,西安 电子科技大学经 济与管理学 院教授 ,博士生 导师 ,研究方 向为 互联 网金融 ,金融 管理 ,统计决策分 析 ;张哲 ,西安 电子科技大学经 济与管理学 院硕 士研究生 ,研究方 向为互 联网金融 、金融管理 、统计分析。
联 网保险的发展具有重要意义 。 A d a m K l a u b e r ( 2 0 0 3 ) 认为保险业 的网络渗透速度会加快 ,财产险 、意外 险 、变额人寿险等险种 比较复杂 ,会相对落后 ,而车险 、定期人 寿险则因其 销 售方式及商 品属性会适应得比较快 。同时因为科技的发展及消费模式 的改变 , 在未来 ,其 网络渗透率会增加 。通过长时间的分析 ,互联 网是未来保险的主要 方式。G e r g a n a R a k o v s k a( 2 0 0 1 ) 认为购买的互联 网保险会集 中在家财 险 、旅
经 营 管 理
互联 网保 险产 品开发研 究
基于平安互联 网保 险产 品的聚类分析
温小霓 张 哲
西安 7 1 0 1 2 6)
( 西安 电子科技大学经济与管理学 院 ,陕西
[ 摘要 ] 互联 网保 险作 为 “ 互联 网+ 保 险” 的一 种新 业 态 ,将 会 成 为我 国 保 险 业的 增 长极 。本 文基 于 中国平安 保 险公 司 目前 在 线销 售 的 1 0 9 种 互联 网保 险
点云树木分类
点云树木分类全文共四篇示例,供读者参考第一篇示例:点云技术是一种将三维空间内的点坐标信息以及其特征属性打包存储的数据格式,它广泛应用于地理信息系统、机器人导航、计算机视觉等领域。
点云树木分类就是利用点云技术对树木进行识别分类,为森林资源管理、环境监测、城市规划等提供数据支持。
在过去,树木分类主要依赖于人工对树木特征的识别,这种方法效率低下且易受主观因素影响。
而采用点云技术进行树木分类,不仅可以提高分类的准确性和效率,还可以实现大规模自动化处理,为相关领域的研究和应用提供更好的支持。
点云树木分类的过程主要包括数据采集、数据预处理、特征提取和分类器构建等步骤。
通过激光雷达、无人机等设备采集树木的三维点云数据,然后对原始数据进行去噪、滤波、配准等预处理操作,以提高数据的质量和稳定性。
接着,通过特征提取算法对点云数据进行特征提取,提取的特征包括形状、颜色、纹理等信息,以区分不同类型的树木。
利用机器学习、深度学习等方法构建分类器,对提取的特征进行训练和分类,实现树木的自动识别和分类。
在点云树木分类的研究中,主要涉及到多个关键技术,如特征提取、分类器构建、数据关联等。
特征提取是点云树木分类的关键环节,通过提取点云数据中的特征信息,可以有效地描述树木的形状、结构和特征,为后续的分类器构建提供支持。
目前,常用的特征提取方法包括使用深度学习网络对点云数据进行特征学习,利用局部特征描述树木的形态特征等。
在分类器构建方面,常用的方法包括支持向量机、随机森林、卷积神经网络等。
这些方法可以对提取的树木特征进行训练和分类,实现对树木的自动识别和分类。
数据关联技术也是点云树木分类的重要技术之一,它可以实现对不同数据源的信息进行关联和匹配,提高分类的准确性和鲁棒性。
进一步地,点云树木分类技术在森林资源管理、林业调查、环境监测、城市规划等领域具有广泛的应用前景。
通过对城市中点云数据进行树木分类,可以实现城市绿化覆盖率的评估和规划;通过对森林中点云数据进行树木分类,可以实现对不同类型树种的种类和数量统计,为森林资源保护和管理提供数据支持。
应用回归及分类:基于R
书中还设置了多个实践章节,让读者通过实际操作来巩固所学知识。这些实 践章节不仅包含了数据预处理、模型构建和评估等关键环节,还提供了大量的R 代码示例,方便读者直接上手操作。
书的结尾部分对全书内容进行了总结,并提供了一些建议和资源,帮助读者 进一步拓展学习。这一部分对于初学者来说非常有价值,可以帮助他们更好地理 解和应用所学知识。
在书中,吴喜之先生不仅介绍了各种回归和分类模型的理论基础,还通过丰 富的案例,展示了这些模型在实际问题中的应用。这种理论与实践相结合的方法, 使我能够更好地理解和掌握这些方法。
我非常欣赏吴喜之先生对R语言的运用。他通过简洁明了的代码,展示了R语 言在数据分析中的强大功能。这让我深刻认识到,掌握R语言对于数据分析师来 说,是一项非常重要的技能。
阅读感受
在现代数据分析的海洋中,寻找一本能够引导我们航行至知识彼岸的指南是 一项艰巨的任务。然而,当我拿起《应用回归及分类:基于R》这本书时,我深 感我找到了这样一个宝贵的指南。这本书以其清晰的结构、深入浅出的解释和丰 富的实例,成功地引导我走进了回归和分类的世界。
吴喜之先生的这部作品给我留下了深刻的印象。他巧妙地将理论知识与实际 应用相结合,使得复杂的数据分析方法变得易于理解。他利用R语言这一强大的 工具,展示了如何进行回归分析、分类以及模型评估等关键步骤。
在阅读这本书的过程中,我不仅学到了许多新知识,还获得了许多启发。我 开始意识到,数据分析并不仅仅是一堆数字和公式,更是一种解决问题的方法。 通过回归和分类等数据分析方法,我们可以从海量的数据中提取出有价值的信息, 为决策提供支持。
《应用回归及分类:基于R》是一本非常优秀的书籍。它不仅为我提供了丰 富的理论知识,还通过实例展示了这些方法在实际问题中的应用。我相信,这本 书将成为我未来数据分析之路上的重要参考。我期待着能够更深入地学习和应用 这些知识,为我的工作和研究带来更多的启示和帮助。
保险类文献综述
国内外医疗保险欺诈研究现状分析来源:网络转摘作者:林源点击:1730次时间:2011-8-16 12:28:12一、引言美国司法部于2010年7月16日宣布破获美国历史上最大的联邦医疗保险诈骗案, 对94名嫌犯提出起诉, 其中包括医生、护士、诊所业主和管理人员等, 涉及金额高达亿美元。
这是美国医疗改革方案通过后联邦当局第一次彻查全国范围内的医疗欺诈行为。
美国联邦政府多次表示, 打击医疗保险诈骗案, 是医疗保险改革议程的重要组成部分[1]。
美国全国卫生保健反欺诈协会(NHCAA)估计每年欺诈造成的医疗费用损失至少3%或不少于600亿美元, 而美国政府和其他执法机构估计该损失高达10% 或1700亿美元(NH CAA,2005)[2]。
在我国, 目前还没有完整的社会医疗保险欺诈统计数据, 不过自城镇职工医疗保险和新型农村合作医疗制度实施以来, 诈骗医保基金的案件不断发生。
据统计, 天津市医保结算中心仅2004年度累计拒付医疗机构不合理住院医疗费万元, 平均拒付率为%, 涉及欺诈金额共计万元[3]。
而新农合诈骗的现象更为严重, 出现了一些非常重大的诈骗案件, 如重庆秀山县一团伙一年半内欺诈450万元, 陕西省洋县妇幼保健院通过资料造假骗取38万元, 云南宣威市新农合管理办职工内外勾结骗取60余万元等。
事实上, 医疗保健欺诈和滥用在许多国家每年都有数亿计美元的损失((USGAO,1992)[4]; a,l 1997)[5]), 对医保基金安全构成了重大的威胁, 妨碍了各国医疗保险政策的实施。
因此, 医疗保险欺诈已经成为各国非常重视的社会问题, 学者们也对医疗保险欺诈问题进行了深入研究。
本文尝试对国内外医疗保险欺诈研究的现状进行分析, 希望引起我国各界对医保欺诈问题研究的重视。
二、国外医疗保险欺诈的研究现状社会心理学界在20世纪40、50年代开始关注欺诈问题。
目前, 从社会心理学的角度研究欺诈的理论主要有人际间欺诈理论、欺诈识别理论、欺诈三角形理论、白领犯罪理论及欺诈防范理论等。
数量化理论应用于现代林业的研究
数量化理论应用于现代林业的研究
谢力信
【期刊名称】《生物数学学报》
【年(卷),期】1996(0)3
【摘要】本文对山地人工用材林关键技术组合优化模型及其应用进行了研究.【总页数】5页(P60-64)
【关键词】数量化回归;模型;研究;应用
【作者】谢力信
【作者单位】江西省抚州地区林业局
【正文语种】中文
【中图分类】S711
【相关文献】
1.灰色理论应用于现代安全管理中的研究 [J], 罗贻乡
2.现代物流管理方法应用于运输组织的实践与理论研究综述 [J], 谢雨蓉
3.现代林业与生态经济林业理论的研究 [J], 赵群
4.现代林业与生态经济林业理论的研究 [J], 辛峥嵘
5.代谢组学应用于中医基础理论现代化研究的思考 [J], 刘颖;周红光;吴勉华
因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
理论新探
分类与回归树及其应用研究
温小霓, 蔡汝骏
( 西安电子科技大学 经济管理学院, 西安 710071)
摘 要: 本文运用分类与回归树挖掘技术, 对西安市社会医疗保险基金中心 2005 年 1 月到 2006 年
8 月 870 个冠心病住院病例样本数据作分类回归树决策分析。分析结果表明是否手术、住院天数、医院
( 概率) , 0≤p(j|t)≤1,j=1,…,J, J 为类的个数, 在二叉树里 J=2,
J
" 故对于每个节点, p(j|t)=1; 同时对 病 例 中 所 有 特 征 如 医 院 i=1
级别、是否手术等进行了量化( 具体见第三部分) , 以 X≤S 或
X>S 为分支规则, 所以在树的每个节点, 通过搜索特征 p(j|t),
快速增长。3 级医院病例占总病例的比例为 63.67%, 且在“是
50%, 说明它们是决定统筹支 付 费 用 的 最 主 要 因 素 。 医 院 级
否 手 术 ”中 3 级 医 院 更 是 高 达 72.9%; 而 1 级 医 院 没 有 任 何
别的划分是我国所特有的, 医院级别越高, 医疗资源的占有
2 数据挖掘过程
图 1 统筹支付自然对数 Q- Q 图 图 2 分类回归树中的 1、2 号终结点
2.1 数据预处理
职 业 、职 工 类 型 和 年 龄 等 等 。
最初我们以西安市社会医疗保险基金中心 2005 年 1 月
2.4 分类回归树构建及评价
到 2006 年 8 月 3 个 级 别 26 家 医 院 6683 份 病 例 作 为 样 本 ,
性非常差, 故 考 虑 按 病 种 进 行 分 类 回 归 。 我 们 选 其 中 的 900
验 证 选 择 交 叉 验 证 ( K=10) 法 , 替 代 ( Surrogates) 选 择 为 自 动 。
份冠心病住院病例, 其包括统筹支付费用、是否手术、住院天
经 过 多 次 试 验 , 我 们 发 现 “是 否 住 院 ”、“住 院 天 数 ”、“医 院 级
独立变量 是否住院
重要性
0.31
正态化重要性(%) 100
住院天数 0.17 54.80
医院级别 0.159 51.20
年龄 0.011 3.70
婚姻 0.005 1.70
据并不具有这样形态, 分支效果不明
表2
显, 所以先在软件 SPSS13.0 版本使用 终结点 例数 构成比(%)
类回归树各终结点说明及统筹支付费用标准参考
本文采用 CART( Classification and Regression Tree) [1]挖 掘技术对数据进行了深入分析和挖掘, 得到许多有用的结 论。当前 CART 大都集中于研究疾病的状况, 有根据肿瘤细 胞扩散运用 CART 分析结肠直肠癌症患者的生存情况 [2], 有 运用 CART 对小儿常见病种住院总费用进行回归决策分析[3], 但 是 运 用 CART 算 法 研 究 住 院 病 人 社 会 医 疗 统 筹 支 付 的 却 很少 。 本 文 结 合 西 安 市 社 会 医 疗 保 险 病 例 数 据, 运 用 CART 算法探索社会基本医疗费用统筹支付的规律, 从中挖掘医疗 统筹支付费用的合理范围, 为社会医疗保险基金统筹支付费 用 得 到 合 理 、有 效 地 利 用 提 供 科 学 依 据 。
根据筛选出的变量, 使用 SPSS13.0 软件中的 CRT 分类
创建分类回归树, 其结果并不合理, 并且分类冗余。其原因在
回归树算法,对我们的数据进行分析。我们设定最大树深度
于 把 不 同 病 种 病 例 放 在 一 起 导 致 分 类 混 乱 , 可 读 性 、可 操 作
为 7 层, 不纯度测量选择 Gini 指数, 剪枝树选择 1 个标准差,
数等 44 个指标作为 CART 的分支特征, 我们在数据处理中
别 ”在 分 类 回 归 树 中 起 关 键 性 作 用 , “年 龄 ”、“婚 姻 ”次 之 ( 见
剔 除 30 例 病 例 , 其 主 要 包 括 有 : ①住 院 天 数 少 于 1 天 ; ②住
表 1) 。故我们选这 5 个变量作为分支特征, 得到最优 CART
院 统 筹 支 付 费 用 少 于 100 元 ; ③病 例 中 重 要 项 目 不 全 的 数
树( 见表 2) 。分类回归树重替代估计量与交叉验证估计量分
据。
别 为 0.457 与 0.494, 两 者 基 本 吻 合 , 而 且 它 们 的 标 准 误 差 分
2.2 按不同影响因素分析统筹支付
别为 0.033 与 0.034, 都非常小, 说明分类树的效果非常好。
1 分类回归树方法
我 们 用 CART 二 叉 树 分 支 特 征 和 阈 值 S 把 节 点 处 的 病 例分成 2 组, 从而产生 2 个子节点。以此递归, 产生一棵最大 树, 然后在获得最终选择树前使用贝叶斯先验分类概率和交 叉 验 证 ( cross- validation) 来 估 计 候 选 树 的 错 分 类 率 , 从 而 对 树进行剪枝。因为 CART 使用了 X≤S 或 X>S 形状的二叉树 分支, 而且被 CART 考虑到的分支在单调转换下是不变的, 所以在下面分类回归树分支及剪枝过程中, 我们将统筹支付 费用转换为自然对数。 1.1 分支规则
样本病 例 统 计 分 析 表 明 , 冠 心 病 实 施 手 术 的 病 例 有 112
分 类 回 归 树 代 表 病 例 的 一 个 最 优 划 分 。下 面 我 们 说 明 分
例, 其统筹支付费用占全部病例统筹支付费用的总额比例为
类回归树的终结点 , 图 2 列示了表 2 中的 1、2 号终结点。分
56.11%, 其均值 为 19941.07 元 , 比 没 有 实 施 手 术 的 病 例 多 了
类回归树把病例数据分成 12 个不同的类, 它们的均值介于
17493.37 元 ; 13 天 是 冠 心 病 的 平 均 住 院 天 数 , 60.3%的 病 人
6.53 与 9.76 之 间 , 且 只 有 2 号 终 结 点 的 标 准 差 超 过 1, 并 且
5816.05 元; 有 8.7%的病 人 住 了 20 天 以 上 , 其 平 均 统 筹 支 付
术 ”在 分 支 中 起 了 决 定 性 作 用 , 正 态 化 重 要 性 达 到 了 100%,
为 9915.18 元。由此得出统筹支付费用随着住院天数的增加
其 次 是 “住 院 天 数 ”、“医 院 级 别 ”, 正 态 化 重 要 性 都 超 过 了
级 别 是 统 筹 支 付 费 用 的 决 定 性 因 素 ,并 分 别 给 出 了 该 病 种 不 同 类 别 的 统 筹 支 付 费 用 的 上 限 。为 医 疗 统 筹
支付费用政策的制定提供了科学依据。
关键词: CART; 统筹支付费用; 社会医疗保险
中图分类号: O212来自文献标识码: A文章编号: 1002- 6487( 2007) 23- 0014- 02
Q(i|j)表示类 j 的病例被错分入类 i 的比例。在 CART 中
估计错判成本的方法是交叉验证法。CART 将病例样本分成
K( 通常为 10) 个大小相同的子样本, 每次从 K- 1 个子样本的
不 同 组 中 产 生 CART 树 , 运 用 剩 下 的 子 样 本 进 行 检 验 , 这 样
理论新探
病例, 说明需要手术的病人希望在好医院就诊。综上所述, 可
越高, 意味医疗技术水平越高, 越能获得信赖, 统筹支付费用
以 了 解 手 术 、住 院 天 数 、医 院 级 别 等 因 素 对 统 筹 支 付 费 用 的
也相应地高, 2 号终结点很好地说明了这一点。
影响比较大。
表1
分支特征重要性
2.3 筛选重要的变量 由于 CART 对数据要求服从正态分布, 而预处理后的数
1.2 剪枝方法
本文假设树 T 是由 Tt 个终节点组成, 那么定义的树不纯
度为:
I(T)=%i(s,t)
( 2)
t ∈ Tt
通过选定最佳分支特征 X 和最佳分支规 则 S, 我 们 选 定
一棵最小化的树。, 树的期望非均匀误判成本定义为:
JJ
R(T)="%C(j|j)Q(i|j)p(j)
( 3)
i = 1 i=1,i≠j
0 引言
自上世纪末期至今 ,中国医疗 总 费 用 占 GDP 的 比 重 持 续上升, 医疗总费用的增长速度已经高于国民经济增长速 度 。医 疗 保 险 统 筹 支 付 的 费 用 是 关 系 到 社 会 保 险 基 金 能 否 保 持 收 支 平 衡 可 持 续 发 展 的 关 键 。建 立 合 理 的 医 疗 偿 付 制 度 需 要根据从实际发生的数据中探索费用分布规律, 寻找合理的 支付标准。
基金项目: 国家自然科学基金资助项目( 70371031)
14 统计与决策 2007 年第 23 期( 总第 251 期)
我 们 假 定 病 例 被 分 入 类 j 的 先 验 概 率 为 pj, 0≤pj≤1, j=
J
" 1,2,…,J, pj=1; 令 p(j|t)为 在 节 点 t 中 第 j 类 的 病 例 的 比 例 i=1
的树产生 K 次, 因此, 所获得的 K 错分类率被平均后得到交 叉验证错分类率; 然后, 与( 3) 式连接后得到总的交叉验证误 判 成 本 RCV(T)。RCV(T)是 由 交 叉 验 证 中 的 子 样 本 随 机 选 取 产 生, 所以在剪枝最大树时, 我们估计它分布的标准差( SE) 。据 证, 一旦发现一棵子树的最小估计误判成本在 1 个标准差内 ( 1 标准差规则) [4], 就 应 该 停 止 搜 索 最 佳 剪 枝 树 , 此 时 的 树 即 为最优树。