基于随机森林算法的冬小麦叶片氮含量遥感估算研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于随机森林算法的冬小麦叶片氮含量遥感估算研究
作者:韩玉杰丁宁冯海宽张春兰
来源:《现代农业科技》2019年第13期
摘要 ; ;精确、快速估算冬小麦叶片氮含量,对冬小麦长势监测及田间管理指导具有重要的研究意义。
为精确反演冬小麦叶片氮含量(leaf nitrogen content ,LNC),本文利用遥感方法,依托不同氮处理水平对冬小麦的影响试验,基于获取的高光谱遥感数据和LNC地面实测数据,对比分析光谱指数与随机森林算法(random forest ,RF)反演冬小麦叶片氮含量的精度和稳健性。
结果表明,以敏感波段496 nm和604 nm为自变量,利用随机森林算法构建的LNC回归模型精度较光谱指数法有了大幅提高,模型的建模精度为R2=0.922,均方根误差为0.290;验证精度为R2=0.873,均方根误差为0.397,并且相对分析误差值为2.220,表明将敏感波段与随机森林算法组合构建的反演模型能较好地反演冬小麦叶片氮含量。
关键词 ; ;冬小麦;叶片氮含量;遥感;随机森林算法
中图分类号 ; ;S127;S512.1 ; ; ; ;文献标识码 ; ;A
文章编号 ; 1007-5739(2019)13-0001-
03 ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; 开放科学(资源服务)标识码(OSID)
Remote ;Sensing ;Estimation ;of ;Nitrogen ;Content ;in ;Winter ;Wheat ;Leaves ;Based ;on ;Rand om ;Forest ;Algorithm
HAN Yu-jie 1 ; ;DING Ning 1 ; ;FENG Hai-kuan 2 ; ;ZHANG Chun-lan 2
(1 College of Surveying and Geo-Informatics,Shandong Jianzhu University,Jinan Shandong 250101;
2 National Engineering Research Center for Information Technology in Agriculture)
Abstract ; ;Precisely and rapidly monitoring of nitrogen content in winter wheat leaves was of great significance for monitoring the growth of winter wheat and guiding field management.By remote sensing,the accuracy and robustness of estimating nitrogen content in winter wheat leaves by spectral index and random forest algorithm were compared and analyzed based on hyperspectral data and LNC field data.The results showed that the precision of the LNC regression model constructed by the RF was much higher than that of the spectral index with sensitive bands 496 nm and 604 nm as independent variables.The accuracy of the model was R2=0.922,RMSE=0.290,the validation accuracy was R2=0.873,RMSE=0.397,and the RPD value was 2.220.It showed that the model constructed by the RF has good precision of wheat LNC.
Key words ; ;winter wheat;leaf nitrogen content(LNC);remote sensing;random forest algorithm
作物的光合作用、生長发育等离不开矿物质元素的摄入,作为矿物质元素之一的氮元素是作物生长需求量与施用量较多的矿物质元素[1]。
当氮营养元素施用不足时,会严重影响作物的产量及品质;相反,当作物施氮过多时,又会对环境造成一定的污染。
因此,精确估算冬小麦叶片氮素含量,对冬小麦长势监测、提高氮肥利用效率以及深入开展精准农业研究具有重要的意义[2]。
冬小麦作为我国重要的粮食作物之一,其氮素营养诊断对于小麦长势监测及田间技术指导具有重要的研究意义[3]。
近年来,新兴起的高光谱遥感技术具有诸多优势,如信息量大、光谱分辨率高、波段连续性强等,已受到作物氮素营养诊断科研人员的青睐[4]。
目前,科研人员对作物氮素诊断开展了大量的研究。
如杨宝华等[5]通过筛选敏感波段构建冬小麦氮含量反演模型,能够较好地估算冠层氮含量;王仁红等[4]利用高光譜数据建立氮营养指数(NNI)的经验模型,定性诊断氮营养情况,说明利用光谱反射率估算作物冠层氮含量是具有可行性的;还有一些科研人员利用机器学习算法(如人工神经网络法、随机森林算法)估算作物的冠层氮含量[6-7]。
目前,前人在监测作物氮含量方面开展了大量的工作,并取得了丰硕的成果,但是不同的反演方法各有特点,如估算作物氮含量的线性回归模型比较容易构建,而且还具有可视化的优点,但也存在对大数据集处理需要降维、参数过多容易出现过饱和现象等问题;而随机森林算法作为一种新型学习方法,具有抗噪声能力强、不易出现过饱和等优点,在数据分析与挖掘方面具有重要的应用价值,同时也可以很好地解决线性回归模型的缺陷问题。
因此,本文运用统计分析方法,将敏感波段与随机森林算法组合估算冬小麦叶片氮含量(LNC),进而构建估算冬小麦叶片氮含量(LNC)的最优模型。
1 ; ;材料与方法
1.1 ; ;试验地概况
冬小麦试验在北京市小汤山国家精准农业示范基地(东经116.44°,北纬40.18°)开展。
试验区平均海拔约为36 m,年平均气温约14.0 ℃。
1.2 ; ;试验设计
试验共设置3个因素处理,即小麦品种为2个,分别是京9843、中麦175;氮素水平设置4个处理,分别为施纯N 0、91.065、182.130、273.195 kg/hm2;水分供给设置3个水平,即雨养、正常水、2倍正常水。
其他田间管理措施与当地正常管理情况一致。
1.3 ; ;数据采集
试验数据于冬小麦4个关键生育期(拔节期、挑旗期、开花期及灌浆期)分别同步获取冬小麦冠层高光谱反射率数据和LNC数据,其试验数据的70%样本用于构建冬小麦LNC反演模型,剩余30%用于模型的验证。
其中,冬小麦地面冠层高光谱数据利用美国ASD Field SpecFR Pro 2500光谱仪获取,其光谱范围为350~2 500 nm,采样间隔为1 nm。
冬小麦叶片氮含量采用凯氏定氮法测定。
1.4 ; ;数据分析方法
1.4.1 ; ;组合光谱指数法。
由于冠层反射率数据受外界监测环境的影响,有必要筛选敏感波段,然后组合得到一种光谱参数即为光谱指数[8]。
由代数形式组合得到的光谱指数能够消除
一些噪声的影响[9-10],从而可提高光谱指数对作物生化指标的监测精度。
本文组合得到的光谱指数为归一化光谱指数(Normalized difference spectral index,NDSI)、比值光谱指数(Ratio spectral index,RSI),其公式组合形式如下[11]:
NDSI(x,y)=(1)
RSI(x,y)=(2)
式(1)和式(2)中,x和y分别为一定波段范围内任意2个波段所对应的光谱反射率。
1.4.2 ; ;随机森林算法。
随机森林算法(random forest,RF)是由Breiman L[12]提出,该算法是基于集成学习的思想将多棵树集成的一种算法,其基本单元是决策树,本质属于机器学习的一大分支。
随机森林算法是一种灵活性强、实用性高的学习算法,能有效地运用在大数据集上,而且不需要降维,能够获得精确的结果。
因此,在数据分析与挖掘方面具有极其重要的应用价值。
1.5 ; ;模型评价指标
1.5.1 ; ;决定系数。
决定系数(R2)是用来衡量拟合效果的指标,R2在0~1之间,值越大表明模型拟合精度越高,其计算公式为:
1.5.2 ; ;均方根误差。
均方根误差(RMSE)是衡量模拟值偏离实测值程度大小的指标,其值越小,表示模拟值与实测值吻合性越好,反映构建的反演模型精度较高。
其计算公式为:
RMSE=(4)
式(4)中,变量解释同公式(3)。
1.5.3 ; ;相对分析误差。
相对分析误差(RDP)是衡量模型质量的指标,当RPD<1.4时,表明构建的反演模型效果差,无法对样本数据进行预测;当1.4≤RPD<
2.0时,表明构建的反演模型效果一般,可以对样本数据进行粗略评估;当RPD≥2.0时,表明构建的反演模型预测能力较好。
其计算公式为:
其中,标准差SD=,式中变量解释同公式(3)。
2 ; ;结果与分析
2.1 ; ;筛选敏感波段
由于作物的光谱反射率在350~400 nm及1 000 nm以后受水汽影响及环境噪声影响较大,本文选取数据质量较好的400~1 000 nm的光谱反射率数据进行以下分析。
筛选敏感波段的程序在Matlab内运行,通过在400~1 000 nm波段范围筛选敏感波段,组合得到的NDSI和RSI对LNC的敏感性如图1所示。
结果表明,496 nm与604 nm为敏感波段,其组合得到的光谱指数RSI(R604,R496)和NDSI(R604,R496))与叶片氮含量(LNC)的决定系数R2分别为-0.871、-0.865,表明由敏感波段组合的光谱指数与LNC高度负相关,这是由于归一化和比值的数学计算形式能够降低或消除一些噪声的影响[13]。
2.2 ; ;利用光谱指数法构建冬小麦LNC模型
由筛选的敏感波段(496、604 nm)组合得到的NDSI(R604,R496)、RSI(R604,
R496)为自变量,分别构建冬小麦LNC的反演模型。
由图2可知,以RSI(R604,R496)为自变量构建的冬小麦LNC反演模型的决定系数R2为0.759,高于以RSI(R604,R496)为自变量构建的冬小麦LNC反演模型的决定系数R2。
说明以比值形式组合的光谱指数RSI
(R604,R496)为自变量构建的冬小麦LNC反演模型的估算效果较好。
为了进一步检验利用光谱指数法构建的冬小麦LNC估算模型的精度与稳定性,采用相同生育期采集的独立样本集对其精度进行验证。
由图3可知,利用光谱指数RSI(R604,R496)構建的冬小麦LNC估算模型的验证精度R2为0.793,并且其估算模型的RPD值为1.86,表明以光谱指数RSI(R604,R496)为自变量构建的冬小麦LNC估算模型的预测精度高于以光谱指数NDSI(R604,R496)为自变量构建的冬小麦LNC估算模型的预测精度。
2.3 ; ;基于随机森林法构建冬小麦LNC模型
为了构建较优的冬小麦LNC估算模型,本文基于与光谱指数法相同的建模样本集,利用随机森林算法(RF)构建冬小麦LNC的RF回归模型,并采用与光谱指数法相同的验证样本集对模型精度进行验证。
为了便于这2种方法间的对比与分析,利用随机森林法构建冬小麦LNC估算模型的输入因子为2.1筛选的敏感波段496 nm和604 nm处的光谱反射率,因变量为冬小麦LNC,在MATLAB软件中运行随机森林算法(RF)回归试验代码。
利用随机森林算法(RF)构建的冬小麦LNC估算模型如图4(a)所示,其决定系数R2为0.922,均方根误差为0.290,利用随机森林算法构建的冬小麦LNC估算模型的预测精度较高。
采用独立的验证样本集对利用随机森林算法构建的冬小麦LNC估算模型的精度及稳定性进行验证。
由图4(b)可知,该模型的拟合精度较高,可以对冬小麦LNC进行精确算。
与2.2利用光谱指数法构建的冬小麦LNC估算模型相比,利用随机森林法构建的冬小麦LNC反演模型的估算精度(R2=0.922)和预测精度(R2=0.873)均较高。
利用光谱指数RSI (R604,R496)构建的LNC估算模型的RPD值为1.86,而利用RF构建的冬小麦LNC估算模型的RPD值为2.220,表明利用RF构建的冬小麦LNC估算模型反演效果较好,能用于冬小麦LNC的精确估算。
3 ; ;结论与讨论
目前,已有较多研究者利用遥感技术开展冬小麦叶片氮含量估算研究工作,但由于线性回归模型存在受外界生长环境影响较大的问题,寻找高效的冬小麦叶片氮含量反演方法仍需进一步探讨。
由于监测环境中影响因素较多,本文首先进行了敏感波段的筛选,通过筛选发现496 nm与604 nm波段为敏感波段,而且由敏感波段组合的光谱指数对LNC的敏感性较好,R2分别为-0.871、-0.865;然后分别利用线性回归和随机森林法构建冬小麦LNC估算模型,结果表明,随机森林法构建的LNC估算模型的建模精度(R2=0.922,RMSE=0.290)和验证精度
(R2=0.873,RMSE=0.397)均较高,这是因为线性回归模型存在对大数据集需要降维、拟合过程中参数过多容易出现过饱和等缺陷;新兴起的随机森林算法具有抗噪能力强、适应能力好、对大数据集处理精度高且不需要降维等多种优势[14-15],可以很好地解决线性回归模型的缺陷。
因此,通过筛选敏感波段,利用随机森林算法构建冬小麦LNC估算模型可以作为氮素田间快速诊断的有效方法。
4 ; ;参考文献
[1] 田永超,朱艳,姚霞,等.基于光谱信息的作物氮素营养无损监测技术[J].生态学杂志,2007(9):1454-1463.
[2] 李永梅,张学俭,张立根.水稻氮素高光谱遥感估测模型研究[J].江苏农业科学,2016,44(8):435-439.
[3] 尚艳,常庆瑞,刘秀英,等.关中地区小麦冠层光谱与氮素的定量关系[J].西北农林科技大学学报(自然科学版),2016,44(5):38-44.
[4] 王仁红,宋晓宇,李振海,等.基于高光谱的冬小麦氮素营养指数估测[J].农业工程学报,2014,30(19):191-198.
[5] 杨宝华,陈建林,陈林海,等.基于敏感波段的小麦冠层氮含量估测模型[J].农业工程学报,2015,31(22):176-182.
[6] ZHANG C H,KOVACS J M,WACHOWIAK M P,et al.Relationship between hyperspectral measurements and mangrove leaf nitrogen conce-ntrations[J].Remote Sensing,2013,5(2):891-908.
[7] YI Q X,HUANG J F,WANG F M,et al.Monitoring rice nitrogen status using hyperspectral reflectance and artificial neural network[J].Environ-mental Science & Technology,2007,41(19):6770-6775.
[8] 童庆禧,张兵,郑兰芬.高光谱遥感[M].北京:高等教育出版社,2006:121.
[9] HUNT E R,DORAISWAMY P C,MCMURTREY J E,et al.A visible band index for remote sensing leaf chlorophyll content at the canopy scale[J].International Journal of Applied Earth Observation and Geoinf-ormation,2013:103-112.
[10] 姜海玲,杨杭,陈小平,等.利用光谱指数反演植被叶绿素含量的精度及稳定性研究[J].光谱学与光谱分析,2015,35(4):975-981.
[11] INOUE Y,GU?魪RIF M,BARET F,et al.Simple and robust methods for remote sensing of canopy chlorophyll content:A comparative analysis of hyperspectral data for different types of vegetation[J].Plant,Cell and En-vironment,2016,39:2609-2623.
[12] BREIMAN L.Random forests[J].Machine Learning,2001,45(1):5-32.
[13] RICHARDSON A J,WEIGAND C L.Distinguishing vegetation from soil background information[J].Photogrammetric Engineering and Remote Sensing,1977,43(12):1541-1552.
[14] 张春兰.基于综合长势参数指标的冬小麦长势遥感监测[D].西安:西安科技大学,2018.
[15] 韩兆迎,朱西存,房贤一,等.基于SVM与RF的苹果树冠LAI高光谱估测[J].光谱学与光谱分析,2016,36(3):800-805.。