基于Hyperion高光谱数据和随机森林方法的岩性分类与分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于Hyperion高光谱数据和随机森林方法的岩性分类与分
析
柯元楚;史忠奎;李培军;张西雅
【摘要】探索利用高光谱数据的岩性填图新方法是遥感地质应用领域的重要需求之一.本文运用随机森林方法和EO-1Hyperion高光谱数据,对新疆塔里木西北部柯坪地区的局部区域进行岩性分类,并对相关问题进行分析.分别利用光谱特征以及加入光谱一阶导数特征进行岩性分类,并对不同特征对岩性分类的重要性进行分析,同时与现有的基于光谱角制图方法(SAM)进行比较.结果表明,与SAM方法相比,随机森林方法得到了更高精度的岩性分类结果,是一种有效可行的岩性分类方法.根据特征重要性的排序,蓝绿光波段、短波红外波段以及相应的一阶导数特征对研究区Hyperion数据的沉积岩岩性分类贡献更大.
【期刊名称】《岩石学报》
【年(卷),期】2018(034)007
【总页数】8页(P2181-2188)
【关键词】高光谱遥感数据;随机森林;光谱角制图;岩性分类
【作者】柯元楚;史忠奎;李培军;张西雅
【作者单位】北京大学地球与空间科学学院遥感与地理信息系统研究所,北京100871;北京大学地球与空间科学学院遥感与地理信息系统研究所,北京100871;北京大学地球与空间科学学院遥感与地理信息系统研究所,北京100871;中国气象局北京城市气象研究所,北京100089
【正文语种】中文
【中图分类】P627
利用遥感数据进行岩性识别和分类是最广泛的遥感地质应用之一,国内外学者在利用不同遥感数据和方法进行岩性分类方面开展了很多研究(李培军,2004; Gad and Kusky, 2006; Amer et al., 2010)。
多光谱和高光谱图像被广泛应用于岩性识别与分类(Meer et al., 2012)。
高光谱传感器以几十甚至数百个细分且连续的光谱波段对目标区域成像,获取丰富的光谱信息,为进行详细的岩性分类提供了可能。
不同分类方法被用于高光谱图像岩性分类。
Harris et al.(2005)基于匹配滤波方法对航空高光谱图像进行岩性识别,并与地质图比较评价了该方法的有效性;Murphy et al.(2012)分别利用支持向量
机和光谱角制图(SAM)方法对高光谱图像进行了岩性分类,结果表明在不同光照、地形条件下两种方法各有优劣;Zhang and Li(2014)利用光谱角制图方法对Hyperion图像进行岩性分类,并评价了不同参考光谱选择方式得到的分类效果;张西雅等(2012)利用单类支持向量机方法对Hyperion图像进行岩性识别,并与传统的SAM方法对比,分析了该方法的性能。
尽管这些方法在基于高光谱数据的岩性识别和分类中得到了不错的结果,但由于高光谱数据波段多,传统的岩性分类方法往往不能有效地利用所有信息,因此,探索有效的适合于高光谱数据岩性分类的新方法,一直是遥感地质应用急需解决的问题。
图1 研究区地理位置及Hyperion假彩色合成图像(第119、40、20波段分别为红、绿、蓝)Fig.1 Location of study area and Hyperion false color image (bands 119, 40, 20 as R, G, B)
随机森林是近年来提出的一种融合二叉决策树的集成学习算法。
随机森林方法有良
好的抗噪、抗异常值性能,不容易出现过拟合现象(杨珺雯等,2015)。
由于生成决策树的过程是独立的,随机森林在处理大数据的时候便于进行并行运算,尤其是在对高维度数据进行分类的时候,随机森林速度快、精度高、稳定性好的特点得到更明显的体现,适合于高光谱图像分类(郭玉宝等,2016),其有效性在许多应用中得到了验证(Ham et al., 2005; Xia et al., 2017)。
在遥感地质领域,现有研究利用随机森林方法对多光谱数据、地球物理数据、地球化学数据等进行岩性分类(Cracknell and Reading, 2014; Harris and Grunsky, 2015; Masoumi et al., 2017),展示了随机森林方法的有效性,但目前尚未见到将随机森林应用于高光谱数据岩性分类与填图中;另一方面,现有的研究多侧重于方法的研究,对不同特征(波段)对岩性分类的作用的分析较少。
因此,本文将随机森林方法应用于高光谱数据的岩性分类中,评价其有效性,并对不同特征对岩性分类的作用进行分析。
1 数据与研究区
Hyperion是搭载于EO-1卫星上的高光谱成像光谱仪,也是第一个星载高光谱传感器。
EO-1卫星是美国NASA新千年计划的第一颗对地观测卫星,于2000年11月21日发射,是为了接替Landsat 7而研制的。
EO-1为太阳同步轨道卫星,与Landsat 7的轨道参数接近,高度为705km,倾角为98.7°。
Hyperion传感器获取的高光谱图像共有242个波段,光谱范围为350~2500nm,包括35个可见光波段、35个近红外波段以及172个短波红外波段,光谱分辨率为10nm,空间分辨率30m,其光谱和空间分辨率适合提取岩石矿物信息(Rani et al., 2016)。
图2 研究区简化地质图(a)和检验样本分布(b) (据Zhang and Li, 2014)Fig.2 Simplified lithological map of study area (a) and the spatial distribution of the test samples (b) (after Zhang and Li, 2014)
本研究使用2009年11月4日获取的EO-1 Hyperion图像。
首先从242个波段
中去除未校准和重叠波段,再去除被水汽吸收严重的波段, 剩余158个波段用于本研究中。
最终使用的图像大小为708×1658像元。
大气校正是高光谱数据处理与分析的一个重要步骤,主要目的是消除或者减少大气分子和气溶胶的散射和吸收对地物反射率的影响,降低噪声,提高图像质量。
本研究采用基于辐射传输方程理论的FLAASH (fast line-of-sight atmospheric analysis of spectral hyper-cubes)模块(Matthew et al., 2000)进行大气校正。
该方法采用先进的MODTRAN4模型,能够精确地补偿大气影响,被广泛用于多光谱和高光谱数据的大气校正。
Hyperion图像覆盖的研究区位于新疆塔里木盆地西北缘的柯坪县(图1),范围大致为北纬40°~40°20′,东经78°~78°10′。
区内主要出露的地层单元为古生界和新生界,发育的主要岩性单元包括寒武纪、奥陶纪、志留纪、泥盆纪沉积岩和第四纪沉积物。
研究区位于干旱地区,植被覆盖稀少,岩石露头好,适合于利用遥感数据进行岩性填图和分类。
本研究主要针对区内出露的7类岩性单元(表1)。
参考1:20万地质图(新疆地质调查局,1965),共选取了12767个训练样本和42554个检验样本(表1),分别用于对分类方法进行训练以及对岩性分类结果进行评价和比较。
研究区的简化地质图和检验样本分布情况见图2。
表1 研究区的岩性类别和样本
Table 1 Lithological classes in study area and samples used
岩性类别符号岩性类别描述训练样本数检验样本数-O寒武纪-奥陶纪白云岩566410003O2中奥陶世页岩和泥灰岩6063156S志留纪粉砂岩和页岩9714397Dt泥盆纪粉砂岩和页岩5152607D泥盆纪石英砂岩10331923N2上新世砾岩7294222Q第四纪沉积物324916246总计1276742554
2 方法
2.1 随机森林方法
随机森林是一种利用多棵决策树进行训练并预测的分类器。
随机森林的构建过程是:首先使用Bagging方法(Breiman, 1996)从原始样本集中生成多个不同的子样本集,然后对于选好的子样本集,利用CART(Classification and Regression Trees)算
法训练二叉决策树,构建元分类器(Meta-classifier)。
对各个元分类器的分类结果采用众数投票的方法得到随机森林的输出结果。
由于随机森林组合了多棵二叉决策树的结果,决策树数目和每棵决策树用到的特征个数都是影响随机森林输出的重要参数。
决策树的数目是指随机森林总共是由多少棵决策树组成。
通常,使用更多的决策树可使随机森林的分类效果更好,但需要同时考虑计算机硬件情况和计算效率来确定最合适的决策树数目。
特征个数是指每棵决策树使用的特征的最大数量,这个值可以是0至全部特征数之间的任意整数值。
研究表明,一般情况下,随机森林中每个决策树的特征个数取总特征数的算术平方根时最合适。
例如,若随机森林的总特征数为100,则每个决策树的特征数取10。
随机森林的一个重要特色是能够对特征的重要性进行度量,因此,可用于特征选择。
通常采用袋外数据精度进行特征重要性度量。
袋外(out of bag, OOB)数据是指每
棵决策树训练时没有被抽样到的训练样本,它们没有参与此决策树的建立,因此,可用来评估决策树的性能。
其基本原理是,重新排列特征在袋外数据上的取值(即
袋外数据样本间交换在该特征上的取值),利用重排前后的袋外数据精度差来衡量
特征重要性。
计算某特征的重要性具体步骤是:首先,对于每一棵决策树预测其袋外数据精度,然后将袋外数据所有样本该特征上的取值进行重新排列后再一次对袋外数据精度进行预测,最后将每棵决策树中该特征值重新排列前后的精度差求平均,即得该特征的重要性。
本研究中,为了更直观地评价特征重要性,将所有特征的重要性值的和设为1,计算出每个特征占所有特征的重要性的比例,用于特征选择。
2.2 基于随机森林的岩性分类
本研究运用随机森林方法对高光谱数据进行岩性分类。
用于岩性分类的图像特征,除了原始光谱特征(光谱数据)外,还包括光谱一阶导数特征,并对只利用光谱特征以及同时利用光谱特征和一阶导数特征的岩性分类结果进行对比。
光谱一阶导数反映了光谱曲线的斜率,可以消除光谱数据之间的系统误差,消除大气辐射、散射和吸收对目标光谱的影响,被广泛用于高光谱数据的处理与分析中(苏红军和杜培军,2006)。
研究表明,使用光谱一阶导数特征可以提高不同类别间光谱可区分性,通常与光谱信息结合进行高光谱图像分类,提高分类精度(Zhang and Li, 2014)。
由于一阶导数特征与原始光谱特征的数值范围差异显著,在进行分类前,先对一阶导数特征进行数据归一化,将一阶导数特征和光谱特征的数值调整到同一范围内,避免绝对值过大的特征值对分类结果产生太大影响。
考虑到本研究采用的光谱数据是反射率数据,数值范围为0~1之间,只对一阶导数特征的数值范围线性变换至与光谱特征一致的0到1的范围。
具体过程为:首先,计算一阶导数特征的最大
值Dmax和最小值Dmin,然后对每个一阶导数特征的原始值D,利用公式计算
出归一化后的一阶导数值D′。
利用随机森林分类器进行岩性分类时,需要选择合适的参数,因为采用不同的参数值会得到不同的分类精度。
本研究用控制变量法从小到大尝试不同的决策树个数和特征数目以及其它参数,确定能平衡精度与效率的参数组合(刘敏等,2015),得
到岩性分类结果。
为了进一步认识不同特征(光谱、一阶导数)对岩性分类的贡献或作用,本研究利用袋外数据精度对特征重要性进行度量,来反映每个特征对随机森林分类结果的贡献度。
根据对特征重要性的排序,分别选取只利用光谱特征和同时利用光谱特征与一阶导数特征时重要性较高的特征,并对特征选择的结果进行分析。
此外,为进一步认识基于随机森林方法的岩性分类与所用特征间的关系,利用由随机森林选择出的重要性较高的特征波段作为输入再进行随机森林岩性分类,并比较
只利用重要性高的部分特征的分类结果与利用全部特征的分类结果,进一步分析特征重要性这一指标对于特征选择的有效性以及随机森林是否能够有效利用高光谱数据的全部信息。
2.3 精度评价
为了定量地评价分类结果,采用混淆矩阵对基于随机森林的岩性分类结果进行精度评价。
利用混淆矩阵得到的精度参数包括:总体精度、Kappa系数以及各类的用
户精度和生产者精度。
为全面地评价基于随机森林的分类方法,本研究也利用光谱角制图方法进行岩性分类,并进行比较。
光谱角制图(spectral angle mapper, SAM)方法是一种广泛采
用的高光谱图像分类方法,它通过计算n维光谱矢量之间的角度来度量它们的相
似性,角度越小表示待分类像元与已知岩性类别的参考光谱越相似。
通过计算待分类像元与各类别参考光谱之间的光谱角来判断其类别(Zhang and Li, 2014)。
在利用光谱角制图方法时,分别利用光谱特征以及加入归一化的光谱一阶导数特征进行岩性分类。
在只利用光谱特征时,每类的参考光谱采用该类全部训练样本的平均光谱。
同时利用光谱特征和一阶导数特征时,每类的参考光谱选用该类全部训练样本的平均光谱和平均一阶导数。
本研究中,随机森林方法与光谱角制图方法利用同样的训练和检验样本进行岩性分类实验和精度评价,通过比较两种方法的精度来验证随机森林的有效性。
图3 不同方法的岩性分类结果(a)利用SAM和光谱特征的分类结果;(b)利用SAM 和光谱与一阶导数特征的分类结果;(c)利用随机森林方法和光谱特征的分类结果;
(d)利用随机森林方法和光谱与一阶导数特征的分类结果Fig.3 Lithological classification results using different methods(a) SAM with spectral features;
(b) SAM with spectral and first derivative features; (c) Random Forest with spectral features; (d) Random Forest with spectral and first derivative
features
3 结果与分析
决策树数目和每棵决策树用到的特征个数是决定随机森林分类精度的两个重要参数。
在只利用光谱特征进行分类时,首先固定其它参数,决策树数目从1变化到500,结果表明,岩性分类精度随着随机森林中决策树数目增加而增加,当决策树数目达到200之后分类精度基本趋于稳定,因此取决策树数目200作为最优参数;然后
固定其它参数,每棵决策树用到的特征个数从1变化到30,分类精度呈现先增后
减的趋势,在特征个数为12时达到最大值。
在同时利用光谱和光谱一阶导数时,也在上述范围内从小到大改变这两个参数,当决策树数目为200,每棵决策树用
到的特征个数取17时,岩性分类的精度最高。
从调整上述两个参数的过程中发现,除了参数值过小时,分类结果精度并不随参数变化发生显著的变化。
图3为随机森林和SAM方法的分类结果图。
比较分类结果图和地质图(图2a),可以清楚地看出,与SAM方法相比,随机森林分类结果与地质图更相似,主要体现在同类像元的聚集程度更高、类别的空间分布与实际情况更一致。
例如,图3红
圈标出的区域主要分布着类别-O,在SAM的分类结果(图3a, b)中,该类被显著
地漏分,且该类的形状不完整。
而在随机森林方法的分类结果中(图3c, d),类别-
O的形状更完整、与地质图更接近。
图3蓝圈标出的区域主要分布着类别S和D,在SAM的分类结果中这两类都被显著地漏分,而在随机森林方法的分类结果中这两类明显与地面实际情况更接近。
总体来说,随机森林方法的分类结果中各类别的空间分布与总体趋势都要优于SAM方法。
表2为随机森林和SAM方法的岩性分类精度。
从表中可以看出,只用光谱特征时,SAM岩性分类的总体精度为63.1%,而随机森林分类的总体精度比SAM方法高9.79%。
表2 不同方法的岩性分类精度(%)
Table 2 Accuracy evaluation of lithological classification results in study area(%)
光谱SAM-光谱SAM-光谱与导数RF-光谱RF-光谱与导数岩性类别PAUAPAUAPAUAPAUA-
O65.1068.4071.0373.1877.7783.1178.4281.75O253.5859.5062.5871.3356.37 76.2951.6580.97S61.4373.1069.1875.6575.2676.9475.4277.19Dt56.6267.996 5.2976.3241.0474.8340.3978.64D63.5568.6969.3770.2569.3787.3672.5984.7 6N258.1264.1665.8272.5852.8256.7345.7463.36Q66.4557.6775.7467.9983.2 068.7085.6167.47总体精度63.1071.0772.8973.03Kappa系数
50.0161.6963.5863.43
注:PA-生产者精度;UA-用户精度;RF-随机森林方法
图4 只用光谱特征时特征重要性(a)、加入光谱一阶导数时光谱特征重要性(b)和加入光谱一阶导数时光谱一阶导数特征重要性(c)Fig.4 Feature importances with spectral features (a), spectral feature importances with spectral and first derivatives features (b) and first derivatives feature importances with spectral and first derivatives features (c)
图5 7个岩性类别的训练样本平均光谱曲线(a)和平均归一化光谱一阶导数曲线(b)Fig.5 Average spectral curves (a) and average normalized spectral first derivatives curves (b) for training samples of seven classes
利用光谱特征和光谱一阶导数特征时,SAM岩性分类的总体精度为71.07%,随机森林总体精度比SAM方法高1.96%。
因此,从总体精度来看,无论只用光谱特征还是加入光谱一阶导数特征,随机森林岩性分类结果均优于传统的SAM方法,说明随机森林是一种更有效的高光谱图像岩性分类方法。
从表2中还可以看出,利用SAM进行岩性分类时,加入光谱一阶导数特征比只用光谱特征的总体精度高
7.97%,而利用随机森林进行岩性分类时,加入光谱一阶导数特征与只用光谱特征的总体精度几乎相同,没有明显的提高。
因此,综合利用光谱和一阶导数特征可显著提高SAM方法的岩性分类精度,但对于随机森林方法来说加入一阶导数并不能显著改善岩性分类的精度。
进一步分析表2中各个类别的精度(用户精度和生产者精度)发现,大部分类别的随机森林分类精度都优于SAM。
具体来说,除了N2类外,随机森林方法的各类用户精度都高于SAM。
其中只用光谱特征时,D和O2两类的随机森林分类的用户精度均比SAM高16%以上。
生产者精度方面,-O 、S、D和Q这四类的随机森林分类的生产者精度高于SAM,其中只用光谱特征时,随机森林方法对-O 、S和Q这三类的生产者精度均比SAM高12%以上。
而O2、Dt、N2三类的随机森林分类的生产者精度低于SAM,可能是由于研究区这三类的分布相对少,导致它们的训练样本选取偏少,随机森林相对于SAM,需要更多的训练样本。
图4显示了利用随机森林的袋外数据精度得到的只利用光谱特征和加入光谱一阶导数特征分类时各个特征的重要性。
从图中可以看出,只利用光谱特征进行岩性分类时,蓝波段(450nm左右)和短波红外波段(1700nm、2300nm左右)光谱特征的重要性较高(图4a);而利用光谱特征和一阶导数特征进行分类时,蓝波段(450nm)和短波红外波段(1700nm和2300nm左右)的光谱特征,绿波段(580nm左右)和短波红外波段(1700nm、2300nm左右)的一阶导数特征的重要性较高(图4b, c)。
上述这些特征的重要性较高可能是由于岩石中含过度元素的矿物在蓝绿波段有不同宽度的吸收特征,以及岩石中的许多矿物成分(如粘土矿物、碳酸盐矿物)在短波红外波段具有诊断性的吸收特征(Clark, 1999)。
不同岩性类别中矿物组成、含量以及含水量不同,导致它们在这些波段的反射特性差异较大,从而有利于这些岩性类别的区分。
图5是研究区内7种岩性类别训练样本的平均光谱曲线和平均归一化光谱一阶导数曲线。
从图中可以看出,在上述几个重要性较高的特征波段位置(图中
黑圈标出)处不同岩性类别的反射率和一阶导数值差异相对较大,各类别间更能区
分开,因此,在随机森林中的特征重要性相对较高。
为进一步认识基于随机森林方法的岩性分类与所用特征间的关系,利用随机森林方法对上述选出的重要性较高的特征进行岩性分类。
在用光谱特征进行分类时,只利用了特征重要性最高的20个特征波段进行分类,得到的分类总体精度为68.57%,低于利用全部光谱特征(158个波段)的分类精度(72.89%)。
而用光谱和光谱一阶导数特征分类时,利用了重要性最高的40个特征波段,得到的分类总体精度为
70.92%,也低于利用全部的光谱和光谱一阶导数特征(316个波段)的分类精度(73.03%)。
上述结果表明,尽管重要性较高的特征波段对随机森林分类的贡献更大,那些重要性较低的特征波段对随机森林分类也有贡献。
同时也说明,随机森林能有效地利用高光谱数据中的全部信息进行岩性分类。
4 结论
以新疆柯坪地区的EO-1 Hyperion数据为例,本文将随机森林方法用于高光谱数据的岩性分类中,分析评价了方法的性能和特点。
研究结果表明,与传统的SAM
方法相比,随机森林方法用于高光谱数据的岩性分类时精度更高,是一种有效的干旱-半干旱区沉积岩岩性分类方法。
进一步分析表明,随机森林能够利用高光谱数
据的全部信息进行分类。
同时,利用随机森林方法得到的特征重要性可进行特征选择和分析,为分析特征波段对典型沉积岩分类性能的贡献提供了有效的工具。
致谢感谢两位审稿专家认真审阅了本文,并提出了宝贵的修改意见。
References
Amer R, Kusky T and Ghulam A. 2010. Lithological mapping in the Central Eastern Desert of Egypt using ASTER data. Journal of African Earth Sciences, 56(2): 75-82
Breiman L. 1996. Bagging predictors. Machine Learning, 24(2): 123-140
Clark RN. 1999. Spectroscopy of rocks and minerals, and principles of spectroscopy. In: Rencz AN and Ryerson RA (eds.). Manual of Remote Sensing, Volume 3, Remote Sensing for the Earth Sciences. 1999. New York: John Wiley and Sons, 3-58
Cracknell MJ and Reading AM. 2014. Geological mapping using remote sensing data: A comparison of five machine learning algorithms, their response to variations in the spatial distribution of training data and the use of explicit spatial information. Computers & Geosciences, 63(1): 22-33 Gad S and Kusky T. 2006. Lithological mapping in the Eastern Desert of Egypt, the Barramiya area, using Landsat thematic mapper (TM). Journal of African Earth Sciences, 44(2): 196-202
Guo YB, Chi TH, Peng L, Liu JL and Yang LN. 2016. Classification of GF-1 remote sensing image based on Random Forests for urban land-use. Bulletin of Surveying and Mapping, (5): 73-76 (in Chinese)
Ham J, Chen Y, Crawford MM and Ghosh H. 2005. Investigation of the Random Forest framework for classification of hyperspectral data. IEEE Transactions on Geoscience & Remote Sensing, 43(3): 492-501
Harris JR, Rogge D, Hitchcock R, Ijewliw O and Wright D. 2005. Mapping lithology in Canada’s Arctic: Application of hyperspectral data using the minimum noise fraction transformation and matched filtering. Canadian Journal of Earth Sciences, 42(12): 2173-2193
Harris JR and Grunsky EC. 2015. Predictive lithological mapping of Canada’s North using Random Forest classification applied to geophysical and geochemical data. Computers & Geosciences, 80(C): 9-25
Li PJ. 2004. Lithological discrimination using ASTER image and geostatistical texture. Journal of Mineralogy and Petrology, 24(3): 117-121 (in Chinese with English abstract)
Liu M, Lang RL and Cao YB. 2015. Number of trees in Random Forest. Computer Engineering and Applications, 51(5):126-131 (in Chinese with English abstract)
Masoumi F, Eslamkish T, Abkar AA, Honormand M and Harris JR. 2017. Integration of spectral, thermal, and textural features of ASTER data using Random Forests classification for lithological mapping. Journal of African Earth Sciences, 129:445-457
Matthew MW, Adler-Golden SM, Berk A, Richtsmeier SC, Levine RY, Bernstein LS, Acharya PK, Anderson GP, Felde GW, Hoke MP, Ratkowski A, Burke HH, Kaiser RD and Miller DP. 2000. Status of atmospheric correction using a MODTRAN4-based algorithm. Proceedings of SPIE-The International Society for Optical Engineering, 4049: 11
Meer FDVD, Werff HMAVD, Ruitenbeek FJAV, Hecker CA, Bakker WH, Noomen MF, Meijde MVD, Carranza EJM, Smeth JBD and Woldai T. 2012. Multi- and hyperspectral geologic remote sensing: A review. International Journal of Applied Earth Observation & Geoinformation, 14(1): 112-128 Murphy RJ, Monteiro ST and Schneider S. 2012. Evaluating classification techniques for mapping vertical geology using field-based hyperspectral sensors. IEEE Transactions on Geoscience & Remote Sensing, 50(8): 3066-3080
Rani N, Mandla VR and Singh T. 2016. Performance of image classification
on hyperspectral imagery for lithological mapping. Journal of the Geological Society of India, 88(4): 440-448
Su HJ and Du PJ. 2006. Study on feature selection and extraction of hyperspectral data. Remote Sensing Technology and Application, 21(4): 288-293 (in Chinese with English abstract)
Xia J, Falco N, Benediktsson JA, Du P and Chanussot J. 2017. Hyperspectral image classification with rotation Random Forest Via KPCA. IEEE Journal of Selected Topics in Applied Earth Observations & Remote Sensing, 10(4): 1601-1609
Xinjiang Geological Survey. 1965. 1:200000 Geological Map of Subashi Area. Beijing: Geological Publishing House (in Chinese)
Yang JW, Zhang JS, Zhu XF, Xie DF and Yuan ZMQ. 2015. Random Forest applied for dimension reduction and classification in hyperspectral data. Journal of Beijing Normal University (Natural Science), 51(Suppl.1): 82-88 Zhang XY, Xu HQ and Li PJ. 2012. Lithologic mapping using EO-1 Hyperion data and extended OCSVM. Acta Scientiarum Naturalium Universitatis,
48(3): 411-418 (in Chinese with English abstract)
Zhang XY and Li PJ. 2014. Lithological mapping from hyperspectral data by improved use of spectral angle mapper. International Journal of Applied Earth Observation & Geoinformation, 31(5): 95-109
附中文参考文献
郭玉宝,池天河,彭玲,刘吉磊,杨丽娜. 2016. 利用随机森林的高分一号遥感数据进行城市用地分类. 测绘通报,(5):73-76
李培军. 2004. 用ASETR图像和地统计学纹理进行岩性分类. 矿物岩石,24(3):
117-121
刘敏,郎荣玲,曹永斌. 2015. 随机森林中树的数量. 计算机工程与应用,51(5):126-131
苏红军,杜培军. 2006. 高光谱数据特征选择与特征提取研究. 遥感技术与应用,21(4):288-293
新疆地质调查局. 1965. 火焰山地区地质图(1:20万). 北京: 地质出版社
杨珺雯,张锦水,朱秀芳,谢登峰,袁周米奇. 2015. 随机森林在高光谱遥感数据中降维与分类的应用. 北京师范大学学报(自然科学版),51(增1):82-88
张西雅,徐海卿,李培军. 2012. 运用EO-1 Hyperion数据和单类支持向量机方法提取岩性信息. 北京大学学报(自然科学版),48(3):411-418
【相关文献】
Amer R, Kusky T and Ghulam A. 2010. Lithological mapping in the Central Eastern Desert of Egypt using ASTER data. Journal of African Earth Sciences, 56(2): 75-82
Breiman L. 1996. Bagging predictors. Machine Learning, 24(2): 123-140
Clark RN. 1999. Spectroscopy of rocks and minerals, and principles of spectroscopy. In: Rencz AN and Ryerson RA (eds.). Manual of Remote Sensing, Volume 3, Remote Sensing for the Earth Sciences. 1999. New York: John Wiley and Sons, 3-58
Cracknell MJ and Reading AM. 2014. Geological mapping using remote sensing data: A comparison of five machine learning algorithms, their response to variations in the spatial distribution of training data and the use of explicit spatial information. Computers & Geosciences, 63(1): 22-33
Gad S and Kusky T. 2006. Lithological mapping in the Eastern Desert of Egypt, the Barramiya area, using Landsat thematic mapper (TM). Journal of African Earth Sciences, 44(2): 196-202
Guo YB, Chi TH, Peng L, Liu JL and Yang LN. 2016. Classification of GF-1 remote sensing image based on Random Forests for urban land-use. Bulletin of Surveying and Mapping, (5): 73-76 (in Chinese)
Ham J, Chen Y, Crawford MM and Ghosh H. 2005. Investigation of the Random Forest framework for classification of hyperspectral data. IEEE Transactions on Geoscience &。