基于PCA-RF的回采巷道围岩稳定性预测

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于PCA-RF的回采巷道围岩稳定性预测
朱志洁;张宏伟;陈蓥
【摘要】回采巷道的稳定对煤矿的安全、高效生产至关重要,在生产前应对其评价,以利于采取针对性的措施.为提高回采巷道稳定性预测的准确率,将主成分分析(PCA)与随机森林(RF)算法相结合,对回采巷道稳定性进行预测.根据回采巷道稳定性的影响因素,选取围岩强度、埋深、节理裂隙发育程度、巷道跨度、直接顶与煤层厚度之比和松动圈厚度6个指标作为巷道稳定性的影响因素.采用PCA提取影响因素的主成分,选取贡献率大于80%的3个主成分,代替原有的6个影响因素,将其作为随机森林(RF)的输入变量.将回采巷道稳定划分为4个等级,建立PCA-RF回采巷道稳定性预测模型.研究结果表明:采用PCA-RF模型误判率低,具有较高的预测精度,能够相对有效地对回采巷道的稳定性进行判定.
【期刊名称】《水文地质工程地质》
【年(卷),期】2015(042)006
【总页数】6页(P108-113)
【关键词】随机森林;主成分分析;回采巷道;稳定性;识别
【作者】朱志洁;张宏伟;陈蓥
【作者单位】辽宁工程技术大学矿业学院,辽宁阜新 123000;辽宁工程技术大学矿业学院,辽宁阜新 123000;辽宁工程技术大学矿业学院,辽宁阜新 123000
【正文语种】中文
【中图分类】TU322+.4;TU457
煤矿井巷中,回采巷道是煤炭运输、矿井通风、行人运料的重要通道,回采巷道的稳定性与矿井安全、高产、高效生产密切相关[1~2]。

因此,有必要对回采巷
道的稳定性进行预测,针对不同稳定性的回采巷道提前采取相应的支护措施,确保回采巷道的稳定和矿井安全、高效的生产。

回采巷道常见的分类方法有:单因素指标分类法、多因素复合指标分类法、多因素
综合单一指标分类方法、模糊聚类分类法、神经网络分类法、支持向量机分类法等。

这些分类方法都存在自身的缺陷,单因素指标分类法只考虑了一种影响因素,对巷道稳定性存在片面性;多因素复合指标分类法和多因素综合单一指标分类法虽然避
免了单一分类指标法的缺陷,但考虑的因素还不够全面;模糊聚类分类法[3]考虑到各指标的模糊性,能够更加科学、准确的对其进行分类,但分类指标权值的确定存在主观性;支持向量机分类法[4]可以很好地处理样本各指标之间的非线性映射关系,对于小样本具有很好的适应性,但分类效果受参数的选择影响明显;神经网
络法[5]易陷入局部最优解,并且推广能力较差。

基于以上各分类方法的不足,本文在对回采巷道稳定性影响因素全面分析的基础上,采用主成分分析(PCA,Principal Component Analysis)和随机森林(RF,Random Forest))相结合的方
法对巷道围岩的稳定性进行预测,为巷道设计和支护方案的选择提供依据。

1 回采巷道稳定性影响因素分析
(1)围岩强度。

围岩强度的大小对回采巷道稳定性所起的作用是显而易见的。

一般
较软弱的围岩易发生破坏和变形,巷道不易维护;与之相反,较坚硬的围岩就不易
发生破坏和变形,巷道相对容易维护。

本文采用围岩的单轴抗压强度来量化围岩强度。

(2)埋藏深度[6]。

开采深度大,支承压力也大,煤体塑性破坏范围就越大,巷道维护就越困难。

(3)节理发育程度[7]。

一般岩体都不同程度地含有层理、节理、裂隙等弱面,这将降低岩体的强度。

在节理裂隙不发育、完整性好的岩体中,巷道围岩的稳定性比较好;反之,则比较差。

(4)直接顶厚度与采高比值。

在全部垮落法的工作面,基本顶岩层对工作面顶板压力的影响程度主要取决于直接顶的厚度。

即直接顶越厚,破断后易形成平衡结构,基本顶对工作面的影响就越小[8]。

因此,以老顶距离煤层的远近作为矿山压力显现的重要指标之一,本文采用直接顶厚度与采高的比值进行衡量。

(5)巷道宽度。

巷道宽度的大小是影响巷道顶底板移近量的主要因素之一,宽度越大,顶底板移近量越大。

(6)松动圈尺寸[9]。

巷道掘进后,围岩应力的分布发生变化,围岩产生了应力变化区,在该区内存在应力集中现象,当应力值超过围岩体的极限强度时,周边岩体产生破裂,使巷道周围形成了一定厚度的破裂区域,即围岩松动圈。

松动圈厚度越小,巷道越稳定;反之则越不稳定。

2 基于PCA的随机森林算法
2.1 随机森林算法基本原理
随机森林[10](Random Forest)是由 Leo Breiman 提出的一种集成学习算法,该算法由多个彼此相互独立决策树组合,在树的生长和训练样本的选择过程中引入了随机性,以降低决策树结构分类器的方差。

大量的研究表明[11~14],随机森林具有很高的预测精度,能够很好地容忍噪声点和异常值,可以有效避免过度拟合问题。

本文基于Bootstrap方法和随机选取分裂属性集方法构建随机森林。

采用该方法随机产生多个训练子集,在各个训练子集上分别建立分类器,根据各个分类器的分类效果投票确定最终的分类结果。

构建随机森林算法具体流程[15]如下:
(1)利用Bootstrap方法重采样,随机产生k个训练集 D1,D2,…,Dk;
(2)利用每个训练集,生成对应的决策树C1,C2,…,Ck;
(3)在每个非叶子节点上选择属性前,从M个属性中随机抽取m个属性作为当前节点的分裂属性集,并以这m个属性中最好的分裂方式对该节点进行分裂;
(4)每棵树都完整生长,而不进行剪枝;
(5)对于测试集样本X,利用每个决策树进行测试,得到对应的类别C1(X),
C2(X),…,Ck(X);
(6)采用投票的方法,将k个决策树中输出最多的类别作为测试集样本X所属的类别。

2.2 PCA法基本原理
PCA方法是一种利用降维思想的多元统计分析方法,采用该方法能够抓住研究问题主要矛盾,使复杂的研究问题得到简化,提高分析问题的效率[15]。

假设某一事物由m个指标组成,分别用X1,X2,…,Xm表示,由这m个指标组成了m维随机向量X=(X1,X2,…,Xm)',设μ 为随机向量 X 均值。

对随机向量X进行线性变换,可转变成新的综合变量,用Y表示。

这样,新的综合变量可以由原来的变量线性表示,即满足下式:
式中系数μij可以根据下列原则来确定:
①μi12+μi22+…+μim2=1(i=1,2,…,m);
②Yi与Yj(i≠j;i,j=1,2,3,…,n)线性无关;
③Y1为,X1,X2,…,Xm的所有线性组合中方差最大者;Y2为与Y1不相关的X1,X2,…,Xm的所有线性组合中方差最大者;…;Yn为 Y1,Y2,…,Yn-1都不相关的 X1,X2,…,Xm的所有线性组合中方差最大者。

这样确定的新变量指标Y1,Y2,…,Yn-1分别称为原变量指标X1,X2,…,Xm的第1主成分,第2成分,…,第n主成分。

其中,Y1的方差占总方差的比
例最大,Y2,…,Yn-1的方差依次减小。

分析实际问题时,常挑选前面几个最大
的主成分,这样既可以减少变量的数目,又抓住了问题的主要矛盾,使各变量之间的关系得到了简化。

3 回采巷道稳定性PCA-RF预测模型
3.1 数据获取及相关性分析
搜集河南省平顶山矿区回采巷道稳定性相关数据[16]:围岩强度 X1,巷道跨度
X2,直接顶与煤层厚度之比X3,巷道埋深X4,节理发育程度X5,松动圈尺度
X6(表1),其中节理发育程度:1为很不发育,2为不发育,3为中等发育,4为较
发育,5为发育。

围岩类别分为5类:I为极稳定,II为稳定,III为中等稳定,IV为不稳定,V为极不稳定。

采用SPSS19.0统计分析软件,对该模型各输入参数对回采巷道的稳定性影响程度进行相关性分析。

各指标与巷道稳定性相关系数分别为:
围岩强度X1(-0.741),巷道跨度X2(0.695),直接顶与煤层厚度之比X3(-0.817),巷道埋深 X4(0.610),节理发育程度X5(0.921),松动圈尺度X6(0.913)。

由此可知,各指标对回采巷道稳定性影响程度由大到小分别为:节理发育程度、松动圈尺度、直接顶与煤层厚度之比、围岩强度、巷道跨度、巷道埋深,其中,围岩强度和直接顶与煤层厚度之比两指标为负相关,其他指标为正相关。

3.2 回采巷道稳定性影响因素主成分分析
应用Matlab数学计算软件,对巷道稳定性的影响因素按以下步骤提取主成分: (1)原始数据标准化。

回采巷道稳定各影响因素的量纲和数量级存在差异,在主成
分分析前需对原始数据标准化处理。

(2)采用标准化后的数据进行相关系数矩阵R的求解。

相关系数矩阵见表2。

(3)求矩阵R的特征值和相应的特征向量及贡献率,并提取主要成分。

由表3可知,前3个主成分的方差占总方差的88.82%,根据主成分的选则标准,原来的6项指标可由这3个主成分代替。

表1 回采巷道围岩稳定性样本Table 1 Sample data of gateway surrounding rocks stability序号 X1 X2 X3 X4 X5 X6类别1 62.4 2.6 5.55 362 2 0.6 II 2 110.2 2.8 3.6 180 1 0.3 I 3 12.6 2.9 2.53 403 3 1.3 III 4 9.1 3.6 0.4 470 5 2.1 V 5 73.6 3 4.34 340 2 0.8 II 6 32.2 3.2 3.8 340 2 0.7 II 7 10.5 3.5 3.71 370 3 1 III 8 10.5 3.2 3.52 350 3 1.2 III 9 23.8 2.6 7 178 3 1.2 II 10 11.9 3.5 2.85 293 3 1.1 III 11 11.2 3 1.85 450 3 1.2 III 12 9.1 3.2 0.6 420 4 1.4 IV 13 12.6 3.7 1 510 4 1.4 IV 14 18.8 3.4 5.23 340 3 1.3 III 15 16.8 3.2 0.5 249 3 1 III 16 14.3 4.4 0.45 322 4 1.5 IV 17 9.1 3.4 1.81 450 5 2 IV 18 14.3 3 1.2 236 3 1.2 III 19 11.2 2.6 1.85 97 3 1.2 III 20 101.6 3.2 3.75 460 1 0.4 I 21 13.3 3 0.67 321 3
1.1 III 22 13.3 3.2 0.92 410 4 1.4 IV 23 10.9 3.6 0.57 665 4 1.7 IV 24 2
2.4
3.4
2 296
3 1.2 III 25 11.96 3.
4 1.73 268 4 1.4 III 26 13.3 3.6 0.7 450 4 1.6 IV 27 10.1 3.4 1.72 467 4 1.8 IV 28 10.1 4 0.6 470
5 2.2 V 29 11.2 2.8 3.75 315 3 1.1 III 30 13.3 2.8 1.11 125 3 1.3 III
表2 各指标相关系数矩阵Table 2 Correlation coefficient matrix of each factor 指标 X1 X2 X3 X4 X5 X6 X11 X2 -0.3139 1 X3 0.4668 -0.5001 1 X4 -0.1396 0.5255 -0.2889 1 X5 -0.7731 0.5821 -0.6104 0.4191 1 X6-0.7295 0.554 -0.567 0.4313 0.9636 1
表3 主成分及其贡献率Table 3 Principal components and contribution rate 序号特征值贡献率累计贡献率1 3.713 0.6189 0.6189 2 1.027 0.1713
0.7902 3 1.027 0.0980 0.8882 0.403 0.0673 0.9555 0.235 0.0392 0.9947
0.031 0.0053 1 456
(4)主成分因子荷载矩阵见表4。

根据表4中PCA矩阵模型,给出因子Y1,Y2和Y3与原始变量之间的关系。

表4 主成分因子载荷矩阵Table 4 Factor load matrix of the principal
componentY1 Y2 Y3 X1-0.7595 -0.5191 0.1746 X2 0.7239 -0.4507 0.1952
X3 -0.7315 -0.0303 -0.6171 X4
0.5521images/BZ_269_627_787_632_788.png -0.7091 -0.2960 X5 0.9521 0.1700 -0.1322 X60.9307 0.1499 -0.1835
根据表4中的矩阵可以写出因子表达式:
根据上述表达式对标准化后的数据进行PCA计算,计算后的主成分载荷相关数据见表5。

表5 主成分计算后样本数据Table 5 Calculated data of the principal component样本编号 Y1 Y2 Y3类别1-0.0532 -0.0786 -0.0387 II 2-0.1091 -0.1047 -0.0041 I 3 0.0638 -0.0403 -0.0226 III 4 0.1381 -0.0379 -0.0038 V 5-0.0456 -0.0860 -0.0227 II 6 0.0037 -0.0566 -0.0282 II 7 0.0489 -0.0411 -
0.0329 III 8 0.0525 -0.0375 -0.0303 III 9-0.0119 -0.0345 -0.0545 II 10
0.05499 -0.0362 -0.0223 III 11 0.0732 -0.043 -0.0185 III 12 0.1032 -0.0373 -0.0071 IV 13 0.1037 -0.0484 -0.0112 IV 14 0.0291 -0.0442 -0.0424 III 15 0.0675 -0.0348 0 III 16 0.1056 -0.0397 0.0012 IV 17 0.1183 -0.0366 -0.0166 IV 18 0.0655 -0.0307 -0.0059 III 19 0.0517 -0.0175 -0.0094 III 20 -0.0815 -0.1187 -0.0141 I 21 0.0743 -0.0358 -0.0044 III 22 0.0949 -0.0399 -0.0086 IV 23 0.1249 -0.0556 -0.0109 IV 24 0.0545 -0.0429 -0.012 III 25 0.0819 -0.0307 -0.0118 III 26 0.1072 -0.0434 -0.0059 IV 27 0.1042 -0.041 -0.0157 IV 28 0.1404 -0.0402 -0.004 V 29 0.0421 -0.0343 -0.0325 III 30 0.0629 -0.0212 -0.0022 III
3.3 回采巷道稳定性RF模型预测
选取表5中样本1~20作为训练集,用于模型训练;选取表5中样本21~30作为
测试集,用于检验训练好模型的预测效果。

选取PCA降维处理后Y1,Y2和Y3
作为回采巷道稳定性预测的输入参数,不同稳定性的类别作为输出参数,建立随机森林的回采巷道稳定性预测模型。

随机森林算法应用科罗拉多大学博尔德分校Abhishek Jaiantilal开发的randomforest-matlab工具箱实现。

选取训练集样本,应用工具箱中classRF_train()函数创建随机森林分类器,其中随机森林参数决策树的个数为100、分裂属性集中的属性个数为2。

为了验证识别回采巷道稳定性模型是否满足实际要求,将表5的全体训练样本代
入已建立好的随机森林模型进行回判,误判率为0。

应用训练好的回采巷道分类预测的PAC-RF模型对表5中样本21~30待判检验
样本进行判别,采用RF模型进行对比预测,判别结果见表6,由表6可知,
PAC-RF模型只有29号样本误判,预测准确率为90%,判别结果与实际类别基本一致;而RF模型24号、29号样本均被误判,预测准确率为80%。

同时,采用支
持向量机和BP神经网络对回采巷道的稳定性预测,预测准确率均为70%。

可见PCA-RF的误判率较低,对回采巷道稳定性预测具有良好的适用性和有效性,可以在工程中运用。

通过该模型的应用,可以针对性地采取支护方案,确保回采巷道的安全,实现矿井的安全高效生产。

4 结论
(1)对回采巷道的稳定性影响程度进行相关性分析,确定各指标对回采巷道稳定性
影响程度由大到小分别为:节理发育程度、松动圈尺度、直接顶与煤层厚度之比、
围岩强度、巷道跨度、巷道埋深。

(2)采用PCA对回采巷道稳定性影响因素进行降维处理,简化了样本数据,提高了模型的预测效率。

(3)将PCA与随机森林算法相结合,建立了回采巷道稳定性预测的PCA-RF模型。

结果表明:该模型可以相对准确地对回采巷道稳定性进行预测,预测结果与实际情
况基本一致,这为合理经济地选择回采巷道支护方案提供了可靠的保障。

表6 回采巷道稳定性预测结果Table 6 Predicted results of the gateway stability样本编号 Y1 Y2 Y3 实际类别 RF类别 PCA-RF类别支持向量机类别
BP 神经网络类别21 0.0743 -0.0358 -0.0044 III III III III III 22 0.0949 -0.0399 -0.0086 IV IV IV IV IV 23 0.1249 -0.0556 -0.0109 IV IV IV V V 24 0.0545 -
0.0429 -0.012 III V III III III 25 0.0819 -0.0307 -0.0118 III III III IV III 26 0.1072 -0.0434 -0.0059 IV IV IV IV III 27 0.1042 -0.041 -0.0157 IV IV IV III IV 28
0.1404 -0.0402 -0.004 V V V V V 29 0.0421 -0.0343 -0.0325 III II II III IV 30 0.0629 -0.0212 -0.0022 III III III III III
参考文献:
[1]刘玉堂.我国缓倾斜、倾斜煤层回采巷道围岩稳定性分类的研究[J].煤炭学报,1989,14(3):21-36.[LIU Y T.Study the gateway surrounding rock classification of dip and flat dip coal state in China[J].Journal of China Coal Society,1989,14(3):21-36.(in Chinese)]
[2]杨双锁.煤矿回采巷道围岩控制理论探讨[J].煤炭学报,2010,
35(11):1842-1853.[YANG S S.Study on the surrounding rock control theory of roadway in coalmine[J].Journal o f China Coal Society,2010,35(11):1842-1853.(in Chinese)]
[3]李洪,蒋金泉,张开智.回采巷道围岩分类的模糊聚类分析方法[J].西安科技大学学报,2005,25(1):12-16.[LI H,JIANG J Q,ZHANG K Z.Fuzzy clustering analysis of tunnel surrounding rock classification [J].Journal of Xi’an University of Science& Technology,2005,25(1):12-16.(in Chinese)][4]朱一丁,马文涛.回采巷道围岩分类的支持向量机方法[J].采矿与安全工程学报,2006,23(3):362-365.[ZHU Y D,MA W T.Method of support vector
machines for classifying surrounding rocks of gateways [J]. Journal of Mining & Safety Engineering,2006,23(3):362-365.(in Chinese)]
[5]贺超峰,华心祝,马菁花,等.基于BP神经网络的回采巷道围岩稳定性分类[J].矿业工程研究,2012,27(3):6-9.[HE C F,HUA X Z,MA J H,et
al.Classification of surrounding rock stability of roadway based on BP neural network [J].Mineral Engineering Research,2012,27(3):6-9.(in Chinese)]
[6]李彦斌,杨永康,苏学贵.埋深对巷道围岩稳定性影响研究[J].太原理工大学学报,2011,42(6):603-606.[LI Y B,YANG Y K,SU X G.Study on the stability of surrounding rocks of a coal roadway in different depth
[J].Journal of Taiyuan University of Technology,2011, 42(6):603-
606.(in Chinese)]
[7]王鲁明,赵坚,万德连.巷道裂隙围岩稳定性影响因素的数值分析[J].岩土力学,2005,26(10):44-48.[WANG L M,ZHAO J,WAN D L.Numerical analysis of influencing factors in stability of cracked surrounding rock of a laneway[J].Rock and Soil Mechanics,2005,26(10):44-48.(in Chinese)][8]马建宏,韦四江,李小军.直接顶厚度对回采巷道稳定性影响的数值模拟研
究[J].河南理工大学学报(自然科学版),2007,26(6):647-651.[MA J H,WEI S J,LI X J.Numerical simulation on stability o f gateway under the influence of the thickness of immediate roof[J].Journal of Henan Polytechnic University(Natural Science),2007,26(6):647-651.(in Chinese)][9]靖洪文,付国彬,郭志宏.深井巷道围岩松动圈影响因素实测分析及控制技
术研究[J].岩石力学与工程学报,1999,18(1):70-74.[JING H W,FU G B,GUO Z H.Measurement and analysis of influential factors broken zone of
deep roadways and study on its control technique[J].Chinese Journal of Rock Mechanics and Engineering,1999,18(1):70-74.(in Chinese)][10]方匡南,吴见彬,朱建平,等.随机森林方法研究综述[J].统计与信息论坛,2011,26(3):32-38.[FANG K N,WU J B,ZHU J P,et al.A review of technologies on random gorests[J].Statistics &Information Forum,2011,26(3):32-38.(in Chinese)]
[11]张华伟,王明文,甘丽新.基于随机森林的文本分类模型研究[J].山东大学学报(理学版),2006,41(3):139-143.[ZHANG H W,WANG M W,GAN L X.Automatic text classification model based on random forest[J].Journal of Shandong University(Natural Science),2006,41(3):139-143.(in Chinese)]
[12]郭颖婕,刘晓燕,郭茂祖,等.植物抗性基因识别中的随机森林分类方法[J].计算机科学与探索,2012,6(1):67-77.[GUO Y J,LIU X Y,GUO M Z,et al.Identification of plant resistance gene with random forest[J].Journal of Frontiers of Computer Science and Technology,2012,6(1):67-77.(in Chinese)]
[13]张建,武东英,刘慧生.基于随机森林的流量分类方法[J].信息工程大学学报,2012,15(5):621-625.[ZHANG J,WU D Y,LIU H S.Internet traffic classification based on random forest[J].Journal of Information Engineering University,2012,15(5):621-625.(in Chinese)]
[14] Long-jun DONG,Xi-bing LI,Kang PENG.Prediction of rockburst classification using Random Forest[J].Transactions of Nonferrous Metals Society of China,2013,23(2):472-477.
[15]朱志洁,张宏伟,韩军,等.基于PCA-BP神经网络的煤与瓦斯突出预测研
究[J].中国安全科学学报,2013,23(4):45-50.[ZHU Z J,ZHANG H W,HAN J,et al.Prediction of coal and gas outburst based on PCA-BP neural network[J].China Safety Science Journal,2013,23(4):45-50.(in Chinese)][16]庞建勇,郭兰波.煤巷围岩稳定性综合分类及锚杆支护形式合理选择[J].
淮南矿业学院学报,1998,18(1):9-15.[PANG J Y,GUO L P.Overall classification on rooks stability of coal roadway and rational choice of rooks bolting[J].Journal of Huainan Mining Institute,1998,18(1):9-15.(in Chinese)]。

相关文档
最新文档