基于主因子分析的改进BP神经网络瓦斯涌出量预测

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于主因子分析的改进BP神经网络瓦斯涌出量预测
周西华;孙家正
【摘要】为提高回采工作面瓦斯涌出量预测效率和准确率,基于反向BP神经网络,采用主因子分析法对变量进行降维处理;结合遗传算法(GA)和附加动量法,采用遗传算法优化BP神经网络初始权值和阈值,建立基于主因子分析的GA—BP神经网络预测模型,并在权值反向更新过程中引入动量项.选取开滦矿业集团钱家营矿井瓦斯涌出量监测数据作为标签数据与输入数据,对不同网络模型进行了仿真与分析,结果表明:改进的GA—BP神经网络模型在603个时间步长里达到收敛,平均相对误差约为0.58%,预测精度和效率均优于其他神经网络模型,能更有效地实现瓦斯涌出量的准确预测.
【期刊名称】《矿业安全与环保》
【年(卷),期】2018(045)006
【总页数】6页(P43-47,52)
【关键词】瓦斯涌出量;主因子分析;BP神经网络;遗传算法(GA);动量项
【作者】周西华;孙家正
【作者单位】辽宁工程技术大学安全科学与工程学院,辽宁阜新123000;矿山热动力灾害与防治教育部重点实验室,辽宁阜新123000;辽宁工程技术大学安全科学与工程学院,辽宁阜新123000;矿山热动力灾害与防治教育部重点实验室,辽宁阜新123000
【正文语种】中文
【中图分类】TD712+.5;X936
随着煤矿开采强度和深度的增加,瓦斯涌出愈加严重,制约着矿井安全高效生产[1]。

实现瓦斯涌出量精准预测非常重要,但瓦斯涌出是极其复杂的动态过程,各影响因素之间具有高度的非线性相关性,而分源预测法等[2-3]传统线性预测方法无法达到预期精度,有必要通过数值模拟技术对非线性预测方法进行深入研究。

为此,吕伏等[4]将主成分回归分析法应用于瓦斯涌出预测;李国祯等[5]采用灰色理论预测瓦斯涌出量;白云霄[6]提出一种人工神经网络预测模型。

以上研究均侧重于对非线性关系的映射效果,而人工神经网络能更准确地映射瓦斯涌出量与各个影响因素之间的关系。

许多学者致力于神经网络优化,如吉振光[7]提出了GA—BP神经网络预测模型;雷文杰等[8]用灰色理论对BP神经网络参数进行了优化;卢国斌[9]等提出了PCA—BP神经网络预测模型。

上述研究提高了神经网络的效率,但在收敛速度和滑过局部极小能力上仍存在局限性。

基于此,笔者结合主因子分析与GA—BP神经网络,通过主因子分析提取主因子替代原始变量,简化网络结构,消除冗余信息;同时采用遗传算法优化网络初始权值和阈值,并引入动量因子改变权值更新方式,避免搜索陷入局部极小,以提高预测准确性。

1 相关理论
1.1 主因子分析原理
主因子分析法的原理是基于降维的思想,将变量分解得到主因子和特殊因子[10]。

其中主因子个数少,以线性组合的形式呈现,能反映变量的主要信息,而特殊因子反映各变量的个性,一般不予讨论。

设p维总体X=(x1,x2,…,xp)的均值为(μ1,μ2,…,μp),主因子分析的数学模型为:
(1)
式中:fi(i=1,2,…,m)表示m个主因子;εi(i=1,2,…,p)为变量xi所独有的特殊因子;aij(i=1,2,…,p;j=1,2,…,m)为变量xi在主因子fj上的载荷,对应着主因子对变量的重要程度。

通常采用因子旋转法,使载荷矩阵的数值更加偏于两极化,便于解释二者之间的关系,最后依据回归方程计算主因子得分。

其中,A为因子载荷矩阵,R为影响因素之间的相关性矩阵,主因子得分为BP神经网络新的输入变量。

1.2 BP神经网络基本原理
BP神经网络是一种前馈型网络,按照神经元的不同功能将其进行分层,最左侧为
输入层,最右侧为输出层,中间为隐含层,隐含层个数在求解不同实际问题时可以变化。

BP神经网络拓扑结构如图1所示。

图1 BP神经网络拓扑结构示意图
BP神经网络在训练过程中一般采用梯度下降法则,循环进行正向传输信息和逆向
反馈误差两个过程,直到输出误差满足预设精度。

选取合适的隐含层节点数对建立高质量BP神经网络尤为重要,Kolmogrov定理
给出一个参考方法[11]:在输入节点数为X的神经网络中,隐含层节点数为2X+1,在此基础上可以对其进行测试调整,提高网络整体性能。

2 改进BP神经网络模型构建
2.1 GA—BP神经网络预测模型
BP神经网络具有高度的自适应能力和容错能力,然而对样本数据的求解往往在多
维空间进行,同时网络初始权值的选取具有不确定性,很难得到具有全局性的初始点,使BP算法在寻优过程中极易陷入局部极小。

相反,遗传算法是并行随机搜索的,具有更好的全局性[12]。

GA—BP神经网络模型结合了遗传算法和BP算法,
在保留原有自适应性和容错性的基础上,通过全局搜索选取最优初始权值和阈值,不仅加快了网络学习速度,还可提高全局优化能力。

2.2 附加动量法修正模型
附加动量法的本质是引用动量因子η(0<η<1)对权值变化方式进行修改,在前后两次权值变化量之间建立一种映射关系,其公式[13]为:
Δw(k+1)=ηΔw(k)+α(1-η)δx
(2)
式中:k为训练次数;Δw(k)为权值在k次训练过程中的变化量;α为学习速率;
δx为误差项对权值的梯度,在沿梯度反向修改权值的基础上,动量项可以有效抑
制误差变化率过大,促使网络在相对平缓的曲面进行运算,容易滑过浅的局部极小。

改进的BP神经网络预测模型流程图如图2所示。

3 模型应用与分析
3.1 回采工作面瓦斯涌出影响因素的选取
煤矿井下地质条件复杂,瓦斯涌出影响因素很多,经过与现场人员沟通及查阅相关资料,选取11个主要因素为原始变量,包括开采煤层瓦斯含量x1、煤层埋藏深
度x2、煤层厚度x3、煤层倾角x4、工作面长度x5、日推进速度x6、煤炭采出率x7、邻近层瓦斯含量x8、层间距x9、层间岩性x10、开采强度x11。

其中层间岩性x10属于定性指标,无法直接测得,作为输入数据前需进行量化处理。

由于煤
层围岩中影响瓦斯涌出卸压范围的重要特性是围岩硬度,因此,采用
图2 改进的BP神经网络预测模型流程图
围岩硬度加权平均值作为层间岩性的量化数值[14],其计算公式如下:
(3)
式中:n为围岩所含岩层数量;fm为第m层岩层硬度,计算方法采用摩氏硬度计量法[15];hm为第m层岩层厚度;H为开采层与邻近层之间的围岩总厚度。

选取开滦矿业集团钱家营矿区连续18个月的回采工作面瓦斯监测数据,回采工作面瓦斯涌出量Y与影响因素数据如表1所示。

表1 回采工作面瓦斯涌出量与影响因素数据序号x1/(m3·t-
1)x2/mx3/mx4/(°)x5/mx6/(m·d-1)x7/%x8/(m3·t-1)x9/mx10x11/(t·d-
1)Y/(m3·t-1)11.924082.0101554.420.9602.02205.031
8253.3422.154112.081404.160.9502.10224.871
5272.9732.144201.8111754.130.9502.64194.751
7513.5642.584322.3101454.670.9502.40174.912
0783.6252.404562.2151604.510.9402.55204.632
1044.1763.225162.8131803.450.9302.21124.782
2424.6072.805272.5171803.280.9402.81114.511
9794.9283.355312.991653.680.9301.88134.822
2884.7893.615502.9121554.020.9202.12144.832
3255.23103.685633.0111753.530.9403.11124.532
4105.56114.215905.981702.850.7953.40184.773
1397.24124.036046.291802.640.8123.15164.703
3547.80134.346076.191652.770.7853.02174.623
0877.68144.806346.5121752.920.7732.98154.553
6208.51152.434502.2121604.320.9502.00164.841
9964.06164.676406.3111752.750.8022.56154.603
4127.95173.165442.7111653.810.9302.30134.902
2074.92184.626296.4131702.800.8033.35194.633 4568.04
3.2 瓦斯涌出量相关因素主因子分析
3.2.1 主因子提取
原始数据中各因素的量纲和数值都存在较大差异。

运用SPSS22.0对数据进行标准化处理,然后进行相关性诊断,得出KMO检验量值为0.675(大于0.500),表明
各因素互相影响;Bartlett卡方值为0.000(小于0.050),达到显著水平。

以上结
果都表示主因子分析适用于原始数据的降维处理。

各因素主因子分析结果如表2所示。

在此仅列出前3组。

表2 各因素主因子分析结果因子序号初始特征值提取载荷平方和旋转载荷平方和
特征值方差贡献率累计贡献率特征值方差贡献率累计贡献率特征值方差贡献率累计贡献率
16.98063.45763.4576.98063.45763.4576.49559.04859.04822.00018.18181.6 382.00018.18181.6381.94417.67376.72130.9358.50490.1410.9358.50490.14 11.47613.42090.141
由表2可知,主因子f1、f2和f3的累计贡献率达到90.1%,表明f1、f2和f3中包含90%以上的原始信息,满足主因子提取条件。

经过最大方差法旋转主因子,
可知3个主因子的特征值都大于1,故选取f1、f2和f3 3个主因子替代原始变量。

3.2.2 主因子得分计算
主因子得分系数矩阵B可以直观反映主因子与瓦斯涌出量各影响因素之间的线性
关系,主因子得分系数如表3所示。

表3 主因子得分系数变量f1f2f3x10.152-0.123-0.148x20.132-0.084-
0.206x30.175-0.0700.078x4-0.1430.0540.052x50.0070.209-0.208x6-
0.1350.0290.095x7-0.1760.056-
0.125x80.0950.3170.372x90.0520.1290.735x10-0.007-0.450-0.154x110.162-0.0630.009
旋转后的因子得分表达式为:
(4)
式中:Bij为系数矩阵B中的各个元素;xj为标准化数据。

将主因子得分作为新的输入数据,则数据由11维变成3维,起到了降维的作用。

3.3 预测模型结果分析
3.3.1 神经网络参数选取
采用Matlab软件对BP算法和改进的GA—BP算法进行编程。

2种模型输入数据均为主因子得分,且参数选取保持一致。

由Kolmogrov定理可知,隐含层节点数为7,即拓扑结构为3-7-1,最大训练次数为5 000,训练误差目标为0.001,学习率为0.05,激励函数选取tansig函数。

改进的GA—BP神经网络中,动量因子η=0.95,遗传算法中采用二进制编码,二进制位数为10,种群大小为100,最大遗传代数为50,交叉概率为0.7,变异概率为0.01,代沟取0.95。

为了对比模型的预测效果,创建一个经典BP神经网络,输入数据为原始数据,模型拓扑结构为11-23-1,参数保持不变。

在仿真过程中,选取前13组数据训练网络,后5组数据检验网络。

3.3.2 预测结果分析对比
依据选取的神经网络参数,在Matlab中对3种模型进行参数设置并训练网络,误差训练曲线如图3所示。

图3 不同神经网络误差训练曲线
由图3可知,原始数据和主因子得分BP神经网络模型达到一定收敛精度所需时间步长分别为2 352步和1 528步,而基于主因子分析的改进GA—BP神经网络模型在第603步就达到收敛精度。

由曲线变化趋势可知,BP神经网络输入数据经过降维处理后,收敛速度明显提高,基于主因子分析改进的GA—BP神经网络具有
更快的收敛速度。

保存训练好的BP神经网络,分别对检验数据进行预测,不同模型预测结果对比如表4所示。

表4 不同模型瓦斯涌出量预测结果对比序号期望值BP神经网络模型主因子分析
BP神经网络模型主因子分析GA—BP神经网络模型PCA—BP神经网络模型[9]预测值相对误差/%预测值相对误差/%预测值相对误差/%预测值相对误差
/%148.5108.1823.8548.4151.1168.4530.670154.0603.8535.0993.9482.7594. 0240.887167.9507.8960.6797.8001.8877.9860.4538.1102.013174.9204.8611. 1994.9000.4074.9480.5695.0202.033188.0408.7218.4707.8232.6998.0670.33 67.8102.861均值3.8601.7730.5832.302
由表4可以看出,BP神经网络误差平均值约为3.860%,主因子分析BP神经网
络误差平均值约为1.773%。

后者较前者降低了2.087%,说明主因子分析BP神
经网络具有更好的预测精度,这是由于主因子分析对原始数据进行了降维处理,消除了冗余。

PCA—BP神经网络误差平均值约为2.302%,高于主因子分析BP神
经网络,表明主因子分析能更好地解释原始变量,适用于降维方法。

基于主因子分析改进的GA—BP神经网络误差平均值约为0.583%,在多种神经网络预测结果中效果最好,并且相对误差普遍低于1%,说明该模型预测结果更接近现场实测数据。

不同神经网络模型相对误差曲线如图4所示。

图4 各种模型瓦斯涌出量预测结果相对误差对比
由图4可知,BP神经网络模型相对误差曲线波动性非常大,这是由于输入数据之间存在严重相关性。

主因子分析BP神经网络模型次之,其原因为BP神经网络模
型极易陷入局部极小。

PCA—BP神经网络模型相对误差曲线相对稳定,但整体误差值偏大。

遗传算法通过全局搜索选取最优初始权值和阈值,动量项促使BP神经网络在相对平缓的求解空间运算,因此基于主因子分析改进的GA—BP神经网络
模型预测误差曲线非常平缓,具有更好的预测精度和稳定性。

4 结论
1)结合主因子分析、遗传算法、动量项和BP神经网络,建立了基于主因子分析改进的GA—BP神经网络瓦斯涌出量预测模型。

2)由训练仿真结果可知,改进后的模型预测结果和现场实测数据基本吻合。

对比基于主因子分析的改进GA—BP神经网络模型和不同输入数据的BP神经网络模型
的预测误差,前者相对误差均值可达0.583%,在稳定性和准确率方面均优于其他模型,包括已提出的PCA—BP神经网络模型,因此更适合现场应用。

3)由于条件限制,本文的样本数据有限,对预测精度有一定影响。

因此,下一步研究应广泛收集现场资料与数据,提取其他影响因素,增加样本容量,进一步检验预测模型的实用性。

参考文献:
【相关文献】
[1] 石琨.综放工作面瓦斯综合治理技术[J].煤炭科学技术,2012,40(5):63-65.
[2] 马建宏,陈懿博,庞泽明.综放工作面瓦斯涌出量预测方法及工程实践[J].中国安全生产科学技术,2014,10(10):143-147.
[3] 李泽瑜,孟祥云.矿井瓦斯涌出量预测方法[J].辽宁工程技术大学学报(自然科学版),2014,
33(9):1212-1216.
[4] 吕伏,梁冰,孙维吉,等.基于主成分回归分析法的回采工作面瓦斯涌出量预测[J].煤炭学报,2012,37(1):113-116.
[5] 李国祯,李希建,孟昭君,等.基于灰色理论的矿井未开采区瓦斯涌出量预测[J].煤炭工程,2010,29(9):85-87.
[6] 白云霄.基于神经网络算法的煤矿瓦斯涌出量预测模型研究[J].煤炭技术,2012,31(11):104-106.
[7] 吉振光.基于遗传算法改进的BP神经网络模型在邻近层瓦斯涌出量预测中的应用[J].煤矿安全,2011,42(7):36-38.
[8] 雷文杰,刘瑞涛,苏国韶.灰色关联优化BP神经网络预测工作面瓦斯涌出量[J].矿业安全与环保,2013,40(5):34-37.
[9] 卢国斌,康晋恺,白刚,等.PCA—BP在回采工作面瓦斯涌出量预测中的应用[J].辽宁工程技术
大学学报(自然科学版),2015,34(12):1329-1334.
[10] 谢中华.MATLAB统计分析与应用:40个案例分析[M].北京:北京航天航空大学出版社,2010:374-376.
[11] 曹博,白刚,李辉.基于PCA—GA—BP神经网络的瓦斯含量预测分析[J].中国安全生产科学技术,2015,11(5):84-90.
[12] 刘奕君,赵强,郝文利.基于遗传算法优化BP神经网络的瓦斯浓度预测研究[J].矿业安全与环保,2015,42(2):56-60.
[13] 许宜申,顾济华,陶智,等.基于改进BP神经网络的手写字符识别[J].通信技术,2011,44(5):106-109.
[14] 付华,谢森,徐耀松,等.基于ACC—ENN算法的煤矿瓦斯涌出量动态预测模型研究[J].煤炭
学报,2014,39(7):1296-1301.
[15] 谢仁海.煤矿地质[M].北京:煤炭工业出版社,1987.。

相关文档
最新文档