果蝇算法融合 SVM 的开采沉陷预测模型
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
果蝇算法融合 SVM 的开采沉陷预测模型
李生亚
【摘要】针对目前开采沉陷预计方法的种种缺陷,提出了一种新的预计方法。
将果蝇优化算法( FOA)与支持向量机( SVM)相结合,建立FOA-SVM预测模型。
选取煤层倾角、采厚、平均采深等参数作为模型的输入参数,最大下沉量作为模型的输出参数。
选取训练集样本,应用FOA对SVM的参数进行寻优,确定最佳的SVM参数。
采用预测集样本对该预测模型进行检验,同时将该模型预测性能与其他预测模型进行对比分析。
结果表明:与GA-SVM模型、PSO-SVM模型和神经网络预测模型相比,该模型具有更高的预测能力和泛化能力,可以较好地实现对开采沉陷的预测。
【期刊名称】《煤》
【年(卷),期】2014(000)011
【总页数】4页(P36-39)
【关键词】果蝇优化算法;支持向量机;开采沉陷;预测
【作者】李生亚
【作者单位】汾西矿业集团中兴煤业,山西交城 030501
【正文语种】中文
【中图分类】TD327
煤炭作为重要能源,给人类带来了巨大的经济和社会效益,同时也对地表产生了破坏,引起地表塌陷、建筑物破坏和水土流失等一系列生态环境问题[1]。
煤炭开
采前,对开采沉陷进行预计,采取针对性的预防或防护措施,可以控制或减少开采引起的底板损害。
目前,国内外开采沉陷的预计方法有概率积分法[2]、典型曲线法[3]、相似材料模拟法[4]、数值模拟法[5]和神经网络法[6]等。
但这些方法都存在自身的缺陷,如概率积分法仅适用于水平和倾斜煤层充分采动条件下的地表变形计算;典型曲线法是针对某个矿区建立的,不具有普遍适用性;相似材料模拟法受实验环境影响明显,且耗费大量人力物力;数值模拟法受参数的选取影响明显,预测结果存在较大的误差;神经网络法在对模型进行训练时,存在易陷入局部最优解等缺点。
支持向量机能够综合考虑地表沉陷的多个指标,拥有很好的泛化能力,并且该方法具有收敛速度快、预测准确性高和可多次训练等特点[7-8]。
但是,支持向量机的预测能力受参数选择的影响明显,对于模型参数的优选问题没有得到解决。
鉴于上述原因,笔者应用果蝇算法对支持向量机的参数C和g进行优化,建立开采沉陷的预测模型,对开采沉陷值进行预计。
支持向量机的根本思想是把维数较低线性不可分的数据样本经过某种非线性映射函数将其转换成维数较高的数据使其具有可分性,进而对处理后的数据进行线性剖析[9]。
设数据样本为(x1,y1),(x2,y2),…(xk,yk)∈RN×R,其中xi∈RN、yi∈R为相应的输入和输出向量。
支持向量机就是采用映射θ将向量x映射到更高维数的向量空间,从而进行回归分析,其函数为:
式中:ω、b分别为权值和阀值。
应用统计学的相关理论[10],可以得到支持向量机回归表达式:
式中:ξ、ξ*为松弛因子;C、ε分别为核函数参数。
采用拉格朗日方法求解,可以将上述问题转化为对偶问题,即:
式中:K(xi,xj)=[θ(xi)θ(xj)]为支持向量机的核函数;ai,a*j为拉格朗日系数。
可得到SVM回归函数:
式中:核函数采用径向基函数(RBF,Radial Basis Function),即:K(xi,xj)=exp(-g│xi-xj│2); g为核函数的宽度。
果蝇算法是根据果蝇觅食行为而演化的一种参数优化的新方法[11-12],支持向量机的参数 C和 g对模型的预测效果影响显著,采用果蝇算法对支持向量机进行优化,优化流程如图1所示,具体步骤如下:
1) 初始化果蝇群体个数m1,种群迭代次数N1和果蝇初始位置X1,Y1。
式中:Rran为随机数;i=1,2,…,m1。
由于支持向量机优化参数为C和g,X和Y均为m1行两列矩阵。
2) 由于食物的位置无法获取,首先通过计算果蝇距原点的长度D,得到浓度量值S,然后对支持向量机参数进行赋值。
3) 样本数据采取3折交叉验证进行处理,得到果蝇个体的味道浓度F:
式中:n1为交叉验证集合个体的数目;yij为实际值;f(xij)为训练的预测值。
4) 搜索果蝇群体中最小的味道浓度。
式中:bF、bI分别为F的最小值及其位置。
5) 果蝇群体向上述浓度最大值处飞去。
6) 重复步骤2)~4),进行参数寻优,与此同时判别味道浓度是否优于上代的味道浓度,如果是则进行步骤5),否则继续迭代,直至达到指定迭代次数N1时循环结束。
3.1 开采沉陷预计数据的获取和评价指标的确定
选取采厚、煤层倾角、平均采深、工作面走向长度、工作面倾向长度和覆岩岩性作为开采沉陷的主要影响因素,对我国部分矿区35个工作面的相关数据进行搜集,数据样本见表1。
将其中1~25号观测数据作为训练样本,用于对模型进行训练;将26~35号观测数据作为预测样本,用来对训练好的模型进行检验。
选取平方相
关系数和均方误差、平均绝对误差、平均相对误差和训练时间作为预测模型的评价指标,各评价指标如下:
1) 均方误差(eMSE):
式中:N为预测样本数目;y'为预测样本值;y为实际值。
均方误差越小,说明回归的准确度也越高,即拟合曲线与实际的越接近。
2) 平方相关系数(R2):
式中:y-为预测样本实际值的平均值。
平方相关系数的大小是对预测值与实际值之间的相关程度的一种度量,其值越大即越接近1,表示预测值与实际值之间相关程度也越大,预测效果也就越好。
3) 平均绝对误差(eME):
4) 平均相对误差(eMPE):
5) 训练时间t。
3.2 FOA-SVM开采沉陷预测及结果分析
将影响开采沉陷的相关参数(如采厚、工作面斜长、煤层倾角等)作为预测模型的输入向量,最大下沉量作为预测模型的输出向量,建立基于果蝇算法和支持向量机的开采沉陷预测函数。
样本1~25为训练样本,样本26~35为预测样本。
由于各个输入参数的量纲和量级不同,对模型的预测精度影响较大,将样本数据的输入参数和输出参数进行归一化处理。
将果蝇算法[13]和支持向量机相结合建立开采沉陷的预计模型。
首先,采用训练集样本,应用果蝇算法对支持向量机模型中的核函数参数g和惩罚因子C进行优化,确定最优的支持向量机参数。
然后,将最优的参数C和g带入支持向量机预测模型中,采用预测集样本检验该模型的泛化能力和准确度。
其中支持向量机参数C和g的寻优范围分别为[0,500]和[0,100],群体个数为20,遗传代数为500。
果蝇算法优化后的支持向量机参数C和g分别为44.17和3.53,参数寻优后,训练样本下沉量的预测结果如图2所示,可以看出样本训练后其预测值与实际值非常接近,具有很好的预测效果。
应用训练好的支持向量机模型对预测集数据进行预测,结果如图3所示,预测的平方相关系数为0.966 7,预测的均方误差为0.006 8,具有较好的回归预测效果。
同时,采用GA-SVM[14]、PSO-SVM[15]和BP神经网络进行预测,预测结果如图4、图5和图6。
将预测结果和模型性能参数进行对比分析,见表2,由表看出,从误差角度分析,FOA-SVM预测样本的平均绝对误差等各指标均小于其他模型,该模型具有相对较高的预测准确率;从拟合能力分析,该模型的平方相关系数较其他模型高,该模型拟合能力相对较强。
将BP神经网络的预测效果与各SVM模型进行对比可知,各预测性能的评价指标均不如各个SVM模型,说明BP神经网络做非线性回归泛化能力不如SVM模型。
综上所述,果蝇算法融合SVM开采沉陷预测模型具有较高的泛化能力和较好的预测功能,并且模型的训练效率较高,可以对开采沉陷问题进行较好地预测。
1) 应用果蝇优化算法对支持向量机的参数进行优化处理,建立了FOA-SVM的新型预测模型。
2) 选取采厚、煤层倾角、平均采深、工作面走向长度、工作面倾向长度和覆岩岩性等对开采沉陷的影响因素,采用FOA-SVM预测模型对样本进行训练和预测,结果表明:模型具有较好的泛化能力和较强的预测功能,可以对开采沉陷的最大值进行有效的预计。
【相关文献】
[1]李春意,崔希民,郭增长,等.矿山开采沉陷对土地的影响[J].矿业安全与环保,2009,36(4):65-68.
[2]金锋,高振森.概率积分法在矿区开采沉陷预测中的应用[J].矿山测量,2011(2):47-48. [3]柴华彬,邹友峰,梁和平,等.开采沉陷岩移参数研究现状分析[J].河南理工大学学报:自然科学版,2013,32(5):567-570.
[4]吴侃,靳建明,戴仔强,等.开采沉陷在土体中传递的实验研究[J].煤炭学报,2002,
27(6):601-603.
[5]李新强,高延法,张庆松.开采沉陷动态数值仿真研究[J].岩石力学与工程学报,2004,23(1):86-90.
[6]曹丽文,姜振泉.人工神经网络在煤矿开采沉陷预计中的应用研究[J].中国矿业大学学报,2002,31(1): 26-29.
[7]张振,钮冰.基于支持向量机回归的抗癌药物活性研究[J].计算机与应用化学,2011,28(11):1 377-1 380.
[8]王春龙,刘建国,赵南京,等.基于支持向量机回归的水体重金属激光诱导击穿光谱定量分析研究[J].光学学报,2013,33(3):314-319.
[9]王晓丹,王积勤.支持向量机研究与应用[J].空军工程大学学报:自然科学版,2004,
5(3):49-55.
[10]张学工.关于统计学习理论与支持向量机[J].自动化学报,2000,26(1):32-43. [11] PAN Wentsao.A new fruit fly optimization algorithm: taking the financial distress model as an example[J].Knowledge-Based Systems,2011,26(7):69-74.
[12]韩俊英,刘成忠.基于细菌趋化的果蝇优化算法[J].计算机应用,2013,33(4):964-966. [13]牛培峰,麻红波,李国强,等.基于支持向量机和果蝇优化算法的循环流化床锅炉NOx排放特性研究[J].动力工程学报,2013,33(4):267-271.
[14]时静洁,陈利平,石宁,等.基于遗传算法的支持向量机预测有机物自燃点的研究[J].中国安全科学学报,2011,21(7):125-129.
[15]邱景平,邢军,姜谙男,等.基于粒子群支持向量机的矿岩强度指标的超声预测[J].东北大学学报:自然科学版,2012,33(5):731-734.。