基于组合模型的天然气管道短期负荷预测
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第60卷 第2期2024年3月
石 油 化 工 自 动 化
AUTOMATIONINPETRO CHEMICALINDUSTRY
Vol.60,No.2
Mar,2024
稿件收到日期:20230922,修改稿收到日期:20231210。
作者简介:陈宇光(1984—),男,2008年毕业于大庆职业学院油气
开采专业,现就职于中国石油天然气股份有限公司新疆油田分公
司吉庆油田作业区,从事油气产能建设项目管理工作,任工程师。
基于组合模型的天然气管道短期负荷预测
陈宇光
(中国石油天然气股份有限公司新疆油田分公司吉庆油田作业区,新疆吉木萨尔831700)
摘要:通过灰色关联分析(GRA)确定影响天然气管道短期负荷的主控因素,应用非线性变化策略对粒子群(PSO)算法的惯性权重和加速因子改进,利用优化算法寻找适合长短期记忆网络(LSTM)模型的超参数,形成GRAIPSOLSTM的组合模型,并与其余模型对比,以验证其准确性和可靠性。
结果表明:根据灰色关联度的大小,可以逐步删减对日负荷影响不大的因素,降低后续预测模型的复杂性;IPSO算法在迭代速度、收敛精度和寻优质量方面均有所提高,降低了LSTM模型超参数人工选取的局限性;该组合模型的平均绝对百分比误差(犕犃犘犈)和均方根误差(犚犕犛犈)均得到大幅降低,决定系数(犚2)和预测精度得到提高,证明了该组合模型可用于天然气管道短期负荷的准确预测。
关键词:短期负荷预测;灰色关联分析;粒子群算法;长短期记忆网络
中图分类号:TP273 文献标志码:A 文章编号:10077324(2024)02002005
犛犺狅狉狋 狋犲狉犿犔狅犪犱犉狅狉犲犮犪狊狋犻狀犵狅犳犖犪狋狌狉犪犾犌犪狊犘犻狆犲犾犻狀犲犅犪狊犲犱狅狀犆狅犿犫犻狀犪狋犻狅狀犕狅犱犲犾
ChenYuguang
(JiqingOilfieldOperationAreaofXinjiangOilfieldBranchofChinaNational
PetroleumCorporation,Jimsar,831700,China)
犃犫狊狋狉犪犮狋狊:Greycorrelationanalysis(GRA)isusedtodeterminethemaincontrolfactorsaffectingtheshort termloadofnaturalgaspipeline.Nonlinearchangestrategyisappliedtoimprovetheinertiaweightandaccelerationfactorofparticleswarmoptimization(PSO)algorithm.Theoptimizationalgorithmisusedtofindthehyperparameterssuitableforthelongshort termmemorynetwork(LSTM)model,andacombinationmodelofGRAIPSOLSTMisformed.Itiscomparedwithothermodelstoverifyitsaccuracyandreliability.Theresultsshow,accordingtothesizeofgreycorrelationdegree,thefactorsthathavelittleinfluenceondailyloadcanbedeletedstepbystep,thecomplexityofthesubsequentpredictionmodelcanbereduced.iterationspeed,convergenceaccuracyandoptimizationqualityareimprovedinIPSOalgorithm.ThelimitationofmanualselectionofLSTMmodelhyperparametersisreduced.TheMAPEandRMSEofthecombinedmodelaresharplyreduced,the犚2andthepredictionaccuracyareimproved.Itprovesthatthecombinedmodelcanbeusedtoaccuratelypredicttheshort termloadofnaturalgaspipelines.
犓犲狔狑狅狉犱狊:short termloadforecasting;greycorrelationanalysis;particleswarmoptimization;longshort termmemorynetwork
在第七十五届的联合国大会上,中国提出了在2030年前达到“碳中和、碳达峰”的目标。
天然气作为清洁能源在双碳目标的实现中占有重要地位,其消耗量和消费速度也逐年攀升,因此研究天然气负荷的预测技术具有重要意义,其结果对于协调气源、用户和燃气公司之间的气量合理规划及调配,实现产、供、销一体化建设,减少能源浪费具有积极意义[12]。
随着天然气应用阶段的不同,在管网建设初期,负荷预测主要用于气源生产能力和用户消费能力之间的平衡,侧重于中长期预测,精度要求相对较低;在管网输量平稳发展时期,负荷预测主要用于燃气公司的运行优化调度,侧重于短期预测,精度要求相对较高。
由此可见,短期负荷预测对于管道系统调峰能力和调度决策的重要性更大。
当前,关于负荷预测主要有传统模型和机器学习
模型。
传统模型以线性回归、指数平滑和灰色模
型等[
35]为主,但这类技术的应用背景通常是气源数量有限、用户数量较少的情况,缺乏对数据自身趋势影响因素的考虑和筛选,模型较为单一。
随着机器学习的发展,越来越多的学者应用了人工
神经网络[67]、支持向量机[8]等模型,但未考虑负荷数据属于时间序列,对于因变量与自变量之间的复杂非线性关系也处理不足。
长短期记忆网络(LSTM)
可以对数据进行更深层次的学习,实现时间序列的数据预测,但LSTM模型也面临着网络
超参数优化困难的问题[910]。
基于此,以某地区的
天然气日负荷数据为基础,首先利用灰色关联分析(GRA)
确定影响天然气短期负荷的因素,随后将数据集代入LSTM模型进行训练,结合优化的粒子群算法(IPSO)
对模型超参数进行优化,提升模型预测的可靠性,
并与其余机器学习模型对比,以验证模型的准确性和科学性。
1 天然气短期负荷影响因素分析
天然气短期负荷变化受多种因素的影响,属于非线性、非平稳的时间序列。
参照以往学者的研究和工程实践经验,初步选择温度因素、天气类型、日
期类型、
供暖情况和历史用气负荷作为影响因素,其中气象因素包括当日最高气温、当日最低气温、当日平均气温、前1日最高气温、前1日最低气温、前1日平均气温等;历史用气负荷包括前1日用气负荷、前2日用气负荷和前3日用气负荷。
天气类型、日期类型和供暖季周期的数据类型均为日期型,为便于后期
建模预测,
将其转化为编码数据,见表1所列。
表1 天气类型、日期类型和供暖季周期的数据编码
特征项目
天 气 类 型晴多云阴雷阵雨小雨、中雨大雨小雪、中雪大雪日期类型周一~周五周末节假日供暖季周期
非供暖季供暖季特征编码1234567812312
通过GRA模型计算影响因素与负荷之间的灰色关联度[11],将关联度较小的数据剔除,如式(1)~式(
4)所示:ζ犻(狋)=犪+ρ犫狘犡0(狋)-狓犻(狋)狘+ρ
犫(1)犪=min犻min狋狘犡0(狋)-狓犻(狋)狘(2)犫=max犻max狋狘犡0(
狋)-狓犻(狋)狘(3)狉犻=1狀∑狀狋=1
ζ犻(狋)(4)式中:ζ犻(
狋)———关联系数;犪,犫———参考序列和比较序列的差序列的最小值和最大值;犡0—
——参考序列;狓犻———第犻个影响因素的比较序列;狉犻—
——第犻个影响因素的灰色关联度;狀—
——数据量。
2 基于GRAIPSOLSTM的天然气短期负荷组合预测模型2.1 PSO的优化
PSO算法是通过模拟鸟类群体的觅食行为,
将鸟群比作粒子,通过个体之间的差异竞争和比
较实现全局优化[12]。
根据无免费午餐原理,任何一种原始算法均无法实现迭代速度、求解精度和稳定性上的最优。
对于PSO算法,惯性权重狑直接影响粒子的全局搜索和局部勘探能力,故采用非线性变化策略改进,如式(5)
所示:狑=狑max+狑min2+狑max-狑min2tanπ狋02犜-π4()
(5)
式中:狑max,狑min—
——惯性权重的最大值、最小值;狋0———当前迭代次数;犜———最大迭代次数。
以犜=100,狑max=0.8,狑min=0.4为例,改进前后的狑值如图1所示。
在前期,各粒子的目标值较为分散,狑值增速较快;在后期,各粒子的目标值趋于一致,狑值增速放缓。
图1 改进前后的狑值示意此外,加速因子犮1和犮2也会影响粒子飞行的速度和位置,同样采用非线性变化策略进行改进,如式(6)所示:犮1=2犮min-犮max-(犮min-犮max)2-狋0犜槡()
犮2=2犮max-犮min+(犮min-犮max)2-狋0犜槡()
烅烄烆
(6)1
2 第2期陈宇光.基于组合模型的天然气管道短期负荷预测
式中:犮max,犮min———加速因子的最大值和最小值。
以犜=100,犮max=2.7,犮min=0.7为例,改进前后的犮1和犮2值如图2所示。
犮1值逐渐减小,犮2值逐渐增大,粒子的寻优趋势逐渐从个体极值向全体极值转变,符合算法的一般规律。
图2 改进前后的犮1和犮2值示意2.2 长短期记忆网络
LSTM是循环神经网络的优化,可以很好地解决传统循环神经网络模型短期记忆差的缺点,改善了梯度弥散和梯度爆炸的问题。
LSTM通过增加输入门、遗忘门和输出门的门限,实现数据信息的更新、优化和储存[13]。
2.3 基于GRAIPSOLSTM的组合模型预测流程对于LSTM模型,其隐含层神经元和学习率是影响预测精度的超参数,一般通过人工经验选取,故存在一定的局限性和主观性,在此采用IPSO优化算法对其进行寻优。
首先,选取合适的数据集,利用GRA算法筛选影响天然气短期负荷的因素,降低后续预测模型的复杂性和多重非线性;随后,将数据集分为训练集和测试集,利用IPSO算法对LSTM模型的超参数寻优,获得最优IPSOLSTM模型;最后,将测试集代入最优模型,得到预测效果,并利用平均绝对百分比误差(犕犃犘犈),均方根误差(犚犕犛犈)和决定系数(犚2)3个经济学统计指标对效果进行评价。
3 实例分析
3.1 数据来源及筛选
以北方某天然气管网公司的日负荷数据为例,考虑到日负荷数据以年为单位呈周期性变化,非供暖期、过渡期及供暖期的负荷差异较大,故统计20200101—20221231的日负荷数据进行分析。
数据包括2个完整的供暖期和1个非完整的供暖期,适合大部分气量变化的工况类型。
采用GRA算法计算灰色关联度,如图3所示。
灰色关联度大于0.8的影响因素从大到小依次为前1日用气负荷、前1日平均气温、供暖情况、日期类型、前1日最高气温、天气类型、前1日最低气温等,说明当日用气负荷与历史用气负荷和前1日的气温关联性较大,这与人的体感对温度变化具有一定的适应能力,日负荷相对于气温而言存在滞后效应。
图3 不同影响因素的灰色关联度示意
以20220901—20221231的数据为测试集,20200101—20220831的数据为训练集,将灰色关联度小于0.8的因素按照从小到大的顺序依次剔除,分别代入预测模型,得到不同因素集下的预测效果,如图4所示。
随着影响因素的减少,初期预测精度没有太大变化,当影响因素减少至8个时,犕犃犘犈最小,之后影响因素再减少,犕犃犘犈有所增大,说明影响因素个数与数据信息量携带的多少相关,在影响因素为8个时,预测精度最高。
因此,在灰色关联度0.8以上影响因素的基础上,增加当日平均气温形成筛选后的数据集,为天然气日负荷,见表2所列,表2中的数字含义参考表1。
图4 不同因素集下的预测效果示意
22石油化工自动化第60卷
表2 日负荷部分样本数据
日 期
前一日用气负荷/m3前一日平均气温/℃供暖情况日期类型前一日最高气温/℃天气类型前一日最低气温/℃当日平均气温/℃天然气日负荷/m320200101
1134508-32382-64114549520200102
1108912-42323-5-2120626520200103109845822362-60120638620200104120361512247-2-2111694420200105
1194782
-322-1-9-21137444
202212301064349
-4
21-25-541111557202212311193961-3
22
3
1-7
51197049
3.2 参数设置设置IPSO算法的种群数量为40,维度为10,最大迭代次数为100,LSTM模型采用双隐含层,隐含层节点数范围为1~100,学习率范围为
0.001~0.01,以犚犕犛犈为适应度函数,对比IPSO和PSO算法的训练效果,如图5所示。
迭代初期,
IPSO算法的犚犕犛犈迅速下降,
而PSO算法需不断跳出局部最优解的限制,且平稳后IPSO算法的
犚犕犛犈远低于PSO算法,
说明改进算法的有效性和科学性。
经IPSO算法寻优后,双隐含层节点数分别为38,15,最优学习率为0.056,由此确定LSTM的最优网络结构为838151。
图5 IPSO和PSO算法的训练效果示意
3.3 模型预测
在上述最优模型的基础上,对测试集数据进行预测,同时为验证本文模型的优越性,采用PCAIPSOLSTM模型、GRAIPSOSVM模型、GRAIPSOBP模型进行对比,
预测值如图6所示,经济学统计指标结果见表3所列。
PCAIPSOLSTM模型选取累积贡献率大于85%的主成分,将12个影响因素聚合为6个;GRAIPSOSVM模型通过IPSO算法寻找SVM模型中的核函数参数和惩罚因子的最优值;
GRAIPSOBP模型通过IPSO算法寻找BP模
型中的输入权值和阈值。
图6 不同模型预测效果示意
表3 经济学统计指标结果
模 型犚犕犛犈/m3犕犃犘犈,%犚2PCAIPSOLSTM44008.542.010.9576GRAIPSOSVM35767.222.910.9761GRAIPSOBP11259.491.010.9971GRAIPSOLSTM5461.020.490.9993
本文模型与实际天然气管道负荷的接近程度更大,
预测效果最优,用于天然气管道短期负荷的预测可靠性最高。
PCAIPSOLSTM模型的预测效果最差,这与PCA算法的数据融合性较差,不同特征维度存在一定模糊性,方差较小的主成分也可能含有对样本差异影响较大的信息等因素有关。
GRAIPSOSVM模型、GRAIPSO
BP模型的预测效果相对较好
,但与本文模型相比,犚犕犛犈,犕犃犘犈和犚2还有一定差距,说明
3
2 第2期陈宇光.基于组合模型的天然气管道短期负荷预测
LSTM比SVM,BP模型的适应性更好,LSTM模型在误差大小、离散程度和拟合效果等方面的优化效果较好。
4 结 论
针对传统模型和单一机器学习模型在预测天然气短期负荷上的局限性,将GRA,IPSO和LSTM模型进行有机结合,形成组合预测模型,并结合实例进行分析,得到如下结论:
1)应用GRA算法后,原有的12个影响因素可以减少至8个,不但降低了模型训练的复杂性,还可提高测试集的预测精度。
2)对PSO算法改进后,其迭代速度、收敛精度和寻优质量均有提高,降低了LSTM模型超参数人工选取的局限性。
3)GRAIPSOLSTM组合模型在预测中的犚犕犛犈为5461.02m3,犕犃犘犈为0.49%,犚2为0.9993,与其余模型相比,预测精度大幅提升,证明了本文组合模型用于天然气短期负荷的预测是科学、合理的。
参考文献:
[1] 严铭卿,廉乐明,焦文玲,等.燃气负荷及其预测模型[J].煤气与热力,2003,23(05):259262,266.
[2] 杨奕,魏王颖,王佳豪.天然气负荷预测研究综述[J].辽宁化工,2023,52(01):104107.[3] WEIN,YINLH,LIC,etal.Forecastingthedailynaturalgasconsumptionwithanaccuratewhite boxmodel[J].Energy,2021,232:121036.
[4] LIUC,WUWZ,XIEWL,etal.ForecastingnaturalgasconsumptionofChinabyusinganovelfractionalgreymodel
withtimepowerterm[J].EnergyReports,2021,7:788
797.
[5] 孙相博,王岳.基于改进灰色GM(1,1)模型的天然气负荷预测[J].辽宁石油化工大学学报,2019,39(03):5257.[6] RUMELHARTDE,HINTONGE,WILLIAMSRJ.Learningrepresentationsbyback propagatingerrors[J].
Nature,1986,323(6088):533536.
[7] 宋娟,廖尚泰.基于BP神经网络与多元线性回归的短期燃气负荷预测[J].宁夏工程技术,2019,18(04):343346.[8] 冷俊.基于GASVM的城市天然气中长期负荷预测[J].内蒙古石油化工,2022,48(03):5860.
[9] 满建峰,侯磊,杨凯,等.基于PSOLSTM混合模型的天然气管道多用气节点负荷预测研究[J].油气与新能源,2022,34(06):91100.
[10] 周凯,吕海舟,马鹏岳,等.基于LSTMBPNN混合模型的天然气负荷预测研究[J].城市燃气,2022(07):611.[11] 周阳,王寿喜.基于GRAIFALSSVM模型的气田集输管道内腐蚀速率预测[J].腐蚀与防护,2022,43(08):8693.[12] 陈晓冬.基于PSOSAE神经网络的城市燃气管道剩余寿命预测[J].中国特种设备安全,2022,38(10):1317.[13] 陈川,陈冬林,何李凯.基于BPNNEMDLSTM组合模型的城市短期燃气负荷预测[J].安全与环境工程,2019,26
(01):149154,169.
櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄上海同欣推出高灵敏度火炬气流量计
燃烧有毒有害可燃气体的火炬气是炼油、石化等工厂的必备装置。
对进入火炬的气体进行计量,不仅是环境监测、计算污染物排放费的需要,也是企业节约能源、争取经济效益的需要。
火炬气流量属低静压低流速测量对象,量程比要求在100∶1甚至更大。
绝大多数时候是在超低流速条件下使用,而且不允许流量计对流体有大的阻力,以免影响事故状态下的紧急排放。
由于存在这样的特殊要求,给流量测量带来了较大困难。
上海同欣自动化仪表有限公司推出FDIpv型皮托双文丘里喷嘴火炬气流量计就是为解决这一难题而研发的。
基于ASME推荐的皮托双文丘里喷嘴,依靠其特殊的结构,使其输出的差压值比标准皮托管和均速管增大20倍左右,从而使原来无法测量的超低流速测量成为可能(超声流量计除外)。
该流量计在充分发展紊流空气流量标准装置上校准,在充分发展紊流条件下使用,准确度有保证,通过引入尼古拉兹模型对流场分布影响进行校正。
该流量计公称通径为犇犖200~犇犖3000,流体流速测量范围在0.3~30m/s,支持两档量程自动切换(与GF868相当),并且可扩展到0.3~100m/s(三档量程自动切换),在流体流速小于0.3m/s时可稳定显示,误差可忽略不计。
(上海同欣自动化仪表有限公司)
42石油化工自动化第60卷 。