基于大数据分析的电力运行数据异常检测
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于大数据分析的电力运行数据异常检测
发布时间:2022-07-06T07:00:43.853Z 来源:《福光技术》2022年14期作者:汪君国[导读] 就传统的电力数据异常数值检测技术效果差、精确度低等问题,本文提出以大数据技术为依托的一类电力数据异常值快速检测算法。
四川能投水富杨柳滩发电有限公司云南省水富市 657803
摘要:就传统的电力数据异常数值检测技术效果差、精确度低等问题,本文提出以大数据技术为依托的一类电力数据异常值快速检测算法。
应用该算法需要先构建基础数据框架,然后利用大数据技术来获取电力运行数据,通过应用均值聚类分类算法进行数据处理,可以迅速发现电力数据的其中异常数值。
经过仿真实验对比后得出,应有该算法一方面可以提升检测准确性,另一方面也可以提升电力数据检测效率。
关键词:大数据;电力运行大数据;异常值;检测算法
1引言
电能作为一项基础性能源,在工业生产领域和居民日常生活领域中国扮演着非常重要的角色,用电需求的不断增加要求电力建设规模趋于扩大化发展。
数字化技术的应用让传统的电力运行朝着智能化方向迈进。
但是在电力系统的实际运行过程中,一旦出现突发情况,可能会导致电力运行数据出现错误由此增加不必要的经济损失。
由此可见,针对电力数据异常进行检测至关重要。
2.异常值快速检测算法
大数据技术的广泛应用可以帮助电力企业从海量的电力运行部数据中挖掘出所需的重要信息。
这类信息对电力企业开展战略决策部署、排查电力系统安全隐患以及减少不必要的运营成本,确保电网系统安全稳定运行有着至关重要的意义大数据技术作为一类可实现海量信息数据搜索和存储的技术,将其应用于电力运行数据异常值检测可以显著提升检测质量[1]。
下图1为大数据基本架构。
2.1电力运行数据如何获取
在针对电力运行数据异常数值进行检测的过程中,首先要做好电力运行数据的获取工作。
该算法主要针对电网运行中的发电、输电、变电、配电以及用电这五个环节中的异常数据进行分析。
在上述五个环节中,电力数据均储存于不同的数据源之中,可通过数据基层获取。
而数据集成在可以依靠数据仓来实现。
如下图3所示,为数据仓结构示意图[3]。
图3 数据仓结构示意图
构建数据仓可以为实现数据的广泛集成创造便捷条件,电网企业则可以依靠获取到的运行数据来制定对应的决策。
如果想要让数据仓发挥关键作用需要启何为ETL?即实现数据仓运转的流水线[4]。
ETL是确保数据仓稳定流转的核心,对实现数据的更新迭代发挥着重作用。
换言之只要保障ETL能够正常流转,既可以确保数据仓的安全。
不同类型的数据仓应用到的ETL存在差异,且有着对应特征,需要结合实际情况分析,此处不再赘述。
2.2电力运行大数据处理
获取电力系统运行数据的过程中,容易受到多方面因素的影响,如果获取到运行数据质量较差可能会影响后续的检测结果精确度。
在数据检测中经常性会出现空值、噪声值以及极值等等,从而对检测参数干扰,有必要对数据进行处理,具体可采用数据降维、数据清洗以及数据标准化等措施。
数据降维即通过降低维度,借助少量的特征数据变量作为原始数据变量,减少数据之间的相关性,并从新变量中发现特征信息。
通过数据降维可有效降低数据量,简化计算难度以及消除数据中的噪音干扰。
电网企业常应用奇异值分析法、因子分析法来进行数据降维。
后者的应用频率较高,降维流程如下:
第一步:构建对应数据协方差矩阵[5];
第二步:对协方差矩阵的特征值和特征变量进行计算
第三步:对特征值进行排序
第四步:首先将 K个特征值作为主要分量,然后将其转化为新的特征矢量构造的新的数据空间,实现数据降维[6]。
在进行数据清洗的过程中,通过纠正电力系统运行中存在问题的数据,可显著提升数据质量。
需要进行数据清洗的数据具有以下三个普适特征:①数据不一致;②数据缺失;③数据重复。
针对不一致数据,秉承数据序列规则对其进行偏差检测和校正。
针对缺失数据处理时可以通过补齐数据或者删除数据的元组等方式。
如果想要确保数据完整,应尽量选择补齐数据该方法。
针对重复数据,可以通过计算数据之间的相似度来判断其是否存在重复情况,对重复数据可以进行合并。
对于来源模组不同的电力运行数据,应该其单位和量纲不同,数据与数据之间往往不能直接进行对比,需要经过标准化处理后进行对比分析。
在对数据进行标准化处理时,可借助该公式:
3.2测试指标 3.2.1数据准确性检测
如果样本数据中的类别不均衡时,可将直接分类结果的准确率进行算法评估,但是该结果误差值高,故采用 ROC 和 AUC分析检测准确性。
ROC曲线越靠近左上方,其分类效果越好;AUC是 ROC曲线下的区域,它代表了一个概率,AUC值越接近1,则该方法的检测效果
就越好[9]。
主要指算法运行一个周期需要的时长,时长和效率呈现反比例关系。
3.2.3结果分析
在应用算法对电力运行异常数据进行检测的过程中,当 ROC 曲线趋近于左上角时,AUC数值为 0.9025。
本算法运行一个周期需要耗费时长80s,检测时长适中,由此说明该算法检测准确率和效率较高[10]。
4.结束语
综上所述,电力系统的安全运行离不开对异常电力运行数据的精确检测,如果沿用过去的算法进行数据检测,无论是检测质量还是效率都偏低,因此可以应用以大数据为依托的算法来对电力运行数据进行检测,因此来确保电力系统的安全、稳定运行。
本文提出大数据算法中的模糊-C-均值聚类算法来对电力异常数据和正常数据进行分类,实现对异常数据的检测。
经过模拟仿真验证,和传统算法对比,应用该算法的检测效率和质量较高,实现了预期研究目标,对促进电力事业发展具有一定的参考和借鉴意义。
参考文献:
[1]林志坚,杜旭昕,黄朝凯,等.电力企业基于准实时数据电价异常分析的设计与应用[J]. 电子设计工程,2017,25(22):58-61.
[2]马娟娟,潘泉,梁彦,等.基于改进 Grassberger 熵随机森林分类器的目标检测[J]. 中国激光,2019,46(7):230-238. 勇攀永攀,门锟,吴俊阳.基于低秩模型的电力状态数据异常检测[J].计算机工程与应用,2019,55
[3]丹,梁,燕,吴,英,常永娟.基于大数据分析的电力运行数据异常检测示警方法[J].中国,试,2020,46(07):18-23.
[4]陆文祥.基于大数据的电力设备运行数据分析系统的设计[J].电子元器件与信息,术,2021,5(12):30-31+43.
[5]雯,黄,孜,庞,宇,,鑫,应,龙,吴晶.基于数据挖掘的多场景互联电力运行指标体系研究[J].电测与:表:1-8.
[6]张,音,勤,袁,江,吐尔伊布拉不,音,袁建党.风电运行数据嵌入电力系统仿真软件DDRTS的设计及实现[J].电网与清洁,源,2013,29(06):75-80.
[7]曹,峻,高,威,李,智,杨建林.数据网络与电力网络混合运行建模及其参与系统经济运行[J].中国电机工程,报,2018,38(05):1448-1456
[8]叶云,余勇,黄刘生,等.一种基于 top- m DkOutlier的隐私保护异常数据检测算法[J]. 小型微型计算机系统,2016,37(12):2638-2642.
[9]辛,中,胡,升,卢,燕,樊若雷.中国电力数据网络建设和运行中应注意的四个关系[J].电力系统自,化,1998(01):1-5.。