基于数据驱动模型的配电网故障预测和诊断
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于数据驱动模型的配电网故障预测和
诊断
摘要:随着大数据趋势的流行,数据驱动模型在配电网中变得越来越重要,
为了预防故障因素对配电网可靠性的冲击,本文根据杭州电网在五年间收集到的
故障信息,提出了一种基于数据驱动模型的配电网天气相关故障预测和诊断方法。
通过将历史故障数据和历史气象观测数据进行关联性比对,得到气象变量和故障
信息的训练数据集,通过线性判别分析法对该数据集进行分类训练,生成了故障
预测模型。
最后通过将气象数据的测试集代入预测模型,进行故障概率预测。
本
文实验验证了该方法的有效性。
关键词:配电网,数据驱动模型,线性判别分析法,故障预测。
Distribution Network Fault Prediction and Diagnosis Based on Data Driven Model
TianHanlin1,Min Yao2,Yu Danqi1
(1.State Network Hangzhou Qiantang District Power Supply Company, Hangzhou 311225)
(2. Zhejiang Dayou Group Co., Ltd., Hangzhou 311225)
Abstract: With the popularity of big data trend, data-driven model has become more and more important in distribution network. In order
to prevent the impact of fault factors on the reliability of
distribution network, this paper proposes a weather related fault prediction and diagnosis method based on data-driven model according
to the fault information collected by Hangzhou power grid in five years. By comparing historical fault data with historical
meteorological observation data, a training data set of meteorological variables and fault information is obtained. The data set is
classified and trained by linear discriminant analysis, and a fault prediction model is generated. Finally, the failure probability is predicted by substituting the test set of meteorological data into the prediction model. The effectiveness of this method is verified by experiments.
Key words: Distribution network, Data driven model, Linear discriminant analysis, Fault prediction.
0 引言
极端天气、外力破坏以及一些不可预测事件正不断影响配电网的安全稳定运行。
同时由于配电网规模较大和空间分散的特点[1],对配电网进行集中监测以捕捉这些故障的发生是很困难的,加装监测设备以实时显示配电网的运行数据不具可行性[2]。
基于专家的统计观察,某些故障会在一定的天气条件下发生[3],据此本文重点考察了天气情况对配电网运行的影响。
在仅考虑配电网历史故障和历史气象数据的情况下,本文的重点是预测配电网中压水平与天气相关的故障。
为此,我们使用了统计分析方法,其中将故障记录作为网络中事件发生的基本真实信息,并将最小的环境数据作为故障原因进行检查[4]。
本文所提出的一个实际应用是利用较长期的天气预报,以确定在特定天气条件下可能存在故障风险的配电网区域。
这种方法可用于加强客户或战略定位维护人员的故障风险意识,从而协助整个配电网络的管理[5]。
本文的研究表明,通过识别配电网区段历史中重复的故障原因和与之匹配的局部天气数据可实现配电网的故障预测[6]。
最后通过分析杭州市中压配电网五年间监测到的数据,建立了配电网气象故障检测模型,以预测给定配电网的天气相关故障的发生。
1原理介绍
本文的主要研究方法概括如下:通过将部分历史故障数据和历史气象观测数
据进行关联性比对,得到提取的气象变量和故障标签的训练数据集,通过线性判
别分析法(LDA)对该数据集进行分类训练,进而得到气象变量的故障概率,生成
故障预测模型,最后通过将气象数据的测试集代入预测模型中进行故障概率预测[7]。
本文中提出的数据分析方法总结在图1中。
图1故障预测模型结构框图
本文采用线性判别分析法对实验数据进行分类,线性判别分析法使用了一个
代表不同类的概率分布交集的线性决策边界。
当数据点在d维输入变量空间中使
用一条直线时,就实现了数据的线性分离。
该方法通过找到输入变量的线性组合,然后将高维数据点投影到该特征向量上。
之后将垂直于该向量的超平面作为用于
数据分类的线性决策边界[8]。
其中,对数据做出了两个简化的假设:(1)假设数据遵循高斯分布;(2)每个类的输入具有相同的协方差。
下面简要说明高维数据点的二值分类的线性判别分析法,其中每个数据点属于两类中的一个,即y=0或y=1。
假设p(|y=0)和p(|y=1)的条件概率密度函数服从正态分布,同时这些分布
的平均向量和协方差矩阵分别为(,)和(,)。
综上所述,如果似然比的对数
大于某个阈值T,则一个数据点属于第二类,即y=1,因此:
(1)
使用第二个假设,即输入类具有相同的协方差矩阵(),将上述表达式简化,决策准则成为点积上的阈值:
(2)
其中=(-)和c是某个阈值常数。
(3)
将数据点分类为这两类中的一种,它是由超平面(垂直于)一侧决定的。
阈值c决定了上述超平面的位置。
将上文提出的分类方法应用在数据中,以便在故障案例和无故障案例之间进行分类。
使用10倍交叉验证的方法,将所有的分类器应用在相同的数据集上,并进行比较,以找到表现更好的分类器。
在交叉验证中,数据集被分割成许多更小的子集,在该情况下为10个子集。
在这10个子集中,有9个作为训练集,1个作为测试集。
此过程重复10次,以便所有数据点都用于训练和测试[9]。
对于超过1个天气相关原因的故障数量的数据集,使用相同的过程对无故障和每种故障类型之间的数据进行分类[10]。
对不同的数据集重复此过程,以获得性能最佳的数据集和分类方法的最终结果。
本文用于评估分类性能的指标是分类精度、准确度和召回率[11],见式(4)-(6),其中TP为真阳性,TN为真阴性,FP为假阳性,FN为假阴性。
(4)
(5)
(6)
在故障预测的背景下,准确度是指分类器不将无故障标记为故障案例的能力,而召回率则是其查找所有故障案例的能力。
使用这些指标,评估了一种分类方法
在每个开发的数据集上的总体性能,并与其他分类器进行了比较。
2实验分析
本文利用了来自杭州配电网5年间的真实断层数据和历史气象观测数据,将
电网采集的气象数据分成16个变量,这16个变量被分为4组天气数据:日降雨量、日气温、小时风和小时气象观测[12]。
16个变量及分组情况见表1。
表1 选取的气象数据变量
利用天气故障信息和相应的天气测量数据,创建了一个新的数据集。
新数据集中包含了描述故障和无故障条件的天气变量,并被用作分类器的输入。
由于所选天气变量的测量值不能用于新数据集中的所有日期和时间,因此我们探索了许多不同的子集,包括每次天气变量和故障/无故障案例的不同组合。
然后这些大小不同的子集被用作分类器的输入,以便进行比较。
由上述过程产生的数据集定义了在本文后面使用的训练和测试数据集。
该故障记录涵盖了2013年至2018年期间,共16453起事件。
报告记录的15218个故障中,其中2437个是与天气有关的故障。
表2列出了与天气相关故障的具体原因和事件数。
表2 天气相关故障数量统计
原因数量
大风1023
雷击902
暴雪202
风携物
破坏
131
洪水70
结冰34
大雨34
日照25
霜冻16
表3总结了每个子集的数据集特征和FDA分类器的精度。
表3 不同子集精度值
天气变量
数
据规
模
精
度
(1)-(16)
8
6
.728
(1)-(13)、(15)-(16)
2
77
.764
(1)-30
(13)81.792
(1)-(4)、(9)-(13)
7
17
.743
表3中“天气变量”列中显示的数字对应于表1中的天气变量数字,精度列中的值是交叉验证过程产生的平均值。
上述结果表明,线性判别分析法在大多数情况下表现的很好,而将包含381个故障/无故障案例的数据集用作分类器的输入时,实现了最高精度。
以上结果表明,仅考虑常见天气变量,就可以以相对较高的精度预测与天气有关的故障的发生。
这种分析可以为电网运营商提供机会,以识别其网络中的脆弱区域,从而能够更好地应对潜在的与天气相关的故障。
3结论
本文提出了一种仅利用天气数据预报与天气相关的配电网故障事件的方法,在数据驱动模型的分析基础上将杭州中压配电网五年间的故障数据和历史气象观测数据进行关联性比对,得到了气象变量和故障信息的训练数据集,进而通过线性判别分析法对该数据集进行分类训练,生成了故障预测模型。
最后通过实验结果分析,在考虑向训练集输入部分天气变量的情况下,最终预测模型的预测精度可达到79.2%。
结果证明在监测较少的配电网检测环境下,可以通过气象观测数据对与天气相关的配电网故障事件进行预测。
参考文献
[1]叶慧男. 区域分布式电源规模发展预测模型及应用研究[D].华北电力大学(北京),2021.
Ye HN. Research on prediction model and application of regional distributed generation scale development [D]. North China Electric Power University (Beijing), 2021.
[2]李洪全,丁浩,王聪,商和龙,曹彦超,郭爱春,刘鼎立.配电台区数字化技术方案研究及应用[J].电工技术,2021(22):143-146.
Li HQ, Ding H, Wang C, Shang HL, Cao YC, Guo AC, Liu DL. Research and application of digital technology scheme in distribution station area [J]. Electrical technology, 2021 (22): 143-146.
[3]Chunming T, He X, Shuai Z, Jiang F (2017) Big data issues in smart grid a review. Renew Sustain Energy Rev 79:1099–1107.
[4]Panteli, M.; Pickering, C.; Wilkinson, S.; Dawson, R.; Mancarella, P. Power system resilience to extreme weather: Fragility modelling, probabilistic impact assessment, and adaptation measures. IEEE Trans. Power Syst. 2017, 32, 3747–3757.
[5]张天策,王剑晓,李庚银,周明,王宣元,刘蓁.面向高比例新能源接入的配
电网电压时空分布感知方法[J].电力系统自动化,2021,45(02):37-45.
Zhang TC, Wang JX, Li GY, Zhou M, Wang XY, Liu Z. Sensing method
of distribution network voltage space-time distribution for high proportion of new energy access [J]. Power system automation, 2021,45 (02): 37-45.
[6]田甜. 基于徐州物康线的配电网自动化系统设计与故障定位技术研究[D].中国矿业大学,2021.
Tian T. Research on distribution network automation system design and fault location technology based on Xuzhou Wukang line [D]. China University of mining and technology, 2021.
[7]Hu X, Sun Y, Gao J, Hu Y, Ju F, Yin B. Probabilistic Linear Discriminant Analysis Based on L1-Norm and Its Bayesian Variational Inference. IEEE Transactions on Cybernetics, Cybernetics, IEEE Transactions on, IEEE Trans Cybern. 2022; 52(3): 1616-1627.
[8]Wang, D., Li, L., Yu, H., & Wang, D. A Study on Decoupled Probabilistic Linear Discriminant Analysis. 2021 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), 2021 Asia-Pacific, 713–718.
[9]吴耀春.数据驱动的旋转机械智能故障辨识方法[D].兰州理工大学,2021.
Wu YC. Data driven intelligent fault identification method for rotating machinery [D]. Lanzhou University of technology, 2021.
[10]魏建安. 基于复杂不均衡数据分类方法的机械系统关键零部件的预测性维护研究[D].贵州大学,2021.
Wei JA. Research on predictive maintenance of key parts of mechanical system based on complex unbalanced data classification[D]. Guizhou University, 2021.
[11]南东亮,冯长有,曹晖,王昕,李玉敦,谭金龙.基于数据驱动的配电网停电预测模型[J].电工电能新技术,2021,40(12):56-63.
Nan DL, Feng CY, Cao H, Wang X, Li YD, Tan JL. Data driven power outage prediction model for distribution network [J]. New technology of electrical energy, 2021,40 (12): 56-63.
[12]郑忠平.基于关联规则和聚类分析的异常天气挖掘[D].电子科技大
学,2011.
Zheng ZP. Abnormal weather mining based on association rules and cluster analysis [D]. University of Electronic Science and technology, 2011.
作者简介:
田汉霖(1990—),男,汉族,浙江绍兴,硕士,工程师,主要研究方向为配电网故障预警技术、新型电力系统多能互补技术,浙江杭州钱塘区义蓬街道江东大道2199号智慧谷钱塘区供电公司***************************。
闵垚(1987—),男,本科,工程师,主要研究方向为配电网故障风险在线识别、故障精确诊断技术。
郁丹琦(1990—),男,本科,工程师,主要研究方向为柔性直流配电网、配电网储能技术。