最大熵和高斯模型在锂电池缺陷识别中的应用_陈功
用于电池寿命评估的锂离子电池退化建模
用于电池寿命评估的锂离子电池退化建模锂离子电池是目前应用最广泛的可充电电池之一,广泛应用于手机、笔记本电脑、电动汽车等领域。
然而,随着使用时间的增长,锂离子电池性能会逐渐下降,导致电池寿命缩短。
因此,对于电池寿命的评估和预测成为了重要的研究方向之一。
本文将从锂离子电池退化的原因、退化建模方法以及电池寿命评估等方面进行探讨。
锂离子电池的退化主要是由于电池内部结构的变化以及材料性能的衰减所引起的。
常见的退化原因包括电解液的挥发、电极材料的结构破坏、电解液中的溶质积聚等。
这些退化过程会导致电池内阻增加、容量衰减、循环性能下降等现象,最终影响电池的寿命。
针对锂离子电池退化建模的方法有很多种,常见的方法包括经验模型、物理模型和统计模型等。
经验模型基于大量的实验数据,通过拟合实验结果得到一些经验公式,可以用于描述电池的退化特性。
物理模型则基于电池的内部物理过程,通过建立一系列方程来描述电池的退化过程。
统计模型则通过对大量电池寿命数据的统计分析,得到一些退化规律,并用于预测电池的寿命。
在电池寿命评估方面,常见的方法包括循环寿命测试和容量衰减测试。
循环寿命测试是将电池在特定条件下进行循环充放电,通过观察电池的性能变化来评估电池的寿命。
容量衰减测试则是测量电池的容量随时间的变化,通过分析容量衰减曲线来评估电池的寿命。
此外,还可以通过对电池内部参数的监测和分析来评估电池的寿命,如内阻、电池温度等。
在实际应用中,电池寿命评估对于电动汽车等领域尤为重要。
电动汽车的电池寿命直接影响着车辆的续航里程和使用寿命,因此对电池的寿命进行准确评估可以指导电动车的使用和维护。
此外,电池寿命评估还可以应用于电池的优化设计和制造过程中,提高电池的性能和寿命。
锂离子电池退化建模是电池寿命评估的重要内容之一。
通过对电池退化原因的研究,建立合适的退化模型,加以合理的寿命评估方法,可以实现对锂离子电池寿命的准确预测和评估。
这对于提高电池的使用性能和延长电池的寿命具有重要的意义。
锂离子电池的退化数据建模与状态估计
锂离子电池的退化数据建模与状态估计锂离子电池的退化数据建模与状态估计近年来,随着锂离子电池在移动电子设备、电动汽车等领域的广泛应用,人们对于锂离子电池的退化问题越来越关注。
在使用过程中,锂离子电池会逐渐损耗,其容量和性能会不断下降,这被称为电池的退化。
了解并准确估计锂离子电池的退化情况,对于延长电池使用寿命、提高电池能量密度以及保证电池的安全性至关重要。
因此,锂离子电池的退化数据建模与状态估计成为了一个重要研究领域。
锂离子电池的退化是一个复杂的过程,受到多种因素的影响。
首先,锂离子电池的使用环境会对其退化产生重要影响。
温度是其中一个重要的因素,过高或过低的温度会加速电池的退化。
此外,充放电速率、深度充放电、充电过流、过充电、过放电等操作也会引起电池的退化。
电池的退化过程中,电极材料的结构和化学组成的改变是主要原因之一。
在锂离子电池的使用过程中,正极和负极的材料在嵌锂和脱锂的过程中会发生膨胀和收缩,导致电极材料的结构的破坏。
此外,电解质的降解和不可逆反应也会对电池的退化起到重要作用。
为了准确建模锂离子电池的退化过程,研究人员通过大量的实验数据进行统计分析。
退化数据的建模涉及到多个方面的内容,包括容量退化模型、内阻增长模型、电极材料的物理化学模型等。
容量退化模型是研究人员研究最多,应用最广泛的退化模型之一。
容量退化是指锂离子电池的容量随着充放电循环次数的增加而逐渐下降。
目前,常用的容量退化模型主要有线性模型、极小容量退化模型和容量损耗模型等。
在锂离子电池的状态估计中,电池的剩余寿命评估是一个重要的研究内容。
剩余寿命评估是指通过对电池已经充放电循环次数、电流和温度等参数的监测,来评估电池还能正常工作的时间。
剩余寿命评估可以帮助用户判断电池是否需要更换,从而避免在使用过程中出现电池能量不足的情况。
目前,常用的剩余寿命评估方法主要有基于统计学方法的剩余寿命评估和基于动态模型的剩余寿命评估。
基于统计学方法的剩余寿命评估主要通过对已经退化的电池进行退化模型的参数拟合,从而预测电池未来的寿命。
锂动力电池动态一致性评价方法的研究
锂动力电池动态一致性评价方法的研究摘要锂动力电池,以其比容量高和长循环寿命,在动力电池领域作为技术革新的重要支持。
尽管制造工艺以及使用管理技术不断提高,在实际的使用中,都需要将各单体电池,通过串联或并联的方式成组使用,而在长期的使用后,电池组都会出现性能大幅衰减的现象。
经研究表明,这是由于构成电池组的单体电池在一致性上出现了明显的差异。
因此,为了让动力电池组在长期使用过程中,都能一直保持有较高的性能,延长整个电池组的使用寿命,就需要对组内单体电池的一致性有较好的判断,以便于电池管理系统(BMS)以及用户对其进行及时维护。
对动力电池的一致性概念进行了研究,经过大量的实验,并对实验数据进行分析发现在多个性能参数中,电池的荷电状态(SOC)和动力电池的工作电压(CCV)能够全面的显示电池当前的状态,同时也是电池动态特性的集中体现,可以作为评价电池一致性评价的技术指标。
本文建立并改进了动力电池的等效模型,在模型建立过程中,引入了权A m,来更好地反映这一差异的存在。
文中采用平方根容积卡尔曼值向量()滤波法,结合强跟踪滤波理论(SCKF-STF)对SOC进行预测,给出了预测结果和误差分析,在算法的前端设计并加入了多重滤波算法,对混入的噪声进行处理,并结合针对一致性差异的等效模型,进一步提高算法的预测精度,同时加入了仿真分析对方案的可行性进行了验证。
文中采用数理统计的F分布概率密度函数实现用SOC和工作电压对一致性评价的综合分析。
根据动力电池的实际参数,给出相应对概率密度函数的描述,进而得到概率密度曲线,通过设定一致性预警阈值,得出符合预期的结果区域,将实验数据代入函数表达式后得出的计算结果,如果计算结果在该区域中,则可以得出该组实验电池的一致性较好的结论。
关键词锂动力电池;SOC预测;一致性评价;统计学原理- I -Evaluation on the Dynamic Consistency of Li-IonPower BatteryAbstractLi-ion power battery has been the solid foundation for technology innovation within power battery field with its unique discharge specific capacity and long cycle life. Cell batteries should be connected in series to be applied for large appliance, though the rapid development in crafts and management. However, the general performance of the formed battery pack may suffer a apparent decay after a long term application, due to the deterioration in the consistency of the battery based on large quantities of research. A better evaluation on the consistency of battery is the very basis to keep better performance of the battery, to extend the cycle life, as well as to give advantage to battery management system (BMS) with maintenance.Various experiments are conducted to get to essence of consistency of battery, as to analyze the performance index of power battery for the typical ones for the current state of battery in this paper. State of charge, as well as SOC and closed circuit voltage (CCV) are selected with the research results for the performance index of consistency.The equivalent circuit model is established and improved with weightA m is involved to embrace the discrepancy in the very battery of the victor ()formed battery pack in the paper. Square-Cubature-Kalman-Filter, combined with Strong-Tracking Filter (SCKF-STF) algorithm is involved for SOC prediction with corresponding simulation and error analysis. To obtain SOC prediction result with higher precision, multiple filter algorithm is designed ahead of the SCKF-STF algorithm to tackle with the involved noise with input data. The comparison simulation of SOC prediction is conducted with optimized SCKF-STF algorithm and improved model. The corresponding simulation result and error analysis is conducted with the single SCKF-STF for the adtantage of the optimized algorithm.- II -The probability density function of F-distribution with principle of statics is involved to obtain the evaluation on consistency of battery with SOC and CCV as performance index. The corresponding description for probability density function is deducted with actual index of experimented battery, as well as the probability density curve. A pre-designed trust zone can be settled on the curve with designed warning value. The zone of which is applied to make comparison with the result from deducted function with experiment data to evaluate the general consistency of the experimented battery.Keywords Li-ion power battery, Prediction for SOC, Evaluation of the consistency of battery, Principle of statistics- III -目录摘要 (I)Abstract (II)第1章绪论 (1)1.1 课题研究的目的及意义 (1)1.2 SOC预测方法的现状研究 (2)1.2.1 SOC预测方法的发展趋势 (3)1.2.2 常用SOC预测的算法综述 (3)1.3 锂动力电池一致性评价的现状研究 (5)1.3.1 一致性评价的研究方向 (5)1.3.2 基于参数的评价方法综述 (5)1.4 本文主要研究内容 (6)第2章锂动力电池不一致性的研究 (8)2.1 电池一致性的概念阐述 (8)2.2 不一致性的产生机理 (8)2.2.1 分析生产和储存环节 (8)2.2.2 分析成组使用环节 (10)2.3 判定电池不一致的条件 (11)2.3.1 性能参数分析 (11)2.3.2 状态参数分析 (12)2.4 电池不一致的危害 (12)2.5 改善电池不一致的方法 (13)2.5.1 改善分选环节 (13)2.5.2 改善电池均衡环节 (14)2.5.3 其它方法 (15)2.6 本章小结 (15)第3章锂动力电池SOC预测算法的研究与改进 (16)3.1 SOC预测的影响因素分析 (16)3.2 电池等效模型的建立 (17)3.2.1 等效模型的数学推导 (18)3.2.2 针对一致性评价的模型修正 (21)3.3 SCKF-STF算法的研究与仿真 (22)3.3.1 强跟踪滤波算法研究 (23)3.3.2 动力电池SOC的预测 (24)3.3.3 结果仿真与误差分析 (27)3.4 基于参数和模型修正的电池SOC预测及仿真 (29)3.4.1 性能参数修正 (29)3.4.2 对SCKF-STF预测算法的优化 (30)3.4.3 算法的仿真分析 (34)3.5 本章小结 (35)第4章基于F分布的动力电池动态一致性评价 (36)4.1 常用动态一致性评价方法的分析 (36)4.1.1 工作电压标准差评价法 (36)4.1.2 SOC离散度评价法 (37)4.2 基于F分布的动态一致性评价方法 (39)4.2.1 工作电压离散度的统计学分析 (39)4.2.2 电池不一致性的数学描述 (40)4.2.3 基于F分布的方法描述与数学推导 (41)4.3 电池一致性评价方法的验证 (44)4.4 本章小结 (46)结论 (47)参考文献 (48)攻读学位期间发表的学术论文 (53)致谢 (54)第1章绪论近年来尽管行业发展的速度逐年攀升,但快速发展所带来的环境破坏与严重污染不得不让人们关注的重点转向资源的可持续利用和能源的清洁可再生方面[1]。
电池熵变测试
电池熵变测试引言:电池是我们日常生活中常见的能量储存装置,它通过化学反应将化学能转化为电能。
但是,电池在使用过程中会产生熵变,导致电池性能下降。
因此,进行电池熵变测试可以帮助我们评估电池的寿命和性能。
一、电池的熵变概念熵变是热力学中的概念,表示系统的无序程度的增加。
在电池中,熵变主要来自于化学反应过程中产生的热量和离子扩散引起的电极材料损耗。
电池的熵变测试就是通过测量电池在使用过程中的熵变大小,来评估电池的性能和寿命。
二、电池熵变测试方法1. 电池放电测试:将电池连接到负载上,让电池放电,测量电池的电压随时间的变化。
通过分析电压曲线,可以了解电池的放电过程和熵变情况。
电压下降速度越快,熵变越大,电池性能越差。
2. 电池内阻测试:使用专业的电池内阻测试仪,通过测量电池内阻来评估电池的性能。
内阻越大,熵变越大,电池性能越差。
3. 温度测试:电池在使用过程中会产生热量,温度的升高会加速熵变的发生。
通过测量电池的温度变化,可以了解电池的熵变情况。
温度升高越快,熵变越大,电池性能越差。
三、电池熵变测试的意义1. 评估电池性能:通过电池熵变测试,可以了解电池的熵变大小,从而评估电池的性能。
熵变越大,代表电池的性能越差,寿命越短。
2. 优化电池设计:电池熵变测试可以帮助电池制造商了解电池在使用过程中的不足之处,从而优化电池的设计和制造工艺,提高电池的性能和寿命。
3. 指导电池使用:通过电池熵变测试结果,可以给用户提供电池的使用指导,比如避免长时间高负载放电,避免过度充放电等,延长电池的使用寿命。
四、电池熵变测试的局限性1. 测试时间较长:电池熵变测试需要较长的时间才能得到准确的结果,这对于电池制造商和用户来说都是一种不便。
2. 测试成本较高:进行电池熵变测试需要专业的测试设备和仪器,这增加了成本和技术要求。
3. 结果的解读难度大:电池熵变测试结果需要通过专业的人员进行解读和分析,对于一般用户来说较为困难。
结论:电池熵变测试是评估电池性能和寿命的重要手段,通过测量电池的熵变大小,可以了解电池的性能和寿命情况。
基于最大熵原理的电能质量综合评估模型
( .n e noi EetcPw rGo pC . Ld , h o 0 0 2 , hn ;.n e noi H ai 1 Inr Mogl lcr o e ru o ,t. Hoht 10 0 C ia 2 Inr a i Mogl uda a n H i nxl WidFr H h o 0 2 , hn ) ut gi n am, oht 0 0 C ia e e 1 0
Absr c : mig a h h rceit so h o rh n ie e au t n o o r q ai , e d lfra ssig t a t Ai n tte c aa trs c fte c mpe e sv v lai fp we u ly a n w mo e o se s i o t n
A o rh nieP we ai au t n C mp e e s o rQu lyEv lai v t o
M o e s d o h a i u t o y Pr ncpl d lBa e n t e M x m m En r p i i e
L /Xi o h , AO e g T M u i , a —u G M n , E q l REN igu n e Ha - a g
1 引 言
电能质量 综合 评估 是 电能质 量研 究 的重要 组成 部
硬件支持 , 另一方面对 电能质从技术性和服务性两方面
对 电能 质量 的指标 进 行 衡 量 , 出采 用 模糊 原 理综 合 提 多 项指标 , 现 电 能 质 量 定 量 评 价 。文 献 [ 提 出先 实 4] 确定 各 电能质 量指 标 的 隶 属 度 函数 及 其 隶属 度 , 采 再 用模 糊综 合评 价方 法 的二 级评 判模 型对 电能质量 进行 综合 评判 , 电力 市场 环 境 下 的 电能 的优 质 优价 服 务 为 分析 提供 了基 础 。文献 [ ] 用 三 角模 糊数 的模糊层 5应 次分 析法确 定 电 能质 量 各 指标 的 主观 权 重 , 用 离差 运 最 大 化方法 确定 各 指标 的客 观 权 重 , 过 多 目标 决 策 通
锂离子动力电池参数辨识与状态估计
( School of Automotive Engineering , Tongji Universit y ,Shanghai 201804 ,China)
Abstract : Based on an analysis of voltage response of constant current pulse discharge , t he elect ric cir2 cuit model of FreedomCar is revised and also verified by test s. Then t he dynamic characterization of t he battery is analyzed on t he basis of input s and output s of battery management system in hybrid elec2 t ric vehicle ( HEV) . The met hods of on2line parameters identification are improved. According to t he parameter identification and application condition of HEV , a“current2time window”met hod of SOC estimation is put forward and realized on STAR T23 f uel cell car. Key words : li2ion power battery ; battery management system ; state of charge ( SOC) ; parameter
基于双高斯模型的锂电池剩余使用寿命预测方法
基于双高斯模型的锂电池剩余使用寿命预测方法
李彦梅;刘惠汉;张朝龙;罗来劲
【期刊名称】《电气工程学报》
【年(卷),期】2022(17)4
【摘要】准确的剩余使用寿命预测对锂离子电池的性能最大化和维护是至关重要的。
为了对锂离子电池的剩余使用寿命进行精准预测,提出一种新颖的双高斯模型用于描述锂离子电池老化过程。
首先对常用的几种电池容量衰减经验模型进行分析与评价,并提出性能更优的双高斯模型。
随后,基于历史容量数据,利用粒子滤波(Particle filter,PF)技术建立双高斯老化模型,同时引入拟合相关系数与均方根误差评估模型。
最后,根据实验室的单体电池老化数据和美国国家航空航天局的电池老化数据,进行剩余使用寿命预测试验,以验证所提出的老化模型的有效性。
试验结果表明,所提出的老化模型可以准确地预测锂电池剩余使用寿命,与其他模型相比,预测误差得到明显改善。
【总页数】9页(P32-40)
【作者】李彦梅;刘惠汉;张朝龙;罗来劲
【作者单位】安庆师范大学电子工程与智能制造学院;金陵科技学院智能科学与控制工程学院
【正文语种】中文
【中图分类】TM912
【相关文献】
1.基于混合高斯输出贝叶斯信念网络模型的设备退化状态识别与剩余使用寿命预测方法研究
2.基于ARIMA和PF的锂电池剩余使用寿命预测方法
3.基于ARIMA和PF的锂电池剩余使用寿命预测方法
4.基于ARIMA模型的工业锂电池剩余使用寿命预测
5.动力锂电池剩余使用寿命的预测方法研究
因版权原因,仅展示原文概要,查看原文内容请购买。
锂离子电池电化学降阶模型性能对比
物 理 学 报 Acta Phys. Sin. Vol. 70, No. 13 (2021) 138801
锂离子电池电化学降阶模型性能对比*
李涛 程夕明† 胡晨华
(北京理工大学机械与车辆学院, 电动车辆国家工程实验室, 北京 100081)
(2020 年 11 月 11 日收到; 2021 年 2 月 16 日收到修改稿)
138801-2
物 理 学 报 Acta Phys. Sin. Vol. 70, No. 13 (2021) 138801
P2D 模型中通过半电池结构测量电极电势. 其他 参数可以通过实验测量、参数优化等方式提取, LPM 具有更好的工程应用前景.
目前, 已有学者对比研究了 P2D 模型、SPM 和 ECM 的性能[17], 但还没有对 P2D, SPM 和 LPM 开展对比研究, 对 LPM 的模型特点、适用范围等 因素尚不明确. 为此, 本文通过相同的模型参数, 分别建立三种电化学机理模型, 并且仿真分析. 在 均匀电流密度条件下, 由 P2D 模型的液相浓差过 电压项补偿 LPM 对其进行性能优化, 以逼近 P2D 模型的电压. 而且, 通过恒流放电、动态电应力测 试 (dynamic stress test, DST) 工况和脉冲放电工 况对优化的 LPM 模型性能进行验证.
基于CNN-Transformer的锂离子电池健康状态估计
成为基于数据驱动的 SOH 估计的研究热点之一 [9] 。 孙
本研究中,锂离子电池的 SOH 采用当前最大可用容量
域峰的最大值以及面积作为表征电池老化 的 健 康 指
容量为 C r ,初始额定容量为 C o 。
时间规整图将电压曲线转换成相位差异曲线,并提取 4
离子电池的安全运行 [3] 。 SOH 目前尚无标准定义,在
Technology and Business University Natural Science Edition
2024 41 2
66—73.
第2期
陈国麟,等:基于 CNN-Transformer 的锂离子电池健康状态估计
67
layers. Results In this study experimental validation was performed using the MIT dataset a comparative analysis was
performed with convolutional neural network and long and short-term memory neural network and the root mean square
error and mean absolute error of the proposed method were the lowest which were 0. 11 and 0. 08 and the minimum
关键词:锂离子电池;健康状态;卷积神经网络;Transformer
中图分类号:TM912 文献标识码:A doi:10. 16055 / j. issn. 1672 - 058X. 2024. 0002. 009
一种电动汽车锂电池剩余电荷估算方法及装置[发明专利]
专利名称:一种电动汽车锂电池剩余电荷估算方法及装置专利类型:发明专利
发明人:陈文礼,何国军,侯兴哲,郑可,何蓓,汪会财,杨芾藜,胡晓锐,宫林,籍勇亮,刘型志
申请号:CN201710166798.0
申请日:20170320
公开号:CN106918787A
公开日:
20170704
专利内容由知识产权出版社提供
摘要:本发明公开了一种电动汽车锂电池剩余电荷估算方法及装置,它包括:通过建立锂电池的等效电路模型,根据模型得到输出电压U和开路电压U的计算方法,进行模型辨识,将辨识得到的参数值用来计算开路电压,通过温度传感器对温度进行实时测量,再将实时开路电压与相应测量的温度对应的U‑SOC曲线对照后得到相应的剩余电荷值,最后对开路电压进行修正,从而得到更准确的
U‑SOC曲线;本发明取得的有益效果:1、解决了开路电压法估算锂电池剩余电荷方法的缺点,能实现剩余电荷的实时预估;2、建立了一种等效电路模型,能实时估算开路电压;3、实现了电动汽车锂电池剩余电荷实时估算的方法;4、能实时测定锂电池在不同温度环境下的剩余电荷值。
申请人:国网重庆市电力公司电力科学研究院,国家电网公司
地址:401123 重庆市渝北区北部新区黄山大道中段80号办公综合楼
国籍:CN
代理机构:北京众合诚成知识产权代理有限公司
代理人:胡柯
更多信息请下载全文后查看。
基于熵值的动力电池大数据故障预警算法解析
基于熵值的动力电池大数据故障预警算法解
析
动力电池是电动车辆中至关重要的组成部分,而故障预警算法是确保电动车辆安全运行的关键技术之一。
基于熵值的动力电池大数据故障预警算法正是一种有效的解决方案。
本文将对该算法进行解析,并探讨其在动力电池故障预警中的应用。
基于熵值的算法是一种常用的数据分析方法,它通过计算系统的熵值来衡量系统的不确定性和复杂程度。
在动力电池大数据故障预警中,该算法可以通过对动力电池的数据进行熵值计算,从而分析电池状态的稳定性和异常程度,提前发现故障风险。
该算法需要收集大量的动力电池数据。
这些数据包括电池的温度、电压、电流等信息,以及其他相关的环境参数。
通过采集这些数据并建立数据库,算法可以对电池的工作状态进行实时监测和分析。
算法依靠熵值计算来评估电池状态的稳定性。
熵值越大,表示系统的不确定性和复杂程度越高,系统存在故障的风险也就越大。
因此,通过对动力电池数据的熵值计算,可以对电池的状态进行评估,并提前预警可能出现的故障。
该算法还可以通过熵值计算来发现电池的异常情况。
当电池的工作状态发生异常时,系统的熵值也会发生变化。
通过监测和分析电池数据的熵值变化,算法可以及时识别出电池的异常情况,为后续的维护和故障处理提供重要参考。
基于熵值的动力电池大数据故障预警算法是一种有效的方法,能够对动力电池进行实时监测和预警。
通过对动力电池数据的熵值计算,该算法可以评估电池的状态稳定性,预测故障风险,并能够发现电池的异常情况。
未来,这种算法有望在电动车辆行业中得到更广泛的应用,提高电池的安全性和可靠性。
一种对高压直流输电换相失败进行识别的模型及预测方法[发明专利]
专利名称:一种对高压直流输电换相失败进行识别的模型及预测方法
专利类型:发明专利
发明人:陈铁,蔡东阁,何思敏,曹颖
申请号:CN202210224288.5
申请日:20220307
公开号:CN114629155A
公开日:
20220614
专利内容由知识产权出版社提供
摘要:一种对高压直流输电换相失败进行识别的模型及预测方法,其模型包括数据采集模块、特征提取模块、决策模块、输出模块;数据采集模块用于对原始数据进行采集及数据预处理;特征提取模块用于从原始数据中进行特征提取并进行分类,并对所提特征数据进行计算将其转化为分类器可用的样本集;决策模块用于进行首次换相失败识别及后续换相失败预测;输出模块用于输出预测结果。
发明的目的是为了对首次换相失败进行识别并对后续换相失败进行预测,以解决现有的换相失败识别、预测方法适用性不足和准确性差且预测速度慢的技术问题。
申请人:三峡大学
地址:443002 湖北省宜昌市西陵区大学路8号
国籍:CN
代理机构:宜昌市三峡专利事务所
代理人:余山
更多信息请下载全文后查看。
基于改进决策树的配电网多源数据快速检索
基于改进决策树的配电网多源数据快速检索①柯 强1, 陈志华1, 胡经伟1, 陈焕军2, 邳志旺2, 张 晗2, 周雪松31(国网黄冈供电公司 经济技术研究所, 黄冈 438701)2(天津楚能电力技术有限公司, 天津 300392)3(天津理工大学 电气电子工程学院, 天津 300384)通讯作者: 陈志华摘 要: 当前, 电网中含有海量的多源信息数据, 但是由于数据体量大、种类多、维度高, 难以实现高效有效的数据检索. 因此本文根据实际电力运行系统的数据结构及多源数据库样本分析, 提出了一种基于互信息的改进决策树算法作为数据挖掘内核, 并提出适用于电力系统的并行处理架构, 可实现多源数据的快速、有效信息检索, 并有效处理实时数据. 在搜索时根据代表性特征子集直接从多源信息原始数据提取信息, 判断索引信息量并排序形成决策树模型, 通过Spark MapReduce Python 数据分解并行检索实现多源数据同时提取, 缩短检索时间. 本文以某区域电网数据库为算例进行模拟验证, 结果表明: 该方法可以实现配电网的多源异构信息提取, 有效避免重复数据, 满足在线工程决策要求.关键词: 决策树; 并行计算; 信息检索; 多源异构引用格式: 柯强,陈志华,胡经伟,陈焕军,邳志旺,张晗,周雪松.基于改进决策树的配电网多源数据快速检索.计算机系统应用,2021,30(2):97–102./1003-3254/7796.htmlFast Multi-Source Data Retrieval Method for Distribution Network Based on Improved Decision TreeKE Qiang 1, CHEN Zhi-Hua 1, HU Jing-Wei 1, CHEN Huan-Jun 2, PI Zhi-Wang 2, ZHANG Han 2, ZHOU Xue-Song 31(Economic and Technical Research Institute, State Grid Huanggang Power Supply Company, Huanggang 438701, China)2(Tianjin Chuneng Electric Power Technology Company, Tianjin 300392, China)3(School of Electrical and Electronic Engineering, Tianjing University of Technology, Tianjin 300384, China)Abstract : At present, the power grid contains a large number of multi-source information data, but due to the large size of the data types and high multi-dimensions, it is difficult to achieve effective data retrieval.According to the data structure of actual power operation system and multi-source database sample analysis, an improved decision tree algorithm based on mutual information is proposed as the kernel of data mining, and a parallel processing architecture suitable for power system is put forward, which can retrieve multi-source data fast and efficiently. The information is directly extracted from the original data of multi-source information according to the representative feature subset during searching. The index information is judged and sorted to form the decision tree model, and multi-source data is extracted simultaneously through Spark MapReduce Python data decomposition and parallel retrieval, so as to shorten the retrieval time. Taking a regional power grid database as an example to simulate and verify, the results show that the method can realize multi-source heterogeneous information extraction of power distribution network, effectively avoid duplicate data, and meet the requirements of online engineering decision.Key words : decision-making tree; parallel computing; information retrieval; multi-source heterogeneous计算机系统应用 ISSN 1003-3254, CODEN CSAOBNE-mail: Computer Systems & Applications,2021,30(2):97−102 [doi: 10.15888/ki.csa.007796] ©中国科学院软件研究所版权所有.Tel: +86-10-62661041① 基金项目: 国家自然科学基金(51877152)Foundation item: National Natural Science Foundation of China (51877152)收稿时间: 2020-06-25; 修改时间: 2020-07-27; 采用时间: 2020-08-10; csa 在线出版时间: 2021-01-2797随着智能电网的不断建设, 电网中运行和维护所产生的数据量呈指数形式增长, 电网数据不断增加, 电力行业开始进入大数据时代[1]. 电力大数据除了包含大数据的广义4V特征, 即数据量庞大(Volume)、数据类型多(Variety)、数据变化速度快(Velcoity)、数据价值密度不高(Value)的性质, 还携带了能源行业的特有印记, 包含大量多维时空数据、关联关系数据以及实时响应数据等. 此外, 这些电力数据分别集成在不同的信息管理系统上, 如贯通调度管理系统(Outage Manage-ment System, OMS)、生产管理系统(Production Manage-ment System, PMS)、地理信息系统(Geographic Infor-mation System, GIS)、用电信息采集系统等. 而不同管理平台之间数据不能相互兼容, 并且它们之间还含有大量的重叠数据. 另一方面, 这些多源数据也存在互补关系, 其中蕴含着丰富的电力运行信息, 如文献[2]提出基于多源数据的线路保护通道及故障定位方法等,采用多源数据获得更多电网有效信息. 因此如何利用现有信息管理系统的信息, 快速准确的检索所需信息是配电网多维数据融合管理系统建设的基础和关键.目前正处于泛在电力物联网建设的关键时期[3], 这需要更加精确、高效和个性化的电网多源数据检索.因此急需建设适合电网数据特点的信息检索方法. 文献[4]以电网事故信息为基础形成数据仓库, 并利用分类与回归算法进行检索. 文献[5]针对电力数据多维度的特点, 提出了基于流形排序的电网截面数据检索方法. 由于电网数据类型复杂, 文献[6]设计一种基于B+树及倒排索引的双层混合索引结构可同时对字符型及数值型数据进行检索. 文献[7]分析了海量电网状态监测数据管理平台结构与功能, 提出基于MapReduce 的海量数据检索方法. 文献[8]首先采用模糊特征分组聚类方法对电力数据进行分组并提取特征向量, 然后使用云计算技术实现分布式检索. 目前电力系统数据检索技术大多直接从大量数据中检索出满足用户查询需求的记录, 消耗时间长且精确度不高, 并且上述大多数方法仅适合文本数据和Web数据检索, 不适用于含多源数据的电力系统.决策树方法是一种适用于数据分类、检索的方法,能保证检索精度的同时, 提高信息检索速度. 目前常用的决策树算法主要是Quinlan在1986年提出的ID3算法[9], 它采用信息熵作为判断分类的依据, 通过衡量系统的有序程度来进行区分. ID3算法选择信息最大的属性来对样本进行分割, 可以提高算法的速度和精度, 但是它以信息增益作为判断标准, 更倾向于选择具有更多值的属性. 除此之外, 还有C4.5[10], SPRINT[11], PUBLIC[12]等改进算法, 它们在一定程度上弥补了ID3算法的不足, 可以处理更多的实际问题.基于上述分析, 本文根据实际电力运行系统的数据结构及多源数据库样本分析, 提出了采用基于互信息的改进决策树算法进行快速信息检索. 通过该算法根据代表性特征子集对数据进行分类, 直接从多源信息原始数据提取信息, 并通过并行多任务处理的方式多源数据同时提取, 可以有效处理实时数据, 实现配电网的多源异构信息提取. 最终, 基于该算法提出了电力系统应用的电网辅助决策平系统模型构建, 并在仿真数据库中进行了验证.1 改进的决策树信息检索算法决策树算法是经典的数据挖掘算法, 其算法时间复杂度较低, 分类速度快, 可以适用于海量数据的快速检索分类. 对于数据分类检索而言, 输出结果的准确性和完整性至关重要. 而决策树方法是树形结构形式的分类器, 通过一系列的分类规则, 实现数据分类, 对多元数据分类具有较好的效果.决策树算法从信息量最大的根节点开始, 按每个样本的属性作为不同的分类节点(子节点), 将不同属性值作为不同分支, 直到当前节点属于同一类或相同属性值为止. 决策树算法中的属性排序将大大影响决策树的分类效果及速度, 因此需要按照某种度量将属性进行排序, 进而保证决策树算法的效果. 目前, 决策树算法在图像辨识、故障诊断等多个方面获得了广泛的应用. 本文结合配电网数据信息特征, 对决策树算法进行修改并构建一套检索系统.在构建决策树分类模型时, 最重要的问题是建立一个高效的属性评价系统. 对于多源异构的电力系统数据库来说, 存在了大量的冗余数据和互补数据, 需要更加有效的分割方式, 仅通过信息熵作为分类标准对于一些情况不够鲁棒, 会识别出大量无效数据, 难以达到应用要求. 本文在此提出一种基于互信息适用于电力系统多源异构的改进决策树算法, 可以有效解决重叠数据分割.与信息熵相似, 互信息也是由信息论的概念衍生而来, 它可以表示两个变量之间相互依赖性的度量[13].信息熵可以从原始数据中选择一个有代表性的特征子集, 直接从原始数据中提取出需要的信息, 但需要满足计算机系统应用2021 年 第 30 卷 第 2 期98一些条件[14]. 然而, 互信息利用互信息判断不同属性之间的相互包含关系, 选择低冗余特征子集, 在数据挖掘领域的特征选择方面具有更加突出优势. 同时, 基于互信息的决策树的构造过程更加直观. 但是, 互信息也倾向于选择多值属性, 为此本文增加权因子, 平衡各不同类别.当样本集的一个属性均匀分布在所有类别中, 则与类别的互信息为0, 说明该属性与类别的关系较弱.如果一个属性在不同类别的分布上有显著的差异, 那么它们之间就会有大量的相互信息, 说明属性和类别之间存在显著的关系. 通过计算类别和不同属性之间的相互信息, 可以实现最优属性分割. 对于一个样本属性, 其与类别的相关性可以表示为互信息:p (x i )x i y p (y j )j p (x i ,y j )i j x y 1/C 其中, 表示属性的值为的概率; 为样本类别,表示类别为的概率; 为属性为类别为时,属性与类别的联合概率. 当互信息越大, 属性与类别的相关性越大. 在计算时需要考虑两个相关变量的分布概率, 因此采用平均互信息, 并增加权因子, 其由各类数决定:n i i m 0其中, 为属性的数据量; 为人工常量, 根据问题对权值进行微调.最终本文的互信息定义为:1/C MI (x )x 其中, 为权因子, 由各类数决定; 表示属性与类别之间的互信息.通过基于互信息的决策树模型可以实现数据分类和数据筛选, 数据筛选算法流程具体如下:输入: 候选数据集(D 个数据)、索引关键词(S 个).步骤1. 根据索引结构构建决策树模型T .步骤2. 由式(2)更新权值矩阵C .MI (x )步骤3. 计算, 降序排序索引.D n 步骤4. 筛除不相关数据, 得到子分类数据.T n 步骤5. 精简不相关分支, 得到精简决策树.步骤6. 迭代计算, 重复2~4次, 得到最终数据集Output .在检索过程中, 数据互信息越大与可能筛除更多无用数据的概率成正比, 互信息排序越靠前表明是查询的可能性越大, 可以大大减少不相关信息, 提高检索速度和准确率. 此外, 每次迭代过程中都不断精简决策树, 可以进一步提升计算准确度, 确保在当前数据集下得到最佳排序.本文提出的算法的计算效果与数据自身属性也有很大的关系. 当数据具有确定的分类属性时, 比如本文中的电力系统数据, 根据每个属性的分类结果进行筛除时不会将有效信息进行错筛, 因此可以保证检索信息的准确性, 进而不会错误的筛除相关数据, 可以保证最终输出结果的完整性. 但是当数据属性分类不确定时, 每次的分类结果难以达到百分之百的准确, 而且输出结果对准确率要求较高, 所以如果仍采用步骤4将可能会将部分数据错误筛除. 此时可以省略步骤4, 以保证所有的数据完整性, 但是相应会增加计算负担.2 并行计算电力系统所产生的数据可以区分为静态数据和动态数据, 其中在较大时间尺度中数据不发生变化时, 可以认为是静态数据(例如, PMS 、GIS 等数据库), 除此之外, 在小时间尺度中不断更新或者累积的数据称为动态数据. 电力系统中数据庞大, 尤其是对于动态数据上千节点的数据采集会造成巨大的数据累积. 动态数据的处理对于能否有效挖掘关键数据至关重要, 但许多算法直接在一定时间内忽略最新的动态数据, 而采用历史数据, 这对于实时变化的电力系统来说可能会影响巨大. 在此, 我们通过技术处理实时更新的数据以实现动态数据的挖掘. 此外, 不同的关键词检索, 也将对静态数据的数据处理产生不同的要求. 这些对于计算机的要求将大大增加.O(2n )决策树算法的时间及空间复杂度均为, 计算时间和内存量随数据和索引量增长而急剧增长. 尤其处理大数据时, 采用单进程对数据进行处理会速度缓慢, 浪费大量计算机资源. 因此, 使用并行处理方法将算法并行化十分必要, 对挖掘进行加速, 对计算资源实现充分的利用. 同时处理多个任务主要有进程分支和线程派生的实现方式, 在此我们采用线程派生, 相比于进程分支可以提升计算效率, 线程同步易于控制.本文提出的基于Spark MapReduce 的并行决策树算法是由多个map (映射)以及reduce (归约)函数组组成, 并支持转换 (transformations)和行动 (actions), 它们的实现基于RDD. 多个数据行组成一个RDD, 数据行2021 年 第 30 卷 第 2 期计算机系统应用99的内容可以是数字、数组或者是混合类型的数据.Spark MapReduce 将计算资源分为一个master 节点和多个worker 节点, master 向空闲的worker 分配工作.多源数据可以通过各数据库实现物理分割, 但是对于大型数据库中还需要进行分块. 在一个完整的任务中, master 先将数据分块(split 0–6),然后将生成的决策树分别赋值给不同worker. 被分配了map 任务的worker 获取并提取数据行, 接受输入数据, 通过对中间变量键值对的操作, 并暂存到内存中; master 向分配了reduce 任务的worker 通知缓存信息, 将键相同的键值对发到不同reduce 函数中, 进而归纳合并生成简化键值对, 并生成最终计算结果.如图1所示, 即为整个数据挖掘引擎并行工作的流程图, 通过对各个数据库分类并行的进行数据获取和解析并通过决策树进行数据挖掘, 可以大大的提高数据处理效率并降低计算时间.图1 数据挖掘并行计算流程图3 基于决策树算法的电力系统信息检索应用模型基于互信息的决策树算法能有效地度量属性与不同数据库数据之间的关联, 区分不同属性对分类的重要性. 通过增加权因子, 可以对在实际复用情况极好的数据库, 在分类策略中适当考虑增加其权重, 提高检索效率及准确率. 根据电力系统的实际需求, 提出了如图2所示基于决策树算法的电网辅助决策系统应用模型.在此我们考虑了电力系统中的多个异构数据库,包括调度管理(OMS)、生产管理(PMS)、地理信息(GIS)、用电信息采集等系统, 还有监控和数据采集系统(Supervisory Control And Data Acquisition, SCADA)、同步相量测量装置(Phasor Measurement Unit, PMU)等实时数据.图2 基于决策树算法的电网辅助决策系统应用模型该模型构架可以实现对用户主动问询的关键词进行快速检索和数据挖掘, 结果经过校验后反馈给用户,计算机系统应用2021 年 第 30 卷 第 2 期100如果用户不满意可以追加搜索或进行调整, 实现对电网运行的辅助决策; 此外, 电网运行出现警告时, 可以通过该系统获得除了实时测量系统和故障预测系统之外的数据, 实现多源数据共用. 下面是每个部分的运行功能:(1)数据处理由于数据库中往往存在空缺数据和不一致数据等,因此需要对数据进行预处理, 提高数据质量. 数据清理可以处理掉遗漏数据和异常数据, 数据集成将多源数据构成统一数据集, 数据变换可以规范化数据成一个适合的描述形式. 通过数据处理得到挖掘数据集以便开展进一步的数据挖掘工作.(2)数据挖掘数据挖掘部分是整个系统的核心部分, 其由一组功能模块构成, 包括数据挖掘、数据查询、数据存储等. 本挖掘任务具有明显的实时性、准确性要求, 为此我们将互信息决策树与Spark MapReduce相结合, 计算速度更快、树的规模更小. 对于实时数据我们采用Boosting的技术, 可以对新加入数据产生新决策树并形成决策树集合, 增强数据挖掘的深度.(3)模式评估对于最终数据有效性的验证与评估必不可少. 首先, 通过数据库数据反复比对, 保证结果的准确性. 此外, 在一些模糊条件下, 难以得到满意的结果, 为此数据也交由用户进行修改和评价, 并不断返回修正, 直到得出用户满意的结果.(4)用户交互用户可以主动发起数据检索, 设置数据要求, 同时也可以对得到的结果进行修正并进一步完善检索要求,最终在交互界面中得到最终结果.(5)系统主动问询除了用户主动咨询数据辅助决策外, 我们还留有系统接口, 该系统可以有效的筛除冗余数据, 提高数据集成度和利用率, 为此, 可以对现有故障预测系统、调度系统进行数据支撑.4 仿真分析4.1 改进决策树算法性能分析为了验证改进决策树算法的效果和一般适用性,我们针对几种经典数据集与经典的ID3算法进行对比,结果如表1, 其中m0为本文算法的人工常量.从结果中可以看出, 与ID3算法相比, 本文提出的基于互信息的方法更能提高分类的精度, 其具有更低的冗余度. 对于ID3算法无论是精度较低的数据集(如Car)还是精度较高的数据集(如Krvs), 改进方法都可以有效提升准确率, 说明了本文提出方法具有普遍性和精确性.表1 ID3算法与本文算法在不同数据集中的精度对比(%)数据集ID3算法本文算法m0=1m0灵活调整Krvs99.598299.672199.7154Car90.022693.917094.2674Solar-flare194.614595.846196.1193需要特别说明的是, 本文所提算法中的权因子中的人工常量需要根据数据集本身进行微调, 通过表格对比可以看出, 权因子的高效选取会对精度提升具有较大帮助. 该部分的目的是针对不同的数据集特点, 将资深行业从业人员的多年经验充分融合到算法中, 例如在本文第3部分中信息检索模型中加入了用户交互检验, 可以有效自行调整人工常量. 但是当人工保持恒定时, 仍然对比ID3算法有一定精度提升, 对于一般行业从业者也可以有较好的效果.4.2 电力系统信息检索应用模型分析为验证本文提出模型的实用性和鲁棒性, 在此模拟某北方区域电网的实际情况, 使用本文所提方法进行仿真分析. 在实验室环境下搭建平台, 模拟电网中包含3个数据库(GIS、PMS、SCADA)的历史数据, 并模拟1路实时的数据输入, 用户检索某变电站A主变#2异常信息, 时间限值为3个月. 如图3所示, 为在该检索关键词下对3个数据库的决策树的信息检索过程.图3 决策树检索实现流程从图3中可以看出, 基于互信息决策树的检索方法对于分类结果是一种从下而上的搜寻方法. 先将大2021 年 第 30 卷 第 2 期计算机系统应用101量的数据筛除, 可用提高数据处理效率, 最终的重复分类可以筛除冗余数据. 表2和表3是检索PMS数据库中2160条数据的检索结果, 通过互信息决策树的分类和对各个分类器中数据的验证分析, 最后获得可用数据6个. 对PMS数据库的检索分析在Inter CORE i7 & RAM 8 GB的台式机上验证, 花费时间0.0125 s.表2 PMS数据关键词互信息结果属性变电站名变压器名基本信息异常/故障变电站名0.8830.6540.5490.301表3 PMS数据各层分类结果分类1分类2分类3分类4分类5分类器中数据量201512103 & 5可用数据量13552 & 4针对3个数据库的数据进行检索, 并不断提高数据量级别, 检索花费时间如表4中所示. 在低量级时,并行计算效果不明显, 随着数据量不断提升, 基于Spark MapReduce的并行计算优势不断显现, 平均计算时间不断降低. 仿真实验验证了该模型更适合海量电网多源异构数据的检索, 充分说明了基于互信息决策树的分类方法的适用性, 并行计算的可行性和交互计算时间的迅速性.表4 多源海量数据仿真时间对比序号检索条数(万条)花费时间(s)序号检索条数(万条)花费时间(s) 10.80.0338432.1 2.11472 1.580.0717563.4 4.1662 311.730.60946130.67.82315 结论如何有效利用电力系统中的海量多源异构数据来帮助运行人员辅助分析决策是一个难题, 目前只能通过单一数据库进行判断, 可能造成信息不完整. 针对不同数据库之间存在信息冗余、数据结构不同、数据处理量大、难以迅速提取等问题. 本文得到以下结论:(1)提出了一种基于改进决策树的信息检索算法,通过互信息判断索引信息量, 对多源数据关键词快速分类检索.(2)通过并行计算处理实现了多源数据库并行处理, 可以有效接纳处理实时数据, 大大提升计算效率.(3)基于本文算法, 提出了面向电力系统应用的电网辅助决策平系统模型, 可以实现对当前电网快速信息检索以辅助用户决策.(4)本文所提方法在百万级数据量的仿真系统中得到了验证, 在大数据量的系统仍可保持较高计算速度.参考文献薛禹胜, 赖业宁. 大能源思维与大数据思维的融合(一)大数据与电力大数据. 电力系统自动化, 2016, 40(1): 1–8.[doi: 10.7500/AEPS20151208005]1高鹏翔. 基于多源数据融合的配电网运行故障特征信息提取技术研究[硕士学位论文]. 北京: 华北电力大学(北京), 2019.2杨挺, 翟峰, 赵英杰, 等. 泛在电力物联网释义与研究展望.电力系统自动化, 2019, 43(13): 9–20, 53. [doi: 10.7500/ AEPS20190418015]3任锦标. 基于数据仓库及决策树算法的电网事故事件信息智能检索方法研究. 集成电路应用, 2019, 36(12): 86–87.4曲朝阳, 孙立擎, 潘峰, 等. 基于流形排序的电网截面数据检索. 科学技术与工程, 2016, 16(15): 239–244. [doi: 10.3969/ j.issn.1671-1815.2016.15.043]5龙禹, 吴尚远, 高骞, 等. 基于B+树的电力大数据混合索引设计与实现. 自动化与仪器仪表, 2018, (9): 67–69.6黄华林, 庞欣婷. 基于Hadoop的数据资源管理平台设计.计算机应用与软件, 2018, 35(7): 329–333. [doi: 10.3969/ j.issn.1000-386x.2018.07.059]7杜红军, 李巍, 张文杰, 等. 基于云计算技术的电力大数据分布式检索系统. 电网与清洁能源, 2018, 34(9): 19–24.[doi: 10.3969/j.issn.1674-3814.2018.09.004]8Quinlan RJ. Induction of decision trees. Machine Learning, 1986, 1(1): 81–106.9Quinlan RJ. C4.5: Programs for machine learning. San Mateo: Morgan Kaufmann Publish, 1993.10Shafer JC, Agrawal R, Mehta M. SPRINT: A scalable parallel classifier for data mining. Proceedings of the 22th International Conference on Very Large Data Bases.Bombay, India. 1996. 544–555.11Rastogi R, Shim K. PUBLIC: A decision tree classifier that integrates building and pruning. Data Mining and Knowledge Discovery, 2000, 4(4): 315–344. [doi: 10.1023/A:10098873 11454]12Tang PS, Tang XL, Tao ZY, et al. Research on feature selection algorithm based on mutual information and genetic algorithm. Proceedings of the 2014 11th International Computer Conference on Wavelet Active Media Technology and Information Processing. Chengdu, China. 2014.403–406.13Ding C, Peng HC. Minimum redundancy feature selection from microarray gene expression data. Journal of Bioinformatics and Computational Biology, 2003, 3(2): 185–205. [doi: 10.1142/S0219720005001004]14计算机系统应用2021 年 第 30 卷 第 2 期102。
缺陷形成能的定义及相关讨论
缺陷形成能的定义及相关讨论(2010-02-12 01:06)[转]缺陷形成能的定义及相关讨论原帖地址:/node/258satchel1979笔名: 陈征征个人主页:所在院校或者研究机构: California State University Northridge研究方向:主要研究方向为缺陷对于结构材料力学性质的影响,并发展起跨尺度相关算法。
具体研究体心立方材料中线缺陷及空位、杂质等的相互作用。
此外也承担一部分第一原理表面科学计算,包括表面态对于吸附原子/空位的扩散势垒的影响。
对磁性问题也比较感兴趣。
最常用的软件为VASP、DMOL、LAMMPS等。
正在积极学习各类算法,以期实现TB、MD、MC及至平面波第一原理计算软件包。
实际工作中,各类缺陷的形成能EF是一个非常重要的概念。
它的数值可以直接反应特定缺陷形成的难易程度,材料合成环境对于缺陷形成的影响,以及复合缺陷体系的稳定性等等。
因此,如何尽量准确的确定EF对于计算材料学而言是比较核心的任务之一。
本文试图讨论利用第一原理方法计算EF时需要注意的几个方面,以期帮助读者理解文献,为进一步的学习和研究奠定基础。
一般而言,缺陷体系相较于完美体系,也即参考体系,经常会有粒子数目上的变化(这里粒子是指构成材料的原子以及电子)。
因此可以将其视为巨正则系综。
按照最为直接的定义,其缺陷形成能EF可表示为[1]EF = G - \sum_i Ni μi - ne μe其中G是缺陷体系的Gibbs自由能。
求和遍历该体系中包含的所有元素种类。
Ni和μi分别为第i种元素的原子个数以及当前体系下该类原子的化学势。
上式将电子单列出来,ne 和μe分别为变化的电子数(相对于中性参考体系而言)以及电子的化学势。
这个定义虽然普适,但是在实际应用中,特别是以第一原理为基础的研究中并不常见,目前的文献都利用参考体系对上式进行了改写。
首先是用体系总能E代替了 G。
因此熵的贡献被忽略了。
锂离子电池容量衰减诊断方法
锂离子电池容量衰减诊断方法
钱东培;姜炯挺;杨跃平;王炯耿;董栋;刘双宇;许君杰;王丹妮
【期刊名称】《材料科学与工程学报》
【年(卷),期】2022(40)3
【摘要】锂离子电池容量衰减诊断对于储能系统长期稳定可靠运行具有十分重要的意义。
通过多段非线性回归算法拟合电池电增量(IC)曲线和开路电压(OCV)曲线,在分析电池电极电势与全电池开路电压之间的对应关系基础上,建立了一个可用于分析电池容量衰减机制的电池OCV重构模型。
采用随机森林搜索算法提高计算最优电池模型参数的精度和速度,根据每次迭代计算得到的误差不断修正参数调整步长,在保证精度的同时减少计算量。
本研究以商用三元锂离子电池为研究对象,使用该模型获得高精度的OCV曲线数值模型,同时定量分析电池老化过程中内部各组分的损失。
研究结果表明该模型具有满意的精度和可靠性,OCV曲线拟合误差小于0.2%,曲线重构均方差在10 mV以内。
【总页数】6页(P406-411)
【作者】钱东培;姜炯挺;杨跃平;王炯耿;董栋;刘双宇;许君杰;王丹妮
【作者单位】浙江华云信息科技有限公司;国网浙江省电力有限公司宁波供电公司【正文语种】中文
【中图分类】TM912.9
【相关文献】
1.锂离子软包电池容量衰减和厚度膨胀预测方法研究
2.基于GBDT模型预测锂离子电池容量衰减
3.基于三参数容量衰减模型的锂离子电池容量估计
4.锂离子电池容量衰减机理中的数学模型研究
5.基于GBDT模型预测锂离子电池容量衰减
因版权原因,仅展示原文概要,查看原文内容请购买。
基于熵权TOPSIS的变压器套管绝缘状态评估
基于熵权TOPSIS的变压器套管绝缘状态评估
陈金强;李群湛
【期刊名称】《绝缘材料》
【年(卷),期】2014(47)4
【摘要】当前变压器状态检修中细化部件评估越来越受到重视,研究了一种基于熵权TOPSIS原理的变压器套管绝缘状态评估新方法。
该方法克服了目前多数评估方法中主观确定权重的不利影响,引入熵的概念来确定评价指标的权重,全面考虑评估指标所含信息量。
利用TOPSIS评价方法将绝缘评估问题转化为向量空间的距离评价问题,基于实例和标准样本间的欧式距离贴近度,计算得到变压器套管绝缘状态等级的定量划分。
并用实例验证了该方法的有效性。
【总页数】4页(P89-92)
【关键词】绝缘状态评估;变压器套管;熵权;TOPSIS;状态维修
【作者】陈金强;李群湛
【作者单位】西南交通大学电气工程学院
【正文语种】中文
【中图分类】TM403.3;TM406
【相关文献】
1.基于熵权理论和灰色评估理论的变压器绝缘状态评估方法 [J], 张俊;张彼德;敬海兵;邓浩;李建坤;陈俊峰
2.基于变压器马尔可夫状态评估模型和熵权模糊评价方法的风险评估技术研究 [J],
张桦;魏本刚;李可军;梁永亮
3.基于绝缘纸聚合度变压器套管绝缘状态无损评估方法 [J], 孙长海;李维江;王明;陈百通;吴彦;钟俊涛;薛静梅;彭娜;闻政
4.基于高斯云模型和综合赋权的电力变压器套管绝缘状态评估 [J], 王伟; 王晓辉; 张洋; 赵磊; 李璐; 孙鹏; 姚伟; 李刚
5.基于高斯云模型和综合赋权的电力变压器套管绝缘状态评估 [J], 王伟; 王晓辉; 张洋; 赵磊; 李璐; 孙鹏; 姚伟; 李刚
因版权原因,仅展示原文概要,查看原文内容请购买。
二维最大熵阈值优化的Canny算子的绝缘子边缘检测研究
二维最大熵阈值优化的Canny算子的绝缘子边缘检测研究李浩然;李镇翰;吴田;徐西睿;方曼琴
【期刊名称】《高压电器》
【年(卷),期】2022(58)11
【摘要】为解决绝缘子航拍图像中边缘检测效果不佳的问题,文中提出了一种二维最大熵阈值优化的Canny算子对绝缘子边缘的检测法。
首先对无人机航拍的绝缘子图像进行预处理,依次进行灰度化、对比度增强和图像去噪,然后针对传统Canny 算子对绝缘子图像边缘提取的不足,提出其不足之处主要在于阈值的选取没有具体的计算方法,最后针对此缺点,提出对传统Canny算子中双阈值的获取方法进行改进,从信息论的角度出发,利用最大图像熵法,并从一维图像熵提升到二维图像熵,计算阈值。
实验结果验证了文中所提出的利用二维最大熵阈值优化的Canny算子的优越性,能够有效地提取出航拍绝缘子图像上的边缘信息,为下一步裂纹检测的精确率提供保障。
【总页数】8页(P205-211)
【作者】李浩然;李镇翰;吴田;徐西睿;方曼琴
【作者单位】深圳供电局有限公司;三峡大学电气与新能源学院
【正文语种】中文
【中图分类】TP3
【相关文献】
1.基于Canny算子的复合绝缘子憎水性图像边缘检测
2.基于Canny算子边缘检测的小波阈值去噪方法
3.基于Canny算子的二维最大熵阈值分割算法
4.基于蚁群和Canny边缘检测算子混合算法的二维岩石图像裂隙特征提取与修复研究
5.基于改进Canny算子高低阈值选取的遥感图像边缘检测
因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Á Â Ã Á ÂÁ Á Â Ã Á Â Á Â Ã Ä Á Â Á
研 究 与 设 计
由图 2 可知,黑划痕和污物缺陷都呈现暗特征;而白划 漏箔以及起泡缺陷均呈现亮特征; 黑划痕和亮划痕 、 污物 痕、 和漏箔特征差异不明显; 漏箔和白划痕相比投影特征近似, 但 几何特征中面积差异较大。起泡和漏箔 、 划痕特征相比, 则投 影特征差异明显。因此本文所提取的几何形状和投影特征是 合理的。
研 究 与 设 计
最大熵和高斯模型在锂电池缺陷识别中的应用
陈 功, 朱锡芳, 许清泉, 徐安成, 杨 辉 (常州工学院, 江苏 常州 213022) 摘要: 锂电池极片缺陷在线识别系统中采用最大熵阈值法实现图像的阈值分割, 采用缺陷面积排序的方法取出最大缺 陷目标, 提取二值化图像中缺陷的几何形状和投影参数作为特征值, 最后采用高斯混合模型算法实现对缺陷目标的识 别分类。实验结果表明: 该系统能自动实现阈值分割, 准确提取缺陷特征, 识别准确率达到 94% 。 关键词: 最大熵阈值; 高斯混合模型; 识别 中图分类号: TM912.9 文献标识码: A 文章编号: 1002-087 X(2014)06-1063-03
1.2 1.0 0.8 0.6 0.4 0.2 0.0 −0.2 1 2 3 4 5 6 7 8 9 10 11 1.2 1.0 0.8 0.6 0.4 0.2 0.0 −0.2 1 2 3 4 5 6 7 8 9 10 11 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 1 2 3 4 5 6 7 8 9 10 11
1
(2 )
Σ
1 exp − ( x − µ ) Σ − ( x − µ 2
) (3)
式(3)中: xt 中 t=1, 2, …; T 是特征序列; M 是 GMM 模型阶数;
锂电池极片图像识别是一个多特征 、 多类别的识别问题,
d 是特征的维数; bi(xt)是均值矢量为 mi、 协方差矩阵为 Si 的单
H = − ∑ p lg p (其中 i=0, 1, 2, …, L-1)
阈值, 即 t = arg max [ϕ (t ) ] 。经图像分割后, 得到黑白二值化锂 通常缺陷目 电池极片图像。该图像中可能存在多个缺陷目标, 标呈现较大的面积特征,因此缺陷目标面积排序的方法可定 位出最大缺陷目标。
需要大量特征精确地描述缺陷 。根据工业生产过程中极片缺
1 锂电池极片缺陷类型
锂电池极片缺陷依据产生原因可划分为以下几种 。 由于 设备因素引起的亮划痕 、 暗划痕; 由工艺因素引起的漏箔 、 起 泡、 针孔; 由环境因素引起的表面异物 。 图 1 为主要研究的缺 陷目标。
2 阈值分割和特征提取
针对固定阈值取值的复杂性,本文采用一维最大熵阈值 法 , 其基本思路是: 统计图像中每一个灰度级出现的概率, 计
(56) 44 41 53 40 53 50
(14) 11 12 12 9 12 13
(41) 38 37 39 37 39 37
/% 85 82 94 77 94 90
17%。与模板匹配相关性算法比较, GMM 相对于模板匹配相 关性从统计的角度充分表示数据的分布情况,反映的是同类 数据本身的相似度特性, 其识别提高率达到 4%。
3 高斯混合模型的识别
高斯混合模型 (GMM)模型 [10]是一种基于参数估计的概率
统计模型,其将每个缺陷目标的特征在特征空间都构成特定 的分布,并且可用多个高斯分布组合对每个缺陷特征分布进 行拟合,不同参数的高斯分布组合可用来表征不同的缺陷目 GMM 的优点是可以从统计的角度充分表示数据的分布情 标。
高斯分布函数; Pi 是第 i 个单高斯分布的权重。作为高斯混合 分布的加权系数, P 应满足使:
=
∑P =1
(4)
在采用高斯混合模型的图像特征参数目标集合中,任一
特征参数的模型形式都是一致的, 其个性特征由一组参数
λ = {P , µ , Σ / i = 1, 2, ⋅⋅⋅, M } 唯一确定。因此, 目标的训练是从
图2
不同缺陷目标特征值比较
2014.6 Vol.38 No.6
1064
研 究 与 设 计
(24) GMM( ) GMM ( ) !" 21 20 22 17 22 21
(17) 15 14 17 14 17 16
己知特征参数中得到这样的一组参数 l 使其产生训练的参数 概率密度最大。而缺陷目标的识别依最大概率原则选出产生
识别缺陷目标概率最大的那一组参数所代表的缺陷目标, 即:
λ = arg max p ( X / λ )
λ
(5)
图 3 为基于 GMM 锂电池极片缺陷目标识别系统原理
图。
1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0
图1
主要研究的缺陷目标
(1)
况, 反映的是同类数据本身的相似度特性。
GMM 模型是用 M 个单高斯分布的线性组合来描述特征
在特征空间中的分布。即: 其中,
当熵函数取得最大值时对应的灰度值 t 就是所求得最佳
P ( x ) = ∑ Pb ( x )
=
(2)
b (x ) = N(x , µ , Σ ) =
(Changzhou Institute of Technology, Changzhou Jiangsu 213022, China)
Abstract: In defects online recognition system of lithium battery electrode plate, maximum entropy threshold algorithm was adopted for threshold segmentation from image. Area sorting of defect was used to get the maximum defect object, and geometry figure and projective parameter extracted from binary image were used as eigenvalues. and the Recognition and sort of defect object were realized by Gaussian mixture model (GMM). Experimental results show that the system can automatically realize threshold segmentation and extract defect characteristic, recognition accuracy can reach 94%. Key words: maximum entropy threshold; Gaussian mixture model; recognition 目前磷酸铁锂电池的应用并非尽善尽美,主要是受制于 电池组的一致性问题。用作汽车动力的锂离子电池是将大量 单体电池串并联而成的电池组,目前单体磷酸铁锂电池的寿 命超过 2 000 次, 在将多个电池组成电池组时, 只有在电池性 能高度一致时, 电池组的循环寿命才能接近单体电池的寿命 。 由于目前国内大部分磷酸铁锂生产厂商的制造设备及制备工 艺都不成熟, 产品品质容易出现波动, 使得电池产品的一致性 受到影响, 因此, 目前应用在电动汽车上存在一定的障碍 。 表 面缺陷是锂电池极片表面质量的重要因素,直接影响着产品 基于机器视觉技术的极片表面质量自动 的性能和质量。因此, 检测已逐渐成为研究的重点。 从国内外相关研究领域来看, 文献 [1] 针对塑料薄膜表面 缺陷提出了固定阈值分割的方法实现缺陷的提取 。 文献 [2-4] 则未考虑视觉图像中可能同时存在多个缺陷, 文献 [5] 采用聚 类解决上述问题, 但是该方法计算复杂, 实时性差 。 文献 [6-8] 采用模板匹配中误差和相关性算法来识别缺陷,上述算法计
收稿日期: 2013-11-21 基金项目: 2013 年 江 苏 省 自 然 科 学 基 金 青 年 基 金 资 助 (BK20130245); 2013 年常州市光电子材料与器件重点实验室项目 (20130694); 2012 年 江 苏 省 常 州 市 科 技 计 划 项 目 (CE20120071); 2012年江苏省常州市高新区科技发展计划项目(XE120121408) 作者简介: 陈功(1979—), 男, 江苏省人, 博士, 主要研究方向为光 学图像处理、 信息处理。
1 2 3 4 5 6 7 8 9 10 11
1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 1 2 3 4 5 6 7 8 9 10 11
图3
基于 GMM 锂电池极片缺陷目标识别系统原理图
表 1 给出了不同条件下的识别结果 。 由于几何和投影特 征的相对独立性, 同时提取两者特征, 能有效提高缺陷的平均 识别率, 提高值分别达到 9%和 12%。采用缺陷面积排序提取 了唯一的缺陷目标,相对于未排序方法平均识别率提高了
算量大, 且未能充分反映同类数据本身的相似度特性。针对上 述问题, 构建锂电池在线极片缺陷识别系统, 该系统采用最大 熵阈值法实现阈值分割, 经缺陷面积排序定位最大缺陷目标, 提取缺陷中的几何形状和投影参数作为特征值,识别部分采 用高斯混合模型 (Gaussian Mixture Model, GMM) 算法实现对 缺陷目标的分类。 采用 CCD 对锂电池薄膜成像时, 由于镜头到薄膜距离有 限, 获得的图像一般中部偏亮、 两侧偏暗 。 因此本文采用图像 灰度补偿算法 [3]和平滑滤波算法减少图像采集质量不稳定的 影响。
Application of maximum entropy threshold and Gaussian mixture model in defects recognition of lithium battery