数据挖掘在电力系统中的应用现状
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.3 数据挖掘在电力系统中的应用现状
数据挖掘是一个为发现事先未知的规则或联系,而从大量数据中抽取挖掘出有价值的模式或规律等知识的复杂过程[80],它源于人工智能和机器学习领域,其目的是从数据库中抽取隐含的、未知的、并且是潜在有用的信息。它以数据预处理为基础,选择合适的算法来提取规则,再进行评价和解释,从而获取隐藏在数据中的知识。数据挖掘可看成是一种数据搜寻过程,与传统的数据处理过程不同,它不需要预先假设或提出问题,但仍能找到那些并不在预期中的且可能有价值的信息,这些信息表示了数据元素的关系和模式。数据挖掘可以分为三个主要过程:数据整理、数据挖掘和解释评估[81],其工作步骤如图1.1所示。
(1) 数据准备:首先要了解数据的相关背景和分析目标,并获得数据信息和样本以建立数据库,将来自多种数据源中的相关数据进行集成;
(2) 数据选择:明确目标数据,根据分析和研究的需要从原始的数据库中选择相关的数据和样本;
(3) 数据清理:对数据进行清理,以清除数据噪声和与挖掘主题明显无关的数据,并检查数据的完整性,处理数据中的可能存在的缺失项,将原始数据标准化和规范化;
(4) 数据转换:以合适的方式组织数据,将数据转换为易于进行数据挖掘的数据存储形式,定义新的数据属性(条件属性和决策属性),减小数据维数和尺寸;
(5) 数据挖掘:根据知识发现的需要选择合适的智能算法,如关联规则分析预测、分类、聚类或离群分析等;
(6) 模式评估:根据一定的标准从挖掘得到的结果中寻找有用的知识,对发现的模式进行解释,并采用实际数据进行交叉验证;
(7) 知识呈现:将获取的知识和规则转换为可理解的、可使用的规则集,以直观的方式向用户提供挖掘的最终结果。
数据挖掘是一个交叉的研究领域,所涉及的领域包括:数据库技术[82]、机器学习[83]、人工智能[84]、知识系统[85]、统计学[86]、信息检索[87]以及可视化计算[88]等领域。现代电力系统是一个规模大、非线性强、维度高和时变的系统,面对电力系统中迅速膨胀的数据信息量,数据挖掘的应用具有重要的研究价值。数据挖掘的应用任务主要可分为关联规则分析预测、分类、聚类和离群分析[89]。
(1) 关联规则分析应用
关联通常表示两个或多个变量之间存在某种内在联系和规律性。关联规则挖掘是从给定的数据集中发现一个变量与其它变量之间的相互依存性和关联性,即
从大量的数据中挖掘出有价值的、可描述数据项之间相互联系的有关知识。在电力系统领域,分析和探寻关联规则,对发电商、电力公司和电力用户有重要意义。
① 发电侧关联规则分析:分析发电厂商的竞争能力评估体系中各因素之间的关联性[90];分析火电厂的煤耗率与发电机的主汽压力、主汽温度和再热汽温等变量之间的关联性[91]。
② 电网运行数据关联性分析:对于电网故障,分析故障现象与故障类别之间的有价值的关联规则,可以更好的对设备进行故障监测与诊断[92-94];对于电网安全,分析电力系统运行参数和暂态稳定性之间的关联性,有利于暂态稳定分析
[95, 96];对于电能质量问题中的谐波研究,分析特定地点谐波电流与其它地点电压
之间的关联度,有助
+
图1.1 KDD 工作步骤示意图
于对谐波的分析[97, 98]。
③ 用户侧负荷特性分析:研究用电量与经济增长率、行政级别和气候类型等可能因素的关系,指导配电网的规划[99]。
(2) 预测应用
预测是根据历史数据和当前数据建立模型,找出其中变化规律,再基于该模
数据
数据
模式
型提取将来数据特征的过程。在电力调度系统中的负荷预测和电力市场中的电价预测问题中,数据挖掘技术有着广泛的应用。
①电力负荷预测:电力负荷预测是电力部门的一项重要工作,影响着电力系统的调度运行以及生产计划,是电力系统优化调度的基础,准确的负荷预测对于提高系统的安全性、稳定性与经济性有重要意义。在数据挖掘技术中,模糊推理系统[100]、粗糙集理论[101]、DT[102]和ANN[103, 104]等应用于短期负荷预测。
②电价预测:电价在优化电力资源配置和调整各方利益关系等方面发挥着重要作用。随着电力市场化改革的深入,电价预测将成为市场参与者的必要工作内容之一。电价预测是指根据已知信息,采用数学方法预测未来的电力交易价格。准确的电价预测可以为市场参与者的投资的提供重要参考。在数据挖掘技术中,ANN[105]和SVM[106]方法应用于电价预测。
(3) 分类应用
分类是数据挖掘中的一项重要任务,它的目的是找出一组能够描述数据集合典型特征的模型,以便识别未知数据的归属或类别,将未知事例映射到两个或多个给定的类别之一。数据挖掘技术在变压器故障诊断、故障类型识别和系统状态分类方面得到应用。
①变压器故障诊断:电力变压器是电力系统重要的变电设备,变压器故障诊断是保证其正常运行并进行状态维修的基础。在数据挖掘技术用于变压器故障诊断的文献中,有基于SVM[107]、贝叶斯网络理论[108]和ANN[109]的变压器智能故障诊断等研究。
②输电线路故障类型识别:输电线路故障对电力系统的稳定运行有严重影响,因此,对输电线路的故障类型进行快速识别,以采取适当的保护措施非常重要。输电线路故障类型通常包括单相接地短路、两相短路、两相短路接地以及三相短路。由于系统的运行方式、故障位置和故障原因等因素对故障时的电压和电流信号会产生影响,因而增加了故障类型识别的复杂性。在数据挖掘技术中,贝叶斯分类器[110]、ANN[111]、模糊推理[112]和SVM[113]等应用于输电线路故障类型识别。
③系统状态分类:通过电力系统中获得发电水平、负荷水平、潮流分布以及故障条件等参数的数据,运行人员能够确定系统运行的状态,有助于电力系统的合理调度和维持系统的稳定运行。文献[114]将电力系统系统分为正常、不正常和恢复状态,并根据粗糙集理论构建分类规则,从而实现分类。特别地,安全评估是电力系统运行分析的一个研究热点,也属于对系统状态的分类,DT和SVM 等数据挖掘方法有一定的应用[115, 116]。
④电能质量事件分类:随着电力电子技术的广泛应用,各类非线性和冲击