4 不良数据的检测和辩识
电力系统中的不良数据监测和辨识方法
![电力系统中的不良数据监测和辨识方法](https://img.taocdn.com/s3/m/c4b38d9cf242336c1fb95e8e.png)
电力系统中的不良数据检测和辨识方法介绍西南交通大学电气学院10专业2班傅广港摘要:简述了电力系统不良数据的检测和辨识的必要性。
列举了目前较为主流的不良数据检测和辨识方法,并对这些方法优缺点作出评价。
关键词:不良数据;检测;辨识;优缺点Ways to detect and identify the bad data in power systemFu Guanggang(College of Electrical and Engineering,Southwest Jiao Tong University) Abstract: This paper expounds the necessity of the bad data detection and the identification in power system, as well as the common methods to realize,and discuss the advantages and disadvantages。
Keywords:bad data ;detect; identify;advantage disadvantage0引言在电力系统的实际运行中,由于量测量和量测通道的误差以及可能受到的干扰,会出现各种测量误差。
而我们电力系统的量测数据,通常可看作有效的量测数据和量测噪声的线性组合,通常情况下量测噪声为白噪声[1],通过一定的技术处理(如数字滤波、提高量测冗余度等)一般可消除白噪声对电力系统状态估计结果的影响.但当量测数据中包含不良数据时,这些不良数据对电力系统状态估计结果的影响是不容忽视的,电力系统中的不良数据可能会影响调度员做出错误的决策,进而影响电力系统的正常运行,甚至可能威胁整个电力系统的安全。
因此,为了确保电力系统的稳定安全运行,对不良数据的处理有非常重要的意义[2].1不良数据检测和辨识的研究现状不良数据检测与辨识是电力系统状态估计的重要功能之一,其功能是在获得状态估计值的基础上依靠系统提供的多余信息,发现和排除测量采样数据中偶然出现的少数不良数据,以提高状态估计的可靠性。
状态估计中不良数据的混合检测辨识法
![状态估计中不良数据的混合检测辨识法](https://img.taocdn.com/s3/m/6f3db831580216fc700afdcd.png)
Keywords power transformer PD on2line locating
第6期
刘 浩 状态估计中不良数据的混合检测辨识法
19
或发电机组非计划停运等 。量测误差定义为从系统
所获得的错误量测信息 。其主要有两个来源 : ①由
仪表传输等所引起的量测系统误差 。 ②由断路器
关 、断的错误状态信息所引起的网络结构误差 。本
- 01338 - 01139 - 01830 - 01713
01449
节点编号
( i2j)
10211 10212 10213 10215 12213 13214 15216 16217 16218
注 : 实际量测数为 38 个 。
表 3 第二采样线路潮流部分量测值
线路潮流 (标幺值) 有功 无功
因为有突变量的情况下 , a ( i) 也将呈现出较大 的数值而被检测出 ,此法不能区分检测出的可疑数 据是不良数据还是突变量 。本文讨论了用残差检测 法来区分不良数据与突变量 。
4 异常数据的区分
在无不良数据时 ,残差总是很小 ,在有不良数据 时 ,总会有残差较大的量测 。此为区分不良数据与 突变量的依据 。
不良数据辨识
![不良数据辨识](https://img.taocdn.com/s3/m/e7ef19db49649b6648d74770.png)
或
~ N 0,1
23/106
3σ准则
ˆ J x ~ N k , 2k
或
ˆ J x k 2k
~ N 0,1
根据3σ准则,即某正态随机变量的误差将以 99.75%的概率落在3σ区间之内,即:
ˆ J x k 2k 3 ˆ J x 3 2k k
i
ri
残差方程改写:
rw Wwvw
i wi i
H T R1 H 1 H T R 1 Ww I R H
1
19/106
标准化残差
通过残差方程,可以得到残差的方差阵 Var r E rr T WRW T WR
定义矩阵D
定义标准化残差
由残差方程可见,量测残差也会明显变大。
三种检测方法
目标函数值检测法 加权残差检测法 标准化残差检测法
由目标函数的公式可知,目标函数的数值也会变大。
21/106
不良数据的检测-J检测法
利用估计后的目标函数进行坏数据检测的方法简称 ˆ 为 J x 检测:
2 ˆ ˆ ˆ J x z h x R z h x r R r rwj T 1 T 1 j 1 m
检测和辨识
人们在状态估计之前会对量测数据进行处理,
根据对不良数据处理水平不同分为三个层次:
人工检测和辨识
量测极限值检测
量测量突变检查 量测数据的相关性检查
计算机实时检测和辨识(数据的预处理)
利用远动功能实现 粗检测和辨识
状态估计程序中的检测和辨识
4/106 通过大量正常的冗余量测,利用数学方法处理不良数据
现代电力系统分析-往年试卷与复习资料 (6)
![现代电力系统分析-往年试卷与复习资料 (6)](https://img.taocdn.com/s3/m/3760d364443610661ed9ad51f01dc281e53a56dd.png)
一、潮流计算方法之间的区别联系高斯-赛德尔法:原理简单,导纳矩阵对称且高度稀疏,占用内存小。
收敛速度很慢,迭代次数随节点数直接上升,计算量急剧增加,不适用大规模系统。
牛顿-拉夫逊法:收敛速度快,迭代次数和网络规模基本无关。
相对高斯-赛德尔法,内存量和每次迭代所需时间较多,其可靠的收敛还取决于一个良好的启动初值。
PQ 分解法(快速解耦法):PQ 分解法实际上是在极坐标形式的牛顿法的基础上,在交流高压电网中,输电线路等元件的R<<X ,即有功功率主要取决于电压相角,而无功功率主要取决于电压幅值,根据这种特性对方程组进行简化,从而实现了有功和无功的解耦。
两大条件:(1)线路两端的相角相差不大(小于10°~20°),而且||||ij ij G B ≤,于是可以认为:cos 1;sin ij ij ij ij G B θθ≈≤; (2)与节点无功功率相对应的导纳2/i i Q U 通常远小于节点的自导纳ii B ,也即2i i ii Q U B <<。
1. PQ 分解法用一个1n -阶和一个1n m --阶的方程组代替牛顿法中22n m --阶方程组,显著减少了内存需量和计算量。
2. 计算过程中B '、B ''保持不变,不同于牛顿法每次迭代都要重新形成雅可比矩阵,因此显著提高了计算速度。
3.雅可比矩阵J 不对称,而B '、B ''都是对称的,使求逆等运算量和所需的存储容量都大为减少。
4. PQ 分解法的迭代次数要比牛顿法多,但是每次迭代所需时间比牛顿法少,所以总的计算速度仍是PQ 分解法快。
在低压配电网中PQ 分解法不适用。
交流高压电网的输电线路的元件满足R<<X ,PQ 分解法正是基于此条件简化而来;而低电压配电网络一般R/X 比值很大,大R/X 比值病态问题也正是PQ 分解法应用中的一个最大障碍。
不良数据检测与辨识算法的评估研究
![不良数据检测与辨识算法的评估研究](https://img.taocdn.com/s3/m/cbe23b56312b3169a451a438.png)
的研究 , 并结合电力系统 的特 点, 在理论研究与工程 应用方面取得了大量的成果 , 进一步丰富和发展 了 相关算法[2 41 -。而对算法进行综合评估是一项复杂且 1 伴随着模糊性的系统工程 , 故采用基于模糊 数学理
数据 中偶然 出现的少量不 良数据 , 高状态估计的 提 可靠性n 。在实际应用中 , 必须根据 电力系统规模 、
e aua in. tc n gi fe tver f r n et ho e ago ih ra t a we y t m. v l to I a vee ci e ee c o c os l rt m f c u l o po rs se
K e r s p we y t m; a a a d tc i n a d i e t c t n ag r h e au t n f z  ̄ s n h t v l ai n y wo d : o rs se b d d t ; e e t n n i a i ; l o i m v l ai ; u 2 y t e i e au t o d i f o t o c o
关键 词 : 电力 系统 ; 良数 据 ; 测 与辨识 ; 法评价 ; 不 检 算 模糊 综合 评价
文章编号:028 3 (022 . 3—5 文献标识码 : 中图分类号: M72 10 3 12 1)2 2 90 0 A T 1
1 引言
电力系统不 良数据的检 测与辨识是 电力系统状
态 估 计 的 重 要 功 能 之 一 , 目的在 于 排 除 量 测 采 样 其
S h o f e t c l n i e r g Zh n z o i e st , e g h u 4 0 0 , i a c o l c r a g n e i , e g h u Un v r i Zh n z o 5 0 Ch n o El i E n y 1
电力系统状态估计(1)
![电力系统状态估计(1)](https://img.taocdn.com/s3/m/7bb2a32c0242a8956aece470.png)
一.概述
状态估计中的“估计”不意味着不准确, 相反,对于实际运行的系统来说,不能 认为潮流计算是绝对准确的,而状态估 计的值显然更准确。 状态估计可认为是一种广义潮流,而常 规潮流计算是一种狭义潮流,及状态估 计中m=n的特例。
14
二.电力系统状态估计的数学描述与可观察性
一 电力系统测量系统的数学描述
Qij
(ij,Vij
)
Pi
(ij,Vij
)
Qi
(ij,Vij
)
V(i V)i
节点电压测量方程式:状态变量与支路潮流 的非线性函数表达式。
注入功率测量方程式:节点注入功率与支路 潮流的非线性函数表达式。
18
二.电力系统状态估计的数学描述与可观察性
表2-1列出五种基本测量方式。第一种测 量其维数为 ,2N显1然没有冗余度,这在状态 估计是不实际的。第五种测量方式具有最 高的维数和冗余度,但所需投资太高,也 是不现实的。因此,实际测量方式是第一 到第四的组合。
测量的随机误差或噪声向量 是ν均值为 零的高斯白噪声,其概率密度为
p e
2 i
2
2 i
i
2
2 i
式中: i是误差 的ν 标准差;方差 越大i2 表示 误差大的概率增大。
26
二.电力系统状态估计的数学描述与可观察性
由于误差的概率密度或协方差很难由测
量或计算确定,因此在实际应用中常用测
量设备的误差来代替。测量误差的方差为
最小二乘估计及改进 支路潮流状态估计法
四.不良数据的检测与辨识
五. 网络结线分析及网络结构辨识的基本概念
2
一.概述
一 常规状态估计的概念 根据可获取的量测数据估算系统内部状态
自动电压控制中不良数据的辨识
![自动电压控制中不良数据的辨识](https://img.taocdn.com/s3/m/9c9b2ef2941ea76e58fa0469.png)
方数 据采 集终 端转 发 的数 据 , 分 别 独 立 作 为 闭 锁 并
条件 , 保证 数 据准 确 和 系统 安 全 . V 中 , 集 数 据 AC 采
的质量直接决定了系统控制的性能. 实际运行 中, 由 于装 置 、 集 、 采 传输 等 出现异 常将 导致 遥 测量 中 出现 不 良数 据 , 而造 成 A C误 动 . 献 [ ] 以一 起 从 V 文 3 中
中图分类号 : M7 T 6
di1.9 9ji n 10 - 5 .00 0 .1 o:03 6/. s.005 X 2 1 .70 2 s 6
随着 人们 生 活水 平 的提 高 , 电压 质 量 的要 求 对
的工程 实用价 值 . 是 目前 鲜有 文 献对 A C的不 良 但 V
数据进行 辨识 , 以文 中的研 究非常具有 现实意义 . 所
染 和残 差淹 没 的发生 . 献 [ 0 中揭 示 了残 差 灵 敏 文 1] 度 矩 阵 中元 素 与不 良数 据 大小 在 可 检 测 、 辨 识 上 可
A C实行 三 级 电压 控 制 J A C子 站 系 统 具 有 遥 V .V
测、 遥信 、 调和遥 控 等 四遥 功 能 . 遥 它既 可 以独 立 采 集各 台机 组 的机端 电压 、 子 电流 、 用 电母 线 电 定 厂
事故 为案 例分 析指 出 , 由于 电流互 感器 自身 的缺点 , 导致 采集 的数 据异 常 , 而造 成 保护装 置 误动 . 于 从 鉴 不 良数据 将造成 A C装 置 的误 动 , 而影 响 电力 系 V 进
统 的电压质 量 , 因此 , V A C的不 良数据 辨识 具有 很 高
现代电力系统分析-往年试卷与复习资料 (6)
![现代电力系统分析-往年试卷与复习资料 (6)](https://img.taocdn.com/s3/m/b56b0e37f18583d049645986.png)
消去节点 k 之前, jk 个节点间原有的支路数为
则
k
消除后所增加的新支路数为(即注入元个数为 dk
) bk
1 2
jk .(
jk
1) dk
动态优化法:(1)按上式分别统计消去网络各节点时增加的出线数,选其中出 线数最少的被消节点编为 1 号节点,消
去节点 1 。
(2)修改其余节点的出线数目,然后对余下节点重复出节点 2,3,、、、,直到所有节点编完为止。
一、潮流计算方法之间的区别联系 高斯-赛德尔法:原理简单,导纳矩阵对称且高度稀疏,占用内存小。 收敛速度很慢,迭代次数随节点数直接上升,计算量急剧增加,不适用大规模系统。 牛顿-拉夫逊法:收敛速度快,迭代次数和网络规模基本无关。 相对高斯-赛德尔法,内存量和每次迭代所需时间较多,其可靠的收敛还取决于一个良好的启动初值。 PQ 分解法(快速解耦法): PQ 分解法实际上是在极坐标形式的牛顿法的基础上,在交流高压电网中,输电线路等元件的 R<<X,即有功功率主要 取决于电压相角,而无功功率主要取决于电压幅值,根据这种特性对方程组进行简化,从而实现了有功和无功的解耦。
1.静态优化法:按静态节点支路数的多少编号。 统计电力网络节点的出线支路数,然后按出线支路数从少到多的顺序编号,当有 m 个节点的出线数相同时,则可按任 意次序对此 m 个节点进行编号。
其依据是:在 Y 阵中,出线数最少的节点所对应的行中非零元素也最少,因此在消去过程中产生注入元的可能性 也最小。
2.半动态优化法: 动态地按最少出线支路数编号。 静态优化法中,各节点的出线数是按原始网 络统计 出来的,在编号过程中认为固定不变。而事实上在节点消去
(1)利用常规牛顿潮流算法每次迭代所求出的修正向量 x(k) (J(x(k) )1 f(x(k) ) 作为搜索方向,并称之为目标函数在
同步相量测量系统不良数据辨识与修正方法
![同步相量测量系统不良数据辨识与修正方法](https://img.taocdn.com/s3/m/fe4e66516fdb6f1aff00bed5b9f3f90f76c64dee.png)
基于插值的方法
线性插值
基于两个相邻的数据点之间建立线性关系, 预测出不良数据点的正确值。这种方法简单 易用,但可能存在插值误差较大的问题。
样条插值
通过在多个数据点之间建立样条曲线关系, 预测出不良数据点的正确值。这种方法能够 更好地处理非线性关系的数据,但计算复杂
度较高。
基于滤波的方法
要点一
滑动平均滤波
02 调度自动化
支持调度自动化系统,实现负荷预测、调度计划 制定等功能。
03 新能源接入
用于新能源的并网接入,监测电网与新能源之间 的交互作用。
同步相量测量系统的不良数据类型与影响
不良数据类型
包括测量误差、失真、丢帧、设备故障等。
不良数据对电力系统的影响
可能导致电力系统的不稳定、误判故障、误操作等问题,影响电力系统的安全稳定运行。
实验方法
采用模拟仿真实验,针对同步相量测量系统的不同情况,设计不同的实验场景,并对各种不良数据进行模拟。
实验结果
通过对比分析实验结果,发现不同类型的不良数据对同步相量测量系统的影响方式和影响程度,为后续的数据辨识和 修正提供依据。
实验结论
实验验证表明,不良数据的辨识和修正对于提高同步相量测量系统的准确性和可靠性具有重要意义。
研究不足与展望
算法的适用性还有待进一步验证,目前 只针对同步相量测量系统中的不良数据 进行辨识和修正,未来可以考虑将其应 用到其他类型的测量系统中。
分类器的性能还有提升空间,可以考虑采用 其他更先进的分类算法以提高分类准确率。
可以进一步研究不良数据的来源和 产生原因,从而更好地预防和控制 不良数据的产生。
02
同步相量测量系统概述
同步相量测量系统的定义与特点
华北电力大学电力系统分析2-07
![华北电力大学电力系统分析2-07](https://img.taocdn.com/s3/m/84341c7a7fd5360cba1adba4.png)
标准化残差方程:rN D 1 r D 1Wv W N v 标准化残差灵敏度矩阵:WN D 1W
T T 标准化残差的协方差矩阵:E[rN rN ] W N ( Err T )W N
D 1W (WR)W T D 1 D 1 (WR) D 1
协方差矩阵的对角元素全为1。
一、不良数据的检测
常用的不良数据检测方法有三种:
ˆ 1. J ( x ) 检测法
2. 加权残差检测法
3. 标准化残差检测法
一、不良数据的检测
ˆ 1. J ( x ) 检测法
(1) 假定电力系统没有不良数据
T T T T ˆ 目标函数为 J z ( x) rwz rwz v wzWW WW v wz v wzWW v wz
概述
1.不良数据检测和辨识的必要性
电力系统中测量系统的标准误差 大约为正常测量 范围的 0.5~2% 。 正常测量条件下,误差超过 3 的测量值出现的概 率仅 0.27% 。因此,误差超过 3 的测量值就可以 认为是不良数据。 但实用上,一般不良数据的界限往往大于 (6~7) 以上。显然,这种数值一定是工作不正常时的值, 即不良数据。 当电力系统出现不良数据时,需要通过检测与辨识 的方法处理,以满足状态估计对测量数据的要求。
(i=1,2,…,m)
一、不良数据的检测
3. 标准化残差检测法
T 标准化残差的协方差矩阵:E[rN rN ] D 1 (WR) D 1
协方差矩阵的对角元素全为1。 故有
2 ErN ,i 1
(i 1,2, L , m) (i 1,2, L , m)
当取 pe = 0.005,得到第 i 个标准化残差的检验阈值为
九、电力系统状态估计(二)
![九、电力系统状态估计(二)](https://img.taocdn.com/s3/m/9aa90f5077232f60ddcca1c7.png)
(33)
©版权所有
©版权所有
东南大学电气工程系
ˆ J ( x ) 检测的 H0和H1两种假设
当确定了阈值后,如果H0属真而拒绝H0,接受H1,则是误报警。 其出现的概率是pe,又称伪警概率。 如果H0不真而接受了H0,拒绝H1,则是漏报警。其出现的概率是 pd,又称漏检概率。 例如,若pe=0.05,即:
2 H0: J ( x ) < γ J = χ0.05 ( K ) ,则无不良数据,H0属真 ˆ 2 H1: J ( x ) ≥ γ J = χ0.05 ( K ) ,则有不良数据,H1属真 ˆ
(19)
由此可见, z(x)为vwz的二次型。 J ˆ 当正常情况下测量为正态分布时,由概率论可知, z(x) 就是c2分 c J ˆ 布。其数学期望和方差可以分别由(19)式的展开式求出。
©版权所有
东南大学电气工程系
ˆ J ( x ) 检测
ˆ 求 Jz(x) 数学期望
ˆ J z ( x) =
2 w w ,ii v wz ,i + 2 ∑ ∑ w w ,ij v wz ,i v wz , j ∑ i =1 j ≠i
©版权所有
东南大学电气工程系
小结
观测值 状态 量测 -----
真实值
估计值
估计误差
残差 -----
误差 ----v =z - h(x)
x h(x)
ˆ x ˆ z
% ˆ x= x−x
z
ˆ % ˆ z = h(x ) − z r ≡ z - z
©版权所有
东南大学电气工程系
加权残差
将残差方程用加权残差表示为:
vw = vwz + R−1eiαi = vwz + eiαwi
2009-新息图法电力系统不良数据检测与辨识
![2009-新息图法电力系统不良数据检测与辨识](https://img.taocdn.com/s3/m/0ae55e5bf01dc281e53af042.png)
新息图法电力系统不良数据检测与辨识张永超,黄彦全,宋廷珍,穆亚东(西南交通大学电气工程学院,四川成都 610031)摘 要:不良数据检测和辨识是电力系统状态估计的重要组成部分;所采用的新息图方法,结合动态和静态两方面理论,将具有具体物理意义的数据(新息向量),转化为虚拟假设条件下的等价表示,并利用基本的电路理论,达到检测和辨识坏数据以及拓扑错误的目的。
该方法具有模型简单、快速准确等优点。
以I EEE-14节点系统算例,初步验证了所提方法的有效性。
关键词:不良数据检测与辨识;新息图;拓扑错误Abstract:Detecti on and identificati on of bad data is one of the most i m portant parts of power syste m state esti m ati on.The in2 novati on graph technique based on dynam ic and static theory is p resented,which translates the material date(innovati on vec2 t or)int o an equivalent variable of another abstract domain f or detecting and identifying t opol ogy err or and bad data using the basic theory of circuit.This method is of si m p le model,s peediness and nicety,whose efficiency is verified by the examp le ofI EEE14.Key words:bad data detecti on and identificati on;innovati on graph;t opol ogy err or中图分类号:T M744 文献标识码:A 文章编号:1003-6954(2009)03-0014-02 在电力系统状态估计过程中,检测和辨识出不良数据,并消除其影响,从而为实时电力系统提供一个可靠的数据库,是状态估计器的一项非常重要的任务。
抗差估计法应用于状态估计中不良数据的检测和辨识
![抗差估计法应用于状态估计中不良数据的检测和辨识](https://img.taocdn.com/s3/m/c963eebd65ce050876321321.png)
6
浙 江 电 力 Z EIN L C RC P W R H J G E E T I O E A
2 0 年第 5 06 期
抗识
Hu e tma i n App id t t c n d n iy b r Esi to l o De e ta d I e tf e Ba t n S a e Ee tm a i n d Da a i t t si to
类 方法 简单 ,直观 ,但有 其缺 陷 。前 者检 测 的 不 良数 据 的可 靠 性 不 强 ,存 在 误 检 ( 即可 靠 数
据被 检测 为不 良数据 ) 和漏 检 ( 即有 的不 良数 据
些样 本 数 据被 称 为 不 良数 据 、粗 差 或 野值 ) , 如果不 加处 理地使 用这 些数 据或 仅在 估计器 中 加 人一 定 的技术 措施 ,则不 良数 据有可 能扭 曲
Ab ta t:Th tt si t n i 1 i otn ato sr c e sae e tmai sa1 mp ra tp r fEMS i o rs se o n p we y tms.Bu h xse c fb d d - tt e e itn e o a a t n me s r me td t n Elcrc lNewok Auo t n C ’ e a od d,a d t e l ifu n e tl s a i a u e n aa i e tia t r t mai a tb v i e o n n h y wil n e c l e - l e t t n rs ls.Ba aa d tcin i r i o a tf nci n o tt si to n p we y tms tC - i i e ut ma o d d t ee t s al mp rn u to fsae e tmain i o rs se .i a e o t n l n t il a aa whi p e r i a u e s mpi g d t y c a c i ae l te b d d t l a p a n me s r a l aa b h n e,f r e h cn he r l bl y o mi t e n o n a i g t ei ii f n a t sae e tmain.T e p p r u e y whl s c mb n d b atto ee t n a d h b re tmain,a d tt si t o h a e s s a wa i i o i e y slain d t ci u e si t e o n o n v ld ts i o o rs se fI ai ae t n p we y t mso EEE 1 1 8.Th e u s o v i it d rla i t h y i ee - e r s h h ws a al l y a eib ly o t e wa n d tc b a i n i f t n a d ie t iain. i n d ni c t o f o Ke r s:h b re t t n ;b d d t ;slain ;d tcin ;i e t i ain. y wo d u e si i ma o a aa atto ee to d nic t f o
不良数据分析报告
![不良数据分析报告](https://img.taocdn.com/s3/m/0ff8136b4a73f242336c1eb91a37f111f1850d99.png)
不良数据分析报告1. 引言不良数据是指在数据分析过程中出现的错误、缺失、重复或异常值等问题。
不良数据会影响数据分析结果的准确性和可靠性,因此对不良数据进行分析和处理是数据科学和统计学中非常重要的一环。
本文将介绍不良数据分析的步骤和方法,以帮助读者有效地识别和处理不良数据。
2. 数据质量评估在进行不良数据分析之前,首先需要对数据质量进行评估。
数据质量评估可以通过以下几个方面进行:2.1 数据完整性数据完整性是指数据集中是否存在缺失值。
缺失值可能会导致分析结果的偏差,因此需要对缺失值进行处理。
常见的处理方法包括删除缺失值、插补缺失值或利用其他变量进行预测填补缺失值。
2.2 数据一致性数据一致性是指数据集中是否存在重复值。
重复值可能会导致分析结果的重复计算,因此需要对重复值进行处理。
常见的处理方法包括删除重复值或将重复值合并为一个唯一值。
2.3 数据准确性数据准确性是指数据集中是否存在错误值。
错误值可能会对分析结果产生误导,因此需要对错误值进行处理。
常见的处理方法包括手动检查和纠正错误值,或利用其他变量进行矫正。
2.4 数据异常性数据异常性是指数据集中是否存在异常值。
异常值可能会对分析结果产生干扰,因此需要对异常值进行处理。
常见的处理方法包括删除异常值、转换异常值或利用其他变量进行预测替代异常值。
3. 不良数据分析方法在对数据质量进行评估之后,可以根据不良数据的具体情况选择合适的分析方法。
以下是几种常见的不良数据分析方法:3.1 数据可视化数据可视化是对数据进行可视化展示和探索的方法,可以帮助发现数据中的异常值、缺失值和错误值。
常见的数据可视化方法包括直方图、散点图、箱线图等。
通过可视化分析,可以更直观地发现数据中的不良数据。
3.2 统计分析统计分析是通过统计学方法对数据进行分析和处理的方法。
常见的统计分析方法包括均值、方差、相关性分析等。
通过统计分析,可以对数据的整体情况进行描述和比较,从而判断数据中是否存在不良数据。
电力系统分析复习思考题
![电力系统分析复习思考题](https://img.taocdn.com/s3/m/7bd87a8c915f804d2b16c1ba.png)
示为电压的幅值与相角,也可以用直角坐标表示为电压的实部与 虚部。电力系统的量测量一般是节点注入或支路的有功功率、无 功功率和节点电压幅值。在常规潮流中,如果把各 PQ 节点给定 的注入复功率和各 PV 节点给定的注入有功功率和电压幅值看作 量测量,则其量测数恰好等于状态量数。而在状态估计中量测数 一般多于状态量数。常规潮流与状态估计都是由已知量测值(给 定条件)求其状态量的计算过程。状态估计的实质是在量测量的 类型和数量上扩大了的广义潮流,而常规的潮流可以理解为特定 条件下的状态估计,可以说是狭义的潮流 9、简述电力系统状态估计与电力系统最优运行的关系(选)。 状态估计能建立可靠又完整的数据库。为现代化的调度中心能够 迅速、准确而又全面的地掌握电力系统的实际运行状态,预测和 分析系统的运行趋势起到了很大作用,保证了电力系统运行的安 全性和经济性,从而保证了电力系统最优运行。 10、为什么要进行电力系统等值处理? 在电力系统分析过程中,常常需要对系统进行等值处理,一方面 可以简化分析计算过程,减少分析计算量,另外一方面可以突出 分析重点,使我们更好地关注电力系统某些局部的运行状态变 化。 11、怎样进行电力系统等值处理? 常将电力系统原网络节点划分为内部系统节点集 I、边界系统节 点集 B 和外部系统节点集 E。内部系统节点集 I 和外部系统节点
集 E 不直接关联。需要求解的是外部系统的等值网络和等值边界 注入电流,使等值后在电力系统内部网络中进行的各种分析与未 等值时在真实系统中所做的分析结果相同,或者十分接近。其方 法主要有 WARD 等值、REI 等值、戴维南等值好人诺顿等值,计 算步骤如下:(1).根据给定的全系统参数和注入量,计算全系统 的潮流,等值前全系统的状态称为基态,其潮流称为基态潮流。 (2).消去外部网络,求出与基态相对应的,模拟外部系统的等值 网络及参数。(3).用等值后的网络,研究内部系统。 12、为什么要进行电力系统分块处理? 现代电力系统规模庞大,使进行各种分析的计算量很大,以致现 有计算工具无法满足计算速度的要求。分块处理可以达到利用现 有计算工具,大大缩短计算时间的要求。 13、怎样进行电力系统分块处理? 电力系统分块处理的基本思想是将大系统分割成许多较小的子 系统,首先解出个子系统的解,然后把分隔开来的各个子系统的 解组合起来,加以修正,而得到原来未分解的系统的解。 电力系统分块处理的方法主要有两类:一类是节点撕裂法,即将 原网络的部分节点“撕裂”开,把网络分解;另一类是支路切割 法,即在网络中选择部分支路,将这些支路切割,从而将整个电 力网络划分为若干个较小的网络。两者的协调变量不同,前者协 调变量是切割线电流,后者是分裂点电位。两种方法有各自的特 点,将两方法统一起来,用统一的公式描述产生了统一的网络的
如何进行数据分析的异常检测与排查
![如何进行数据分析的异常检测与排查](https://img.taocdn.com/s3/m/6a493bbbed3a87c24028915f804d2b160b4e86d2.png)
如何进行数据分析的异常检测与排查数据分析在现代社会中扮演着越来越重要的角色。
通过对大量数据的收集、整理和分析,我们可以从中发现有价值的信息,为决策提供支持和指导。
然而,数据分析过程中常常会遇到异常数据,这些异常数据可能会对分析结果产生不良影响。
因此,进行数据分析的异常检测与排查显得尤为重要。
本文将探讨如何进行数据分析的异常检测与排查,为数据分析工作者提供一些实用的方法和技巧。
一、数据收集与整理阶段的异常检测在进行数据分析之前,首先需要进行数据的收集和整理。
在这个阶段,我们可以通过一些基本的异常检测方法来排查可能存在的异常数据。
1. 数据缺失检查:检查数据中是否存在缺失值。
缺失值的存在可能会导致分析结果的偏差,因此需要及时发现并进行处理。
可以使用统计方法或可视化工具来检查数据的缺失情况。
2. 数据重复检查:检查数据中是否存在重复记录。
重复记录的存在可能会对分析结果产生误导,因此需要将其剔除或进行合并处理。
可以使用数据清洗工具或编程语言来检查数据的重复性。
3. 数据异常值检查:检查数据中是否存在异常值。
异常值的存在可能会对分析结果产生显著影响,因此需要进行异常值的检测和处理。
可以使用统计方法、箱线图等工具来检查数据的异常值情况。
二、数据分析阶段的异常检测在进行数据分析时,我们需要对数据进行进一步的异常检测,以确保分析结果的准确性和可靠性。
1. 数据分布检查:检查数据的分布情况是否符合预期。
可以使用直方图、密度图等工具来观察数据的分布情况,如果发现数据分布明显偏离正态分布或其他预期分布,可能存在异常情况。
2. 数据关联性检查:检查数据之间的关联性是否符合预期。
可以使用散点图、相关系数等工具来观察数据之间的关联关系,如果发现数据之间的关联关系与预期不符,可能存在异常情况。
3. 数据模型检查:检查数据模型的拟合情况是否符合预期。
可以使用回归分析、时间序列分析等方法来检查数据模型的拟合情况,如果发现模型的拟合效果较差,可能存在异常情况。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概述
残差方程
检测方法 1
辨识方法
不良数据的检测
当量测中存在不良数据时,量测误差矢量中某 些分量将有个别分量的值明显变大。 由残差方程可见,量测残差也会明显变大。 由目标函数的公式可知,目标函数的数值也会 变大。 三种检测方法
目标函数值检测法 加权残差检测法 标准化残差检测法
v T Av vi2 Aii Aij vi v j Jx
i 1 i 1 j 1 m m m
j i
概述
残差方程
检测方法 1
辨识方法
目标函数的分布特性
的数学期望值: EJ x ˆ Jx
m 2 i m
Aii E vi2 Aij Evi v j
可能吗?
概述
残差方程
检测方法
辨识方法
残差
残差
量测值和量测估计值之间的差 r z h( x ˆ)
估计值
残差和误差的关系
ˆx 将量测估计在真值x附近Taylor级数展开 x x ˆ ) h( x) H ( x)x h( x 代入残差表达式:
r z h( x ) H ( x)x v H ( x )x 得到: ˆ ) v H ( x)x r z h( x
概述
残差方程
检测方法
辨识方法
残差方程的作用
描述了残差和量测误差之间的线性关系
ri Wij v j Wi1 v1 Wi 2 v2 Wim vm
j 1 m
W矩阵的元素就是相应的比例系数 量测i的残差ri和所有量测误差有关
如果W有逆,我们就 可以用残差矢量r计算 出量测误差,把大于 3σ的找出来。
由正态分布的特性可知
P(| Z | ) 68.3% P(| Z | 2 ) 95.5% P(| Z | 3 ) 99.7%
只有0.3%的可能性使得Z-μ落在3σ范围之外
定义:误差大于3σ的量测数据叫坏数据,或不 良数据。
概述
残差方程
检测方法
辨识方法
W对角占优吗?
W既不可逆,也不对角占优,是引起不良数据 检测与辨识困难的根本原因。
概述
残差方程
检测方法
辨识方法
加权残差
为了便于进一步简化计算公式和分析,进入残 差方程的加权形式。 1 r R r 定义加权残差:w
i 定义加权量测误差:υw R υ i 理解:对每个量测量对应的加权误差 wi i 残差方程改写:
x H
T
ˆR x
T
1
T 1 ˆ H ( x) H x R v
1
1
r v H ( x) H
I H ( x) H
T 1 ˆ ˆ x R H ( x ) H x R v 1 T
ˆR x
1
T 1 ˆ H ( x) H x R v
不可靠 有局限性
概述
残差方程
检测方法
辨识方法
检测和辨识方法
检测的常用方法
使用目标函数极值进行检测; 用加权残差或标准化残差检测; 上述两种方法的综合使用; 量测量突变检测; 应用伪量测量的检测。
残差搜索法; 非二次准则法; 零残差法(它是非二次淮则法的一个发展); 估计辨识法。
概述
残差方程
检测方法 1
辨识方法
不良数据的检测-J检测法
利用估计后的目标函数进行坏数据检测的方法 ˆ 检测: 简称为 J x m T 1 T 1 2 ˆ ˆ ˆ Jx z h x R z h x r R r r wj j 1 将残差方程r=Wv代入上式: 2 T T 1 T 1 ˆ J x 是 分布 v W R Wv v R Wv J x 定义A=R-1W
1
概述
残差方程
检测方法
辨识方法
残差方程
r v H ( x) H
T
I H ( x) H
ˆR x
T
1
T 1 ˆ H ( x) H x R v 1
1
ˆR x
1
T 1 ˆ H ( x) H x R v
因为估计值和真值十分接近,上式的量测雅克 比矩阵都可以在估计值处取值,即:
r Wv W I H H R H H T R 1
T 1 1
残差方程
残差灵敏度矩阵
概述
残差方程
检测方法
辨识方法
残差灵敏度矩阵的性质
r Wv
1 T 1 T 1 W I H H R H H R
(1)W是奇异矩阵,其秩k=m-n; (2)W是等幂矩阵:WW=W; (3)WR-1W=R-1W; (4)WRWT=WR=RWT; (5)0<Wij<1。
T j j 1 2
自由度为k的 分布
常数项
正态分布
一般坏数据幅值比正常量测误差的标准差大许 多倍,所以这第三项的值会十分大。 因此,考察估计后目标函数的值就能确定量测 中是否存在坏数据。
概述
残差方程
检测方法 1
辨识方法
实用方法
考察目标函数是否超过某一事先确定的门槛值, 以确定是否存在不良数据。
r Wv W I H H R H H T R 1
T 1 1
真的可逆吗?
概述
残差方程
检测方法
辨识方法
残差矩阵
W可逆吗?
是m×m阶的,但它的秩是m-n 不能通过对W求逆来求误差向量
如果对角占优则具有最大量测误差的量测所对应的 残差一般也大。 但是,当冗余量测较低时,W可能不满足对角占优 的条件,最大残差和最大量测误差并不一致。
ˆ ~ N k , 2k 或 J x
ˆ k J x 2k ~ N 0,1
概述
残差方程
检测方法 1
辨识方法
3σ准则
ˆ ~ N k , 2k 或 J x
ˆ k J x 2k
~ N 0,1
根据3σ准则,即某正态随机变量的误差将以 99.75%的概率落在3σ区间之内,即:
量测坏数据的检测与辨识
内含量测预处理、拓扑错误辨识、遥测坏数据 的检测和辨识
量测预处理:去掉明显的坏数据 拓扑错误辨识:找出开关、刀闸的状态错误 遥测坏数据的检测和辨识
采用估计--检测和辨识--再估计--再检测和辨识 的迭代模式
概述
残差方程
检测方法
辨识方法
坏数据的可检测和可辨识性
可观测(估计)性
2
dt
标准正态分布 1, 0 对于任意的正态分布随机变量 P{| X | } 0.6827 正态分布随机变量落在μ ± 3σ区 P{| X | 2 } 0.9545 间内的概率几乎等于1。 P{| X | 3 } 0.9973
ˆ k J x 2k 3 ˆ 3 2k k J x
上面公式应以99.75%的概率得到满足
概述
残差方程
检测方法 1
辨识方法
坏数据检测性质
如果有一个坏数据发生在量测j上 v v j e j 计算新的目标函数
j ˆ) J ( x ˆ ) 2 e R Wv w jj J ( x j 2
1
ቤተ መጻሕፍቲ ባይዱ
理解:对每个量测量对应的加权残差 rwi
ri
rw Wwvw
1 T 1 Ww I R H H R H H T R 1 1
概述
残差方程
检测方法
辨识方法
标准化残差
通过残差方程,可以得到残差的方差阵 Var r E rr T WRW T WR 定义矩阵D D diag WR 定义标准化残差 rN D1 r 定义标准化残差灵敏度矩阵 WN D1W 标准化残差方程为: rN WN υ 是加权残差的一种,在国外早期的文献中,标准化残 差对检测和辨识单个不良数据有重要的作用。
概述
残差方程
检测方法
辨识方法
检测和辨识
人们在状态估计之前会对量测数据进行处理,处理分 析根据对不良数据处理水平不同分为三个层次:
人工检测和辨识 量测极限值检测
量测量突变检查 量测数据的相关性检查 计算机实时检测和辨识(数据的预处理) 只能发现明显 利用远动功能实现 的不良数据 粗检测和辨识 状态估计程序中的检测和辨识 通过大量正常的冗余量测,利用数学处理的方法处理不 良数据
辨识的常用方法
概述
残差方程
检测方法
辨识方法
不良数据监测与辨识的数学基础
1 e 正态分布 f ( x) 2 概率密度 E(x)= D( x)= 2
x
( x )2 2 2
1 分布函数 F ( x) 2 e
( t )2 2
当被研究的随机变量是 数量众多的相互独立的 随机变量之和,则他必 定服从正态分布或近似 正态分布的。
概述
残差方程
检测方法
辨识方法
实时数据的误差
量测值和真值总是存在差异,即误差 从采样到计算机数据库的全过程,每个环节都 可能受到各种随机干扰而产生误差 误差来源: