基于Kalman滤波思想的接触线高度检测数据粗差修正算法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
运营管理
基于Kalman滤波思想的
接触线高度检测数据粗差修正算法
王斌1,王婧1,杨志鹏2,刘晓峰3,曹春生1
(1.中国铁道科学研究院集团有限公司基础设施检测研究所,北京100081;
2.中国国家铁路集团有限公司铁路基础设施检测中心,北京100081;
3.中国铁路西安局集团有限公司检测所,陕西西安710054)
摘要:接触线高度平顺性是评价接触网设备动态运行质量的重要指标。
针对接触线高度检测
数据中的粗差,基于Kalman滤波思想提出相应的粗差辨识与修正算法。
将接触线高度视作一个
连续平稳系统,利用矩形窗函数定义系统状态值,实现检测数据的分段线性化;依据系统状态
值的回归预测方法和状态差异的量化方案,构建粗差辨识与修正算法,并引入适用于锚段关节
处双支接触线采集特征的回溯机制;基于大量实测数据,采用显著性检验等统计方法确定算法
参数,并从回溯、修正、运用和实时性等方面,对算法有效性和可行性进行分析验证,结果表
明:该算法能够完成各类接触线高度检测粗差的高速实时辨识与修正。
关键词:接触网;接触线高度;检测数据;粗差修正;Kalman滤波;回溯机制
中图分类号:U225 文献标识码:A 文章编号:1001-683X(2024)01-0162-07
DOI:10.19549/j.issn.1001-683x.2023.07.28.001
1 研究背景
为确保动车组列车运行秩序,提升运营安全性和可靠性,需利用检测装置对接触网系统关键参数进行测量和分析,以便及时掌握设备运行状态。
接触线高度平顺性作为影响弓网运行质量的核心参数之一[1],是评价弓网匹配关系的重要指标,但接触网几何参数检测装置安装在车顶,受强光、雨雪和高压电磁干扰等因素影响,即便设计良好的采样系统,也不可避免会出现测量误差。
根据长期经验和统计理论,动态检测中往往包含1%~5%的数据严重偏离真实值,甚至极端情况下可达10%~20%[2]。
这种严重偏离真实值的测量结果被称为粗差或异常值,当检测数据中存在粗差时会对综合评价结果的客观性和准确性产生影响。
基金项目:中国铁道科学研究院集团有限公司科研开发基金项目(2023YJ098)
第一作者:王斌(1993—),男,助理研究员,硕士。
E-mail:****************
通信作者:王婧(1984—),女,副研究员,硕士。
E-mail:*******************
基于计算机视觉的接触网几何参数测量装置在不
同采集环境下的干扰数据特征不同,如强光会影响接
触线成像中的灰度阈值分割算法,产生分散的“点状”
干扰,而雨雪会影响拍摄视角,产生连续的“线状”
干扰。
目前,针对系统采集端有一些基于统计规律的
传统异常值诊断算法,如PauTa准则、Grubbs准则、Dixon准则等,上述方法对数据分布的依赖严重[3],算法执行逻辑也相对简单,在辨别不同粗差类型时效果
差异较大,存在较多误判、漏判情况,难以满足现阶
段的检测数据运用需求。
近年来,也有学者将其他算法引入多项工程领域
的粗差探测与修正中。
赵天辉等[4]利用空间密度聚类
算法对电力负荷曲线进行分类,通过负荷期望值的置
信区间和负荷样本相互偏差的四分位数,构建了不同
类别的异常数据域。
高英博等[5]利用K均值聚类算法
和最近邻算法得到建筑能耗数据的粗差分布特征,有
效提升了能耗预测模型的精度。
以上研究均采用无监
督学习方法,能够通过特定度量方式实现正常与异常
数据的有效区分,但该类方法难以兼顾接触线的连续
布置特征,容易导致部分修正结果不符合实际。
王丽
荣等[6]基于卷积神经网络构建大坝安全监测数据异常
识别模型,通过人工生成数据训练模型,有效实现了
大坝安全监测数据的5种异常模式识别。
该方法利用深
度学习进行粗差辨识,其训练和运用过程均需将监测
数据转化为图像,且仅对预先设定的少量异常数据模
式有效,不满足接触线高度的高速在线采集需求。
朱
斯杨等[7]结合隶属云3b准则,以水电站位移和渗流监
测数据序列的期望和带宽序列的均值构造控制函数,
提出基于隶属云的监测数据异常识别算法。
该方法对
粗差含量较大的监测数据序列作用显著,但其本质仍
是采用统计原理过滤数据序列中的小概率采样值,对
连续粗差的处理效果不佳。
由此可见,现有研究多基于特定的工程背景和数
据模式,对接触线高度粗差修正的适用性普遍较差。
因此,需要结合接触网几何参数检测装置采集原理、
检测数据特点和接触网空间布置特征等,研究具备实
时性、可靠性、准确性的接触线高度粗差修正算法。
考虑Kalman滤波作为一种动态数据处理方法,无需存储大量不同时刻的观测数据便可解决大部分问题,非常便于在实时动态检测系统中实现[8]。
在此,基于Kalman滤波思想和接触线空间布置特征,提出一种适用于接触线高度检测数据粗差的稳健修正算法,采用分段线性化方法对接触线高度各采样点处的检测数据作回归预测,通过对比测量值和预测值进行粗差辨识与修正,并引入回溯机制以避免过修正现象。
2 接触线高度检测数据特征
由于计算机视觉测量技术具有分辨精度高、测量速度快等优点[9],使基于该技术的接触网几何参数非接触式测量方法在我国弓网综合检测装置(1C)中广泛运用。
非接触式几何参数检测设备运用等距采样原则,通常将数据存储在2个通道内,在锚段关节或线岔位置时分别存储双支接触线的几何参数,而在其他位置2个通道中存储的数据相同。
由该原理可知,单个通道中存储的接触线高度检测数据会存在跳变点,在修正粗差时应避免对此类跳变造成影响。
锚段关节附近的接触线高度检测数据跳变点示例见图1,图1(a)为线阵相机采集的锚段关节附近的原始图像,图(b)和图(c)分别为经坐标变换后存储在2个通道中的实测数据。
3 算法原理
3.1 Kalman滤波基本思想
经典Kalman滤波用于估计线性系统的最优状态,其基本思想是:利用前一刻系统状态估计值对当前时刻的系统状态进行预测,再结合当前时刻系统状态的
接触线1
接触线2
a)相机采集的接触线图像
图1 锚段关节附近的接触线高度检测数据跳变点示例
观测值,给出当前时刻系统状态的最优估计值。
设t -1时刻系统状态的估计值为x t -1、不确定度为σt -1,设t 时刻系统状态的预测值为y t 、不确定度为σy ,设t 时刻系统状态的测量值为z t 、不确定度为σz ,Kalman 滤波能够以最小均方误差准则给出t 时刻的系统状态估计值x t ,且估计结果的不确定度σt 小于σy 和σz (见图2)。
由于在较短距离内接触线高度采样数据线性变化[10],可借助Kalman 滤波思想,在较短距离内采用线性回归方法,对当前时刻的接触线高度采样数据进行预测,并将预测值和当前时刻的测量值进行对比,以确定测量值是否为粗差。
3.2 分段线性化与回归预测
若将接触线高度视作一个连续平稳系统,并将较短距离内的接触线高度采样数据视作系统状态值,则两相邻系统状态值之间存在线性关系。
因此,可由前一刻的系统状态值对当前时刻的系统状态作回归预测。
设接触线高度采样信号为h (k ),引入参数δ,设接触线高度可在δ个采样点范围内近似线性化,将t 时刻的系统状态值(即滑动窗)定义为:
φt =h (k )∙f δ(k , t )
,
(1)
式中:k 为采样点序号;f δ
(k , t )为矩形窗函数。
依据上述定义,两相邻时刻的系统状态值φt 与φt -1中采样点的差集为:
φt -φt -1={h (t +δ-1)} 。
(2)
由式(2)可知,与t -1时刻相比,t 时刻系统状态值中的新增采样点仅有h (t +δ-1)。
因此,预测t 时
刻的系统状态值等价于利用t -1时刻的系统状态值构建一元线性回归模型。
设φt -1中的采样点序列为{〔k , h (k )〕|k =
1, 2, ⋯, δ},则接触线高度采样信号h 关于采样序
号k 的回归方程为:
h (k )=β0+β1
k ,(3)
式中:β0和β1为回归方程系数。
由式(3)计算采样点序号为t +δ-1时的接触线
高度预测值h
(t +δ-1),则t 时刻的系统状态预测值为:
φt ={h (t ), h (t +1), ⋯, h (t +δ), h (t +δ-1)} 。
(4)
3.3 粗差辨识与修正
设t 时刻系统状态测量值为:
φˉt ={h (t ), h (t +1), ⋯, h (t +δ), h ˉ(t +δ-1)} ,(5)
式中:h
ˉ(t +δ-1)为采样点序号为t +δ-1时的接触线高度测量值。
粗差辨识与修正的核心是将t 时刻系统状态测量值
φ
ˉt 与预测值φt 进行对比。
粗差辨识与修正原理见图3,点A 、B 分别表示采样点序号为t +δ-1时的接触线高度预测值h
(t +δ-1)和测量值h ˉ(t +δ-1)。
由图3可知,φ
t 与φˉt 中仅A 、B 两点不同。
因此,可采用A 、B 两点间的欧式距离来度量φt 与φˉt 的差异,若将φ
ˉt 与φt 的差异记为|φˉt -φt |,则|φ
ˉt -φt |=|h ˉ(t +δ-1)-h (t +δ-1)| 。
(6)
引入参数ε,t 时刻系统状态φt 按如下规则确定:若φ
ˉt 与φt 的差异超出给定的阈值ε,则认为测量值h
ˉ(t +δ-1)为粗差采样点,并将其修正为预测值h (t +δ-1);否则,认为测量值h
ˉ(t +δ-1)为正常采样点,保留其值并舍掉预测值h
(t +δ-1)。
3.4 滑动窗回溯
依据上述方法进行粗差修正可能会出现过修正现
图2
Kalman 滤波基本思想
图3 粗差辨识与修正原理
象。
造成过修正现象的原因为:锚段关节附近检测装置的可视范围内存在双支接触线,其中一支抬高下锚,但当其抬高大于测量范围时,数据中的接触线会由双支突变为单支,导致存储通道内相邻采样点接触线高度的差值大于给定的阈值ε,突变后的测量值会被当成粗差修正为预测值,多次迭代后,修正值逐渐偏离真实值。
为了避免过修正现象,引入回溯机制:若某时刻系统状态值中所有采样点均被修正为预测值,则由该时刻系统状态值的第1个采样位置处的测量值开始,重新构造该时刻的系统状态值,并以新构造的系统状态值重新开始后续的粗差辨识与修正(见图4)。
图4中,s 时刻的系统状态值φ's 中所有点均为预测值,则回溯到获得h
(s )的s -δ时刻,从h ˉ(s )开始重新构造s 时刻的系统状态值φs ,并由此完成后续迭代。
4 参数分析
在阐述算法原理时,引入2个参数δ和ε,分别表示系统状态值中包含的采样点个数和辨别采样点是否为粗差的诊断阈值。
参数δ和ε的取值均与检测系统的采样频率有关,目前我国主流接触网几何参数检测装置主要依靠安装在车辆轮轴上的光电编码器触发采集,实现等距采样和实时车速监测。
因此,后续分析中均以采样频率为4次/m 的检测系统为准,对于其他频率的等距采样系统,δ和ε的取值可按比例换算。
4.1 参数δ
参数δ与接触线高度可近似线性化的范围有关。
δ取值越大,参与预测的采样点数量越多,预测的准确
性会越高。
但由于最小二乘法的时间复杂度为O (n 3),随着δ增大,会导致求解回归方程的运算成本显著增加,并且当δ取值增大到一定程度后,系统状态值中接
触线高度检测数据的线性化水平会变差。
选取一定数量的接触线高度检测数据,采用相关系数检验方法,在不同的δ取值下对式(3)的回归方程作显著性检验,以通过显著性检验的系统状态值个数占系统状态值总数的比例(简称显著状态值占比)与δ之间的关系为依据,选择恰当的δ值。
在99%置信度下,显著状态值占比与δ之间的关系见图5。
由图5可知,当δ<15时,显著状态值占比会随着δ的增大而迅速增加;当15≤δ<112,显著状态值占
比会随着δ的增大而缓慢增加;当δ≥112时,显著状态值占比会随着δ的增大而逐渐减小。
任选1段包含4 200个采样点的接触线高度检测数
据,采用上述算法进行粗差辨识与修正,分析不同δ取值与算法运行时长的关联关系,试验结果见图6。
由图6可知,随着δ的增大,算法运行时长总体呈现上升趋势。
因此,在兼顾运算效率和预测准确度的条件下,
δ值可选为15。
图4 回溯机制
图
5 显著状态值占比与δ的关系
图6 算法运行时长与δ的关系
高速综合检测列车的接触网几何参数采集系统缓存数据量为2 400个采样点。
该算法修正时所需数据仅为系统状态值中的采样点数,按照上述分析,该值远小于采集系统缓存。
因此,将该算法集成至高速综合检测列车的接触网几何参数采集系统具备可行性。
4.2 参数ε
参数ε是判断测量值与相同位置预测值是否存在显著差异的阈值,预测值由前一时刻的系统状态值通过
线性回归方法获得,且预测值的预测周期为1个采样点,由此可知,参数ε的取值与相邻接触线高度测量值之间的距离有关。
选取一定数量的接触线高度检测数据,计算相邻接触线高度测量值之间的距离。
由于检测系统的分辨力为1 mm,所以接触线高度测量值之差均为整数,对不同计算结果按其占比进行统计(见图7)。
由图7可知,计算结果为0、1、2、3、4、5的合计占比为98.88%,其余各值的合计占比为1.12%且单项占比均不足0.50%。
因此,根据统计原理,可认为相邻接触线高度测量值之间的距离大于5 mm为非正常情况,即取ε值为5。
5 实证分析
5.1 修正效果验证
为验证该算法对粗差的修正效果,特选1段接触线高度检测数据质量相对较差的区段进行分析,数据中有3处单点粗差和2处连续粗差,除采用该算法外,还选用4种基于统计规律的传统异常值诊断方法作对比分析,不同方法的粗差修正效果见图8。
在图8(a)检测波形中,a、b、d区域包含单点粗差,c、e区域包含连续粗差。
对于单点粗差,当粗差值与附近正常值差异较小时,如a、d区域,传统异常值诊断方法辨识效果均不理想;当粗差值与附近正常值差异较大时,如b区域,多数传统异常值诊断方法可以辨识并修正。
对于连续粗差,如c、
e区域,传统异常值诊断方法均无法辨识和修正。
相较于传统异常值诊断方法,对上述各类粗图7
相邻接触线高度测量值之间的距离统计
(a)原始检测波形
(
d) Grubbs准则修正结果
(b)文中算法修正结果
(
e) Dixon准则修正结果
(c) PauTa准则修正结果
(f) Chauvenet准则修正结果
图8 不同方法的粗差修正效果对比
差,该算法均能有效辨识并修正。
由此可见,该算法能够准确地处理接触线高度检测数据中出现的各类粗差。
5.2 运用效果验证
Q/CR 841—2021《接触网动态检测评价方法》采
用接触网动态性能指数(CDI )对接触网动态运行质量
进行综合评价[11]。
CDI 由4个分量指标加权得到,其中分量指标CDI H 由跨内接触线高度标准差计算,用于评价接触线动态高度平顺性 [12]。
为验证该算法运用效果,从某高速铁路实测数据中截选1段,该段数据包含6个跨,修正前后的接触线高度数据见图9,其中竖直方向的虚线表示接触网定位点,字母表示各跨的编号。
由图9可知,修正后各跨接触线高度曲线的连续性、平稳性有显著提升。
各跨修正量及修正前后接触线高度标准差见图10。
可以看出,当跨内接触线高度检测数据质量总体较差时(如c 、e 、f ),修正点数占比明显较大,且修正后的接触线高度标准差显著下降,表明该算法能够改善因测量粗差导致的接触网综合评价结果失实情况,能够有效提升评价结果的客观性和准确性。
6 结束语
针对接触线高度检测数据粗差,提出一种稳健修正算法。
依据接触线布置特征,将接触线高度视作一个连续平稳系统,并将较短距离内的接触线高度采样数据视作系统状态值,由两相邻时刻系统状态值之间的线性关系,给出系统状态值的回归预测方法。
采用欧式距离定义系统状态测量值与预测值之间的差异程度,以Kalman 滤波思想为基础,构建接触线高度检测数据粗差辨识与修正算法,通过监测滑动窗内修正采样点数量变化,引入回溯机制。
在特定采样频率下,通过分析窗长及回归显著性与算法运行时长的关系,给出兼顾准确性与运算效率的最佳窗长;通过分析诊断阈值与相邻接触线高度测量值之间的关联性,给出基于实测数据统计结果的最佳诊断阈值。
从回溯、修正、运用和实时性等方面对算法进行验证,结果表明:该算法适用于目前主流接触网几何参数采集系统,能够有效完成各类接触线高度检测粗差的高速实时辨识与修正。
参考文献
[1] 汪宏睿,刘志刚,宋洋.基于ZAMD 的高速铁路弓网
接触压力及接触线不平顺时频分析[J ].铁道学报,2016,38(1):41-47.
[2] 祝转民,秋宏兴,李济生,等.动态测量数据野值的
辨识与剔除[J ].系统工程与电子技术,2004,26(2):147-149,190.[3] 王同军.高速铁路弓网检测监测体系研究[J ].中国
铁路,2021(3):1-7.
[4] 赵天辉,张耀,王建学.基于空间密度聚类和异常数
据域的负荷异常值识别方法[J ].电力系统自动化,2021,45(10):97-103.[5] 高英博,顾中煊,罗淑湘,等.能耗预测导向的建筑
能耗异常数据识别与修复[J ].科学技术与工程.2019,19(35):298-303.
[6] 王丽蓉,郑东健.基于卷积神经网络的大坝安全监
测数据异常识别[J ].长江科学院院报,2021,38(1):72-77.[7] 朱斯杨,李艳玲,卢祥,等.基于隶属云的安全监测
异常数据识别方法研究[J ].人民长江,2021,52(2
):
197-200.
图9 修正前后的接触线高度数据对比
图10 各跨修正量及修正前后标准差
[8]张月超,陈义.基于改进Kalman滤波算法的粗差修正及应用[J].测绘与空间地理信息,2013,36(12):257-259.
[9]周威,孙忠国,任盛伟,等.基于多目立体视觉的接触网几何参数测量方法[J].中国铁道科学,2015,36(5):104-109.
[10]汪海瑛,周威,孙刚,等.接触线高度检测数据异常值识别技术[J].中国铁路,2018(6):93-97.[11]中国国家铁路集团有限公司.接触网动态检测评价方法:Q/CR 841—2021[S].北京:中国铁道出版
社有限公司,2021.
[12]王婧,张文轩,王斌,等.弓网运行质量指数评价函数优化研究[J].中国铁路,2020(8):1-6.
责任编辑卢敏
收稿日期 2023-07-28
Gross Error Correction Algorithm of Contact Wire Height Detection Data
Based on Kalman Filtering
WANG Bin1, WANG Jing1, YANG Zhipeng2, LIU Xiaofeng3, CAO Chunsheng1
(1. Infrastructure Inspection Research Institute, China Academy of Railway Sciences Corporation Limited, Beijing 100081, China;
2. Railway Infrastructure Inspection Center, China State Railway Group Co., Ltd., Beijing 100081, China;
3. Testing Institute, China Railway Xi’an Group Co., Ltd., Xi’an Shaanxi 710054, China)
Abstract: The regularity of contact wire height is an important index to evaluate the dynamic operation quality of OCS equipment.Aiming at the gross error in contact wire height detection data, this paper proposes a corresponding identification and correction algorithm based on Kalman filtering.The contact wire height is regarded as a continuous and stable system, and the system status value is defined by rectangular window function to realize piecewise linearization of detection data. According to the regression prediction method of system status value and the quantification scheme of status difference, the gross error identification and correction algorithm is constructed, and the backtracking mechanism suitable for the acquisition characteristics of double-branch contact wires at overlap is introduced. Based on a large number of measured data, statistical methods such as significance test are used to determine the algorithm parameters, and the effectiveness and feasibility of the algorithm are analyzed and verified from backtracking, correction, application and real-time performance.The results show that this algorithm can complete high-speed real-time identification and correction of various types of gross errors in contact wire height detection.
Keywords: OCS; contact wire height; detection data; gross error correction; Kalman filtering; backtracking mechanism。