一种基于数据场聚类的雷达信号分选算法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一种基于数据场聚类的雷达信号分选算法
贾然;胡进
【摘要】针对传统聚类算法在雷达信号分选中存在的一些问题,提出了一种基于数据场聚类的信号分选算法.首先所有数据样本经过归一化计算,根据数据场理论计算样本的势值,通过寻找极大值点及其个数确定初始聚类中心和聚类数目,之后重新计算聚类中心.通过对频率捷变雷达的实验仿真,验证了算法的有效性.%Aimed at some problems existing in radar signal sorting based on the traditional clustering algorithm,a new signal sorting algorithm based on data field clustering is proposed.All data samples are calculated for normalization.According to the data field theory calculation sample of potential value,the initial clustering center and number are determined by finding the maxima and its numbers,and the clus ter centers are recalculated.The effectiveness of the proposed algorithm is verified through the experimental simulation of frequency agility radar.
【期刊名称】《现代防御技术》
【年(卷),期】2017(045)004
【总页数】6页(P124-129)
【关键词】雷达信号分选;数据场;聚类;频率捷变;等势线;Matlab
【作者】贾然;胡进
【作者单位】南京船舶雷达研究所,江苏南京211106;南京船舶雷达研究所,江苏南京211106
【正文语种】中文
【中图分类】TN957.5;TP391.9
复杂电磁环境下的雷达辐射源信号分选是雷达情报侦察的重要组成部分,是衡量雷达对抗情报处理能力的关键因素[1]。
对于已知的雷达信号,依赖于先验知识,其
处理的准确性和实时性已经得到了实践验证。
但对于未知雷达信号的分选则一直是雷达对抗情报处理中的难题[2]。
雷达信号分选算法有待进一步的发展,从而适应
如今日益复杂的信号环境。
聚类[3]是数据挖掘中的重要技术,是将物理或者抽象对象的集合分成由类似的对
象组成的多个类的过程,被广泛地应用于雷达信号分选当中[4]。
文献[5]采用k-
均值聚类算法雷达信号进行分选,利用欧式距离来描述脉冲之间的关联性,取得了不错的效果,但该算法需人为设定聚类数目,且噪声数据对其影响很大。
文献[6]
通过相似系数来代替欧式距离,用小波系数和传统参数联合分选,分选正确率达到96.2%,但是该算法不能动态获取初始的聚类中心和聚类数目。
文献[7]提出了数
据场的概念,将数据参数引入场空间,通过数据场中的辐射因子确定各层面数据的抱团特征,精准地找到初始中心聚类点,具有较好的可行性。
因此,本文提出了一种基于数据场聚类的雷达信号分选算法,将雷达信号数据引入数据场空间进行处理,利用数据场中势的概念,能够自动形成聚类数目和聚类中心,用欧氏距离表征信号参数之间的关联性。
该算法适合于各类复杂体制雷达信号分选,对噪声影响不敏感,不需要先验知识,具有较好的分选效果。
场的概念是英国物理学家法拉第在1837年提出的,开始是来描述物质粒子间的非接触互相作用。
随着场论思想的逐渐发展,其被抽象为一个数学概念,用于表征某个物理量或者数学函数在空间的分布规律。
在实际世界里,各个对象之间是相互联系、相互作用的,所以反映现实世界的数据之间也存在着相互联系、相互作用。
从
而进行聚类分析的数据并不是孤立空间中的每一个数据,可能对整个空间中的其他数据都具有一定影响力,例如各个物体之间的万有引力、点电荷之间的电场力,每个数据在整个数域空间的影响力可以看成一种数据场[8],数据场是一种客观存在的媒介。
数据通过数据场与其他数据发生相互作用,数据场是一种虚拟空间场,用于描述和计算单个数据对整个空间作用,数据在空间辐射能量的规律用场强函数[9-10]来表达。
数据发射其能量的形式和特性的不同将导致描述数据场的场强函数的差异[11]。
常用高斯影响函数来表述场强数据对象x在数据场中y点产生的场强函数度量如下:
式中:σ为辐射因子,表示数据点的影响力,在数据场中的影响就表现为等势线的间距,取常数;ρ反映该数据点的数据量,正常情况下取常数;d(x,y)表示数据点x到点y的欧式距离。
势函数定义为数据场中任何一点y上所有数据点的影响之和。
对于由n个数据点构成的场空间中任一点y的势函数定义为
由式(2)可知,势值和距离成反比,也就是说数据密集的地方势值大,数据稀疏的地方密度小。
2.1 数据场聚类
雷达侦察接收机输出到雷达信号处理的是密集重叠的脉冲流,每个脉冲以脉冲描述字(pulse description word,PDW)的形式来表示,每一个脉冲描述字主要包含以下5个参数:到达时间(time of arrival,TOA)、脉冲幅度(pulse amplitude,PA)、脉冲频率(radio frequency,RF)、脉冲宽度(pulse width,PW)、到达角(direction of arrival,DOA)。
雷达信号分选就是从这种随机交叠的脉冲流中分离出每一部雷达脉冲序列的过程[12]。
数据场的引入一定程度上解决了空间信息和属性信息相互分割的问题,为二者互相耦合解决实际问题提供了一个桥梁。
等势线是一种把数据场势值相等的点连起来形成的线,由等势线围绕形成的中心叫
做势心[13]。
势心是众多数据样本在单个或几个以上的属性数据值中所体现的极值特征。
因为势心是一定范围内势值的极大值点,通过势心的数目和位置,就能找出初始聚类中心和初始聚类数目。
但是通过抽象出来的势心和样本数据本身不一定重合,所以应该选择距离势心最近的样本数据作为初始聚类中心。
根据等势线图,可以较为直接地发现势心的位置,数学语言描述如下:
式中:Fmax为势心值;F(i,j)为势心周围的势值;(i,j)表示点所在的位置。
2.2 基于数据场聚类的雷达信号分选算法
雷达接收到的PDW中,根据到达时间(TOA)计算得到的脉冲重复频率(pulse repetition frequency,PRF)工作方式多、变化快,一般不作为预分选的依据,因
此本文采用脉冲频率(RF)、脉冲宽度(PW)、到达角(DOA)进行分选。
为了确保聚类的科学性,多维聚类中信号的各维参数值要求处在同一数量级上。
所以在参数进行计算之前先进行归一化的处理,对于n个PDW=(RF,PW,DOA),其归一化的过程如下:
式中:i=1,2,…,n。
经过归一化处理之后的脉冲描述字为
pdw=(rf,pw,doa),
式中:rf,pw,doa均为n维的列向量;pdw为n×3的矩阵。
数据场中任一点M的势值为
式中:辐射因子σ值的大小会影响等势线的间隔,σ值的大小与单个数据点的影
响范围成正比,与等势线稀疏成反比;ρ反映该数据点的数据量,经验证明对聚类结果没有影响,ρ取常数1;pdwi表示pdw的第i行,即第i个数据样本。
通过
计算找出数据场中点势值的极大值,极大值的个数作为聚类数目k,距离极大值最近的点作为初始聚类中心pdwi(i=1,2,…,k);之后计算各个数据样本点到每个聚类中心的距离,把数据样本划分到离它最近的那个中心所代表的类pdwj中,然
后分别计算新产生的类中数据样本的均值,把得到的均值作为新的聚类中心,把新的聚类中心和之前一次得到的中心进行比较,如果没有产生变化或者变化极小,则算法收敛,得到结果;反之假如新的中心和之前一次的中心对比产生了变化,就要依据新的聚类中心对所有数据样本重新进行划分。
直到满足算法的收敛条件为止。
本文收敛条件采取误差平方和准则函数:
式中:E为数据中所有对象平方误差的总和;pdwi=(rfi,pwi,doai)为样本点,表示给定的经过归一化处理后的数据样本;)为簇pdwj的平均值。
该准则函数使得到
的结果更加紧凑,各个聚类中心也更加准确。
算法步骤总结如下:
(1) 根据式(4)样本归一化;
(2) 根据式(5),(6)计算每个点的势值,再用式(3)找出数据场内的极大值点最近的
样本点作为初始聚类中心,极大值的个数作为初始聚类数目;
(3) 计算每个数据点到这些聚类中心的距离,并把数据样本划分到相应的类中;
(4) 对于每一类,重新计算其聚类中心,直到满足收敛条件即聚类中心不再变化为止,算法结束,否则跳转到步骤(3)。
为了验证本文算法的有效性,使用Matlab进行仿真实验。
实验仿真选用的4部频率捷变雷达参数如表1所示。
表1所示的就是4部雷达的参数,在不考虑脉冲丢失的情况下,每部雷达参数都
有一定的测量误差(误差为高斯噪声)。
在较短的时间内,可以认为DOA不发生变化,RF,PW是不断变化的。
在实际仿真中,考虑到计算的复杂度问题,把三维的雷达参数降阶为二维的来处理,选取RF,PW,DOA参数进行两两计算,从而复杂度从原来的O(n3)降为O(n2)。
经过仿真处理,利用数据场理论得到的势值分布通过等势线的形式表示出来,如图1~3所示(·代表雷达1,+代表雷达2,*代表雷达3,○代表雷达4)。
从图1~3可以看出,辐射因子σ对等势线的分布具有很大的影响。
数据样本的影响距离与σ值的大小成正比。
图1~3可以看出,σ取不同值时等势线的分布情况。
如果σ值取得很大,该数据场空间就看成仅有一个势心的数据样本,从而反映不
了数据样本准确的分布情况,因此选取恰当的影响因子σ显得尤为重要。
本文选
取σ=0.1[14],图1~3可以直观地看出雷达信号分为4类,初步结果如表2所示。
初始聚类中心经过重新计算得到最终聚类中心结果如表3所示。
本文算法与传统的传统聚类算法比如k- 均值聚类算法[15]相比较分选效果,由于
k- 均值聚类算法会随机选取聚类中心和数目,得到的结果也会不同,为了便于比较,仿真100次取平均值与本文算法相比较。
本文算法的迭代次数为4,而k- 均值聚类算法平均迭代次数为13,大大降低了运算量;正确分选概率的也从k- 均值聚类算法88.91%提高到98.59%。
正确分选概率公式为
分选正确率%.
4部雷达的分选结果如表4所示。
针对传统聚类算法需要预先设定聚类中心和聚类数目,无法有效应用于雷达信号分选的情况,本文把数据场的概念应用到信号分选领域并展开研究。
本文算法通过对势值的分析,就能确定聚类数目和聚类中心。
经过Matlab仿真验证,基于数据场聚类的雷达信号分选算法对复杂体制雷达具有较好的分选效果。
文中提到的算法虽然能够完成对聚类数目和聚类中心的确定,使正确分选概率得到提高,但是没有考虑脉冲丢失的情况,还需作进一步的研究。
辐射因子σ主要是
通过经验和实验得到,有关辐射因子σ的优化和设定还有待探讨。
【相关文献】
[1] 陆志宏.雷达侦察系统信号处理技术探讨[J].舰船电子对抗,2005,28(3):38-43. LU Zhi- hong.Research on Signal Processing Technology of Radar Reconnaissance System[J].Ship Electronic Countermeasure,2005,28(3):38-43.
[2] 何明浩.雷达对抗信息处理[M].北京:清华大学出版社,2010. HE Ming- hao.Radar Countermeasure Information Processing[M].Beijing:Tsinghua University Press,2010. [3] XU Rui,WUNSCH D.Survey of Clustering Algorithms[J].IEEE Transactions on Neural Networks,2005,16(3):645-678.
[4] 岳宏伟,罗景青,吕久明,等.雷达信号非均匀粒度聚类分选方法[J].火力与指挥控制,2008,
33(8):23-26. YUE Hong- wei,LUO Jing- qing,LÜ Jiu- ming,et al.Non Uniform Particle Size Clustering Algorithm for Radar Signals[J].Fire Control & Command Control,2008,
33 (8):23-26.
[5] 张莉,孙钢,郭军.基于K- 均值聚类的无监督的特征选择方法[J].计算机应用研究,2004,
23(3):23-24,42. ZHANG Li,SUN Gang,GUO Jun.Unsupervised Feature Selection Method Based on K- Mean Clustering[J].Research and Application of Computer,2004,
23 (3):23-24,42.
[6] 冯明月,何明浩,王冰切.基于改进相似熵的参数交叠雷达信号分选[J].电子信息对抗技术,2013,28(4):1-4. FENG Ming- yue,HE Ming- hao,WANG Bing- qie.Improved Parameter Similar Entropy Overlapping Radar Signal Sorting[J].Electronic Warfare Technology Based on 2013,28(4):1-4.
[7] 王海军,邓羽,王丽,等.基于数据场的C均值聚类方法研究[J].武汉大学学报,2009,34(5):626-629. WANG Hai- jun,DENG Yu,WANG Li,et al.Research on the C- mean Clustering Method Based on Data Field[J].Journal of Wuhan University,2009,34(5):626-629. [8] 淦文燕,李德毅,王建民.一种基于数据场的层次聚类方法[J].电子学报,2006,34(2):258-262. GAN Wen- yan,LI De- yi,WANG Jian- min.A Hierarchical Clustering Method Based on Data Field[J].Journal of Electronics,2006,34 (2):258-262.
[9] 李德仁,周月琴,金为铣.摄影测量与遥感概论[M].北京:测绘出版社,2001. LI De- ren,ZHOU Yue- qin,JIN Wei- xi.Photogrammetry and Remote Sensing Survey[M].Beijing:Surveying and Mapping Press,2001.
[10] 张红昌,龚亮亮,阮怀林,等.一种新的未知雷达辐射源聚类分选方法[J].计算机工程与应用,2008,44(27):200-202. ZHANG Hong- chang,GONG Liang- liang,RUAN Huai- lin,et al.An Unknown Radar Emitter Sorting Method Based on the New[J].Computer Engineering and Applications,2008,44 (27):200-202.
[11] 余建桥,基于数据场改进的PAM聚类算法[J].计算机科学,2005,32 (1):165-168. YU Jian- qiao,The Data Field Improved PAM Clustering Algorithm[J].Based on Computer Science,2005,32 (1):165-168.
[12] 罗景青,贺平.雷达对抗原理[M].合肥:解放军电子工程学院出版社,2003. LUO Jing- qing,HE Ping.The Principle of Radar Countermeasure[M].Hefei:Electronic Engineering Institute
Press,2003.
[13] 李兴生.基于云模型和数据场的分类和聚类挖掘研究[D].南京:解放军理工大学,2003. LI Xing- sheng.Classification and Clustering Mining Based on Cloud Model and Data
Field[D].Nanjing:PLA University of Science and Technology,2003.
[14] 国强,宋文明,南浦龙,等.基于数据场与云模型的多模雷达信号分选算法[J].哈尔滨工业大学学报,2015,47(11),76-81. GUO Qiang,SONG Wen- ming,NAN Pu- long,et al.Data Field and Cloud Model of Multi- Mode Radar Signal Sorting Slgorithm[J].Journal of Harbin Institute of Technology,2015,47 (11),76-81.
[15] 聂晓伟.基于K- Means算法的雷达信号预分选方法[J].电子科技,2013,26(11):55-58. NIE Xiao- wei.Radar Signal Pre Sorting Algorithm K- Means Algorithm[J].Electronic Science and Technology,2013,26 (11):55-58.。