结合卷积神经网络和随机森林的辐射源个体识别
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
doi :10.3969/j.issn.1001-893x.2021.06.011
引用格式:侯思尧,李伟,李永光,等.结合卷积神经网络和随机森林的辐射源个体识别[J].电讯技术,2021,61(6):728-731.[HOU Siyao,
LI Wei,LI Yongguang,et al.Specific emitter recognition by combining convolutional neural network and random forest[J].Telecommunication
Engineering,2021,61(6):728-731.]
结合卷积神经网络和随机森林的辐射源个体识别
∗
侯思尧∗∗
,李㊀伟,李永光,凌㊀杰,黄黔川
(电子信息控制重点实验室,成都610036)
摘㊀要:为提高辐射源个体识别准确度,解决工程化应用问题,同时避免在信号样本有限的情况下单一识别算法的局限性,提出了一种结合卷积神经网络和随机森林的辐射源个体识别方法㊂该方法分别利用卷积神经网络和随机森林训练生成两组个体识别模型,然后采用识别概率统计法生成不同辐射源个体的综合权值向量,最后根据权重向量形成针对不同辐射源个体的综合识别模型㊂仿真结果表明,相较于单一算法,所提方法能够提升整体识别准确率,同时,对不同辐射源个体均有较好的适用性㊂
关键词:辐射源个体识别;卷积神经网络;随机森林;综合权值开放科学(资源服务)标识码(OSID
):
微信扫描二维码
听独家语音释文与作者在线交流享本刊专属服务
中图分类号:TN971㊀㊀文献标志码:A㊀㊀文章编号:1001-893X (2021)06-0728-04
Specific Emitter Recognition by Combining Convolutional
Neural Network and Random Forest
HOU Siyao,LI Wei,LI Yongguang,LING Jie,HUANG Qianchuan
(Science and Technology on Electronic Information Control Laboratory,Chengdu 610036,China)
Abstract :In order to improve specific emitter identification accuracy and solve the engineering application problems,a new specific emitter recognition algorithm based on the combination of convolutional neural net-work(CNN)and random forest is proposed.This algorithm can avoid limitations of single algorithm when the signal sample is limited.It provides two groups of specific emitter identification model by using CNN and random forest,then applies probability statistics to obtain the comprehensive weight of different specific emitter,finally produces comprehensive identification model by using comprehensive weight.Simulation re-sults show that the proposed method can increase specific emitter identification accuracy and is suitable for different specific emitters.
Key words :specific emitter recognition;convolutional neural network;random forest;comprehensive weight
0㊀引㊀言
辐射源信号个体识别首先利用表征个体指纹特征的属性,如包络上升沿㊁下降沿㊁顶部起伏等,通过傅里叶变换等手段完成指纹特征的提取,再采用相
应的个体识别方法实现对同类辐射源的不同个体的识别㊂
目前利用机器学习的个体识别方法方面主要包括深度学习和集成学习两类,均需要根据个体样本
㊃
827㊃第61卷第6期2021年6月
电讯技术
Telecommunication Engineering
Vol.61,No.6June,2021
∗∗∗收稿日期:2021-03-06;修回日期:2021-04-08通信作者:125371206@
开展识别模型训练,然后根据训练后的模型完成未知个体的识别㊂其中,深度学习方法首先提取辐射源个体特征,然后构建多层网络,将提取的特征作为输入开展个体识别训练,训练期间利用多层网络组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示,提升识别准确率㊂典型深度学习方法包括卷积神经网络[1-4]㊁深度置信网络[5]等,通过二维分布图或多维的描述作
为输入,通常由于网络层级较大,导致计算量大,不利于工程应用㊂
集成学习首先组成一组个体学习器,再用某种策略将它们结合在一起,使其具有较好的分类效果和泛化性能,典型方法有随机森林[6]㊁Adaboost[7]㊁GBDT[8]等㊂随机森林具有高维特征处理㊁数据适应性强和较好的抗噪能力,但在噪声较大的分类或回归问题上容易出现过拟合;Adaboost方法在数据不平衡的情况下容易导致分类精度下降,训练耗时长且易受噪声干扰;GBDT方法的多个弱学习器之间存在依赖关系,难以并行训练数据㊂
本文采用优势互补的方式,将卷积神经网络和随机森林方法进行综合,同时,从工程化应用角度考虑,减少卷积神经网络层数,最终形成针对不同辐射源的综合识别模型㊂通过仿真验证,本文提出的识别方法具有运算时间短㊁识别概率高的特点㊂
1㊀结合卷积神经网络和随机森林的辐射源个体识别
㊀㊀本文提出的辐射源个体识别流程如图1所示
㊂
图1㊀辐射源个体识别流程
Step1㊀将所有辐射源信号进行预处理并建立标签,生成数据集M,随机抽取其中的80%作为训练集T,剩余的20%作为测试集C,其中,抽取的辐射源信号满足数据标签均匀分布,对于数据量少的个体通过同标签数据随机填补,以保证不同个体的训练样本数量基本一致㊂
Step2㊀依次提取训练集T中各辐射源信号的指纹特征,生成辐射源特征矩阵A,用于下一步的训练与实际分类处理㊂
Step3㊀构建基于卷积神经网络的深度学习模型,考虑工程化应用,采用3个卷积层㊁3个池化层㊁3个激活层以及输入层和输出层㊂将Step2生成的辐射源特征矩阵作为输入进行训练,生成个体识别模型㊂
Step4㊀构建基于随机森林的集成学习模型,将Step2生成的辐射源特征矩阵作为输入进行训练,生成个体识别模型㊂
Step5㊀将Step2中的辐射源特征矩阵作为输入,分别利用Step3㊁Step4的个体识别模型进行个体识别,并基于两种模型的识别结果,采用识别概率统计的方法生成不同辐射源个体的综合权重向量,即卷积神经网络和随机森林的权重值,最后根据综合权重向量形成针对不同辐射源个体的综合识别模型㊂
为了适应实际应用中电磁环境的变化,将新获取的数据M add添加到辐射源信号数据集M中形成新的数据集M new,定期执行Step1~5,对训练模型进行更新㊂
Step6㊀依次提取测试集中各辐射源信号的指纹特征,生成辐射源特征矩阵,利用Step5生成的综合识别模型进行个体识别验证㊂
2㊀综合权值的确定
2.1㊀利用卷积神经网络生成个体识别模型
构建卷积神经网络,训练基于深度学习的个体识别模型㊂卷积层的卷积核为一维向量,激活层为ReLU函数,输出层由一层全连接网络和Softmax分类器组成㊂其中,卷积层1的卷积核为1ˑ25,步长为2,卷积核个数为70;卷积层2的卷积核为1ˑ16,步长为2,卷积核个数为140;卷积层3的卷积核为1ˑ8,步长为2,卷积核个数为280㊂池化层1㊁2㊁3均采用最大池化,池化大小为1ˑ4,步长为2,如图2所示㊂将特征矩阵A作为输入,生成基于卷积神经网络的辐射源个体识别模型M dpl㊂
㊃927㊃
第61卷侯思尧,李伟,李永光,等:结合卷积神经网络和随机森林的辐射源个体识别第6期
图2㊀卷积神经网络结构
2.2㊀利用随机森林网络生成个体识别模型
构建随机森林网络,训练基于集成学习的个体识别模型㊂通过K 个决策树和信息增益构建随机森林网络,其中K 为辐射源个体数的20倍,用于分割节点的特征子集合个数为特征集合个数的均方根㊂将特征矩阵A 作为输入,生成基于随机森林网络的辐射源个体识别模型M eml ㊂
2.3㊀辐射源个体综合权重向量计算
将特征矩阵A 作为输入,分别利用识别模型M dpl 和M eml 进行个体识别,并基于识别结果的概率统计确定个体识别模型M dpl 的权重向量w dpl 以及个体识别模型M eml 的权重向量w eml ,并保存模型参数㊂权重向量算法如下:
根据给定的阈值F trust 以及辐射源个体集合
D ={a 1,a 2,a 3, ,a z },得到识别结果为辐射源个体a m 的准确率F am 为
F am =ð(Bool(f am )ȡF trust )ˑf am S am ,
S am >00,S am =0
ìî
í
ïï
ïï㊂(1)
式中:S am 是训练集中辐射源个体a m 的信号数量;f am 表示某一信号识别为a m 的概率值;Bool(f am ȡF trust )表示当f am ȡF trust 时值为1,否则值为0㊂
则可针对每个辐射源个体a m ,得到个体识别模
型M dpl 的权重w dpl am =F dpl am /(F dpl
am +F eml am ),以及个体识别模型M eml 的权重w eml am =F eml am /(F dpl am +F eml am ),其中F dpl
am
为卷积神经网络算法识别出个体a m 的准确率,F eml am 为随机森林算法识别出个体a m 的准确率㊂通过上述方式可得到长度为z 的综合权重向量
w dpl 和w eml ㊂
2.4㊀综合识别模型的确定
根据两个识别模型及其对应的权重向量生成不同个体的综合识别模型,利用综合识别模型计算某一信号识别为个体a m 的综合概率如下:f plus am =f dpl am ㊃w dpl am +f eml am ㊃w eml
am ㊂
(2)
式中:f dpl am 为采用卷积神经网络算法识别出个体a m 的概率,f eml am 为采用随机森林算法识别出个体a m 的概率,当f plus am >F trust 则识别为个体a m ㊂
3㊀应用分析
本文在仿真环境下利用某型号雷达9个不同个体实际数据进行仿真验证,数据集中每个个体的脉冲数为7000~12000,其中80%作为训练使用,剩
余20%作为测试使用,如表1所示㊂置信度阈值F trust =0.6,训练用计算机的CPU 为Intel Xeon Silver
4110,内存32GB,显存16GB㊂
表1㊀辐射源脉冲数统计表
个体脉冲总数训练样本数测试样本数A427650
9080(随机填
补数2960)
1530
A447260
9080(随机填补数3272)
1452
A469005
9080(随机填补数1876)
1801
D1211350
9080
2270
D138650
9080(随机填补数2160)
1730
D149760
9080(随机填补数1272)
1952
D15
10620
9080(随机填补数584)
2124
D218940
9080(随机填补数1928)
1788
D24
9850
9080(随机填
补数1200)
1970
利用卷积神经网络算法的识别结果如图3所示,利用随机森林算法的识别结果如图4所示,利用本文所述算法的识别结果如图5所示
㊂
图3㊀卷积神经网络算法得到的识别结果
㊃
037㊃ 电讯技术
㊀㊀㊀㊀2021年
图4㊀
随机森林算法得到的识别结果
图5㊀结合卷积神经网络与随机森林算法得到的识别结果
通过图3~5的对比分析可知,本文所提方法的平均识别准确率为94.6%,卷积神经网络算法平均识别准确率为88.4%,随机森林算法平均识别准确率为90.6%,因此本文方法能够提升整体识别准确率㊂针对单一算法识别准确率较低的个体,如卷积神经网络对辐射源个体A44识别准确率为38%,随机森林对辐射源个体A46识别准确率为49%,而本文所提方法对辐射源个体A44识别准确率为92%,对辐射源个体A46识别准确率为98%,识别正确率均高于单一算法,因此本文所提算法对于不同辐射源个体均有较好的适用性㊂
4 结束语
本文提出的辐射源个体识别算法选取了深度学习中的典型算法 卷积神经网络和集成学习中的典型算法随机森林,目的在于提供一种思路,即如何将深度学习算法与集成学习算法相结合,通过减少深度学习网络层数,达到减少运算时间的目的,从而提升工程化应用能力㊂应用分析结果显示,本文
所提方法具有良好的识别结果㊂
此外,应用分析中用到的雷达数据不含多径效应以及噪声干扰等情况,因此在工程应用中,所述方法缺少对数据的预处理环节,这也是本文的不足之处,后续应该进一步探索在复杂电磁环境下的辐射源个体识别问题,以满足实际需求㊂参考文献:
[1]㊀杨真真,匡楠,范露,等.基于卷积神经网络的图像分类算法综述[J].信号处理,2018,34(12):1475-1489.
[2]㊀周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1230-1251.
[3]㊀王飞飞.基于改进卷积神经网络算法的研究与应用[D].南京:南京邮电大学,2016.[4]㊀周志文,黄高明,高俊,等.一种深度学习的雷达辐射
源识别算法[J].西安电子科技大学学报(自然科学版),2017,44(3):78-82.
[5]㊀张博.基于深度置信网络的图像识别算法研究[D].哈
尔滨:哈尔滨理工大学,2019.[6]㊀王奕森.随机森林和深度神经网络的若干关键技术研究[D].北京:清华大学,2018.[7]㊀付忠良.关于AdaBoost 有效性的分析[J].计算机研究与发展,2008,45(10):1747-1755.[8]㊀张向前.机器学习在辐射源信号指纹识别中的应用研
究[D].成都:电子科技大学,2018.作者简介
:
侯思尧㊀男,1988年生于四川成都,2014年获硕士学位,现为工程师,主要研究方向为数据处理㊂
李㊀伟㊀男,1986年生于四川资阳,硕士研究生,工程师,主要研究方向为数据处理㊂
李永光㊀男,1977年生于山东潍坊,2006年获硕士学位,现为高级工程师,主要研究方向为数据处理㊁多元信息融合等㊂
凌㊀杰㊀男,1992年生于重庆,2018年获硕士学位,现为工程师,主要研究方向为数据处理㊂
黄黔川㊀男,1986年生于四川广安,工程师,主要研究方向为数据处理㊂
㊃
137㊃第61卷侯思尧,李伟,李永光,等:结合卷积神经网络和随机森林的辐射源个体识别第6期。