基于Agent的空中目标威胁度评估模型
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第30卷 第6期
2010年12月
弹 箭 与 制 导 学 报
Journal of Projectiles,Rockets,Missiles and Guidance
Vol.30 No.6
Dec 2010
基于Agent的空中目标威胁度评估模型*
刘顺利1,陈亚生2,陈 琳1
(1防空兵指挥学院,郑州 450052;2南京军区军训和兵种部,南京 210000)
摘 要:首先设计了基于Agent的空中目标威胁度评估模型,接着依次从因素考虑、因素知识库构建、因素知
识库学习和空中目标威胁度综合评估四个方面研究了空中目标威胁度评估模型的构建步骤,最后给出了算例
分析。
分析结果表明,利用Agent方法构建空中目标威胁度可有效实现模型的智能化和通用化,提高了空中
目标威胁度评估的正确性和适应性等。
关键词:Agent;空中目标;威胁度;评估模型
中图分类号:E926.4 文献标志码:A
Model for Aerial Targeis Threat Evaluation Based on Agent
LIU Shunli1,CHEN Yasheng2,CHEN Lin1
(1Air Defense Command Academy,Zhengzhou 450052,China;
2Military Training and Service Arms Department,Nanjing Military Region,Nanjing 210000,China)
Abstract:First of all,designed model for aerial targeis threat evaluation based on agent,and than researched construction steps ofmodel about aerial targeis threat evaluation from four aspects that is thinking on factors,knowledge database building on factors,knowledge database studying on factors and aerial targeis threat comprehensive evaluation respectively,finally given example.Theresult of example anslysis show that structuring aerial targeis threat based on agent can realize intelligence and generalization,im-proving aerial targeis threat evaluation accuracy and adaptation,etc.
Keywords:Agent;aerial target;threat;evaluation model
0 引言
空中目标威胁度一般是指敌方对我方保卫目标侵袭成功的可能性及侵袭成功时可能造成的破坏程度。
对敌空中目标的威胁度评估和火力单元射击有利度评估是指挥信息系统区分兵力、火力的基本依据。
目前对空中目标威胁度的评估模型较多[1-2],为了使模型在设定的场合有很强的适应能力,必须对一些因素作相应简化,因此限定了模型在其他场合的适用性;加之新空中目标、新战场情况等的不断出现,因此使得空中目标威胁度评估模型总在不断研究更新中。
Agent[3-4]技术的发展为解决模型的适用性提供了有效方法。
文中用Agent模型自下而上的建模方式把空中目标威胁度评估划分为多个具有高度自治能力的Agent实体,通过对这些实体和知识库的维护,实现空中目标威胁度评估的通用化、智能化,使空中目标威胁度评估更加精确、高效,且能适应不同的战场环境。
1 基于Agent的空中目标威胁度评估模型设计
基于Agent的目标威胁度评估模型通过和火力分配系统中其他Agent交互得到威胁度估计因素,并模拟人的思维方式对任务和进度进行分析,进行威胁度评估。
根据空中目标威胁度评估的特点,建立目标威胁度评估模型体系结构如图1所示,在动态环境中,模型以环境事件作为Agent反应的前提,在目标支配下,利用强化学习方法进行在线学习,产生最优动作策略集,也就是空中目标威胁度。
空中目标威胁度评估的Agent模型可分为感知模块、意图模块、执行模块和知识库模块。
其中:态势感知模块负责获取当前环境以及自身内部状态的认知,对目标威胁度评估因素和自身任务、进度的分析报告情况与火力分配系统中其他Agent进行通信和交互;
意图模块主要从知识库中获取威胁度评估的因素,
*收稿日期:2010-03-10
作者简介:刘顺利(1957-),男,河北易县人,教授,研究方向:防空兵作战指挥自动化。
第6期刘顺利等:基于Agent的空中目标威胁度评估模型
并根据空情和影响空中目标威胁度的因素对空中目标威胁度产生认知,同时修正推理过程中相应的权重;
知识库模块主要存储影响空中目标威胁度的因素知识,并通过自身学习改变各因素相应权重;
执行模块将系统对目标威胁度的认知状态按照威胁度评估的最优化原则生成符合战场环境的空中目标威胁度评估策略,并对结果进行反馈和修正,根据自身意图、动作策略以及对当前态势的认知采取相应动作。
图1 空中目标威胁度评估的Agent模型体系结构
2 空中目标威胁度评估的步骤
2.1 确定空中目标威胁度评估的考虑因素
1)天气因素。
天候对目标威胁度的影响主要是降雨、降雪及起雾等情况下。
2)被保卫目标情况。
根据空袭兵器目标选择将其分为以下五个方面:领导机构与相关系统;关键的生产设施;与居民日常生产相关目标,包括供水系统,生产用品供应等;与防空力量相关的目标;与舆论相关的目标。
不同的空袭兵器对不同的被保卫目标威胁程度不同。
3)目标类型。
将来袭目标按轰炸机、歼击轰炸机、强击机、武装直升机、隐形飞机等类型层层细化到具体机型。
4)携弹类型。
目标携带弹药类型不同其威胁度也不相同。
5)目标位置。
目标位置包括目标高度、目标距离、目标相对于被保卫目标的航路捷径投影,这些因素都属于越小威胁度越大的参数,即高度、距离、航路捷径越小的目标威胁度越大,但都有一个下限值。
因此在接收目标位置信息后,可以先行对其它因素加权求取威胁度。
6)目标速度。
空中目标速度大,则可射击时间短,其射击误差大,目标威胁度大;反之,空中目标速度小,威胁度小。
7)目标架数。
空中目标架数越多,其威胁度越大;反之则越小。
2.2 构建空中目标威胁度评估因素知识库
空中目标威胁度评估知识库中知识为认知模型的知识库,作为初始知识使用,初始值由专家经验及其它权威数据源得出,知识库中内容还应该包括在之后自学过程中产生的新知识。
知识库之间为并行关系。
这里主要构建天气因素、被保卫目标类型、空中目标相对位置知识库。
2.2.1 空中目标在不同天气条件下威胁度知识库空中目标在不同天气条件下威胁度Wt[i]不同。
将能见度较好、不影响空袭兵器作战效能的天气条件归类为Wh1,将降雨、降雪、浓雾等能见度低、影响敌空袭兵器空袭效能的天气条件归类为Wh2;根据敌空袭兵器的不同作战性能将其分为轰炸机Style1,战斗机Style2,强击机Style3,武装直升机Style4,电子战飞机Style5,从陆地或海面发射的巡航导弹Style6。
由于目前战斗机设计性能差距较大,将机型中具有全天候作战能力的战斗机、性能先进载弹量大的轰炸机等加注A,具有隐身性能的飞机加注Y;巡航导弹中为多弹头的加注D,带核弹头的加注H;飞机携弹种类分为一般对地攻击炸弹、火箭弹As1,精确制导炸弹或导弹As2,集束炸弹As3,碳纤维弹As4,空对地导弹As5,从空中发射的巡航导弹为As6,反辐射导弹As7,核弹为As8。
其详细知识库设计略。
在这里天时、机型和弹药类型由态势感知A-gent中感知,经过Agent间通信机制具体将其分类。
2.2.2 空中目标对被保卫目标的威胁度知识库敌空袭兵器对被保卫目标的威胁度Wm[i]各不相同,目标类型根据敌空袭重点的选择分为国家领导指挥机构Ob1;关键生产设施Ob2;居民生产设施Ob3;舆论通信设施Ob4;地面交通设施,其中公路、铁路等地面设施为Ob5,机场为Ob6;军事力量平台,其中指挥机构为Ob7,武器平台为Ob8,雷达系统为Ob9。
其详细知识库设计略。
2.2.3 空中目标相对位置威胁度知识库
空中目标在空中点坐标由空情报知获得,其相对位置不同,威胁度Wp[i]也不相同。
在这里主要考虑空中目标的高度、航路捷径的影响。
考虑这些位置函数是一种连续函数,因此,空中目标相对位置威胁度也采用连续函数表示,而该连续函数的系数采用知识库表示。
这里首先采用模糊数学的方法,构建威胁度
·
3
1
2
·
弹箭与制导学报第30卷
的分布函数,再由分布函数构建出其隶属函数。
从分布函数角度而言,各种机型是一样的,但它们有别于导弹。
1)空中目标在不同高度的威胁度Wh[i]分布如图2、图3所示。
图2
飞机的高度威胁度图3 巡航导弹的高度威胁度
图中:
H[i]为敌机相对保卫目标的高度,H[i]以百米为单位。
根据现代空袭兵器的战术技术性能,目标高度小于或等于0的可能性较小。
模型中,当目标高度小于或等于0时,认为H[i]=0;a、b为系数。
由图2和图3可得高度威胁度Wh[i
]为:Wh[i]=飞机
e
-H[i
]a
巡航导弹1
b>H[i]e-H[
i]b≤H[i烅烄烆
烅烄烆](1
)图4 飞机的航路捷径威胁度
2
)空中目标航路投影捷径威胁度Wd[i]的分布如图4、图5所示。
图中:dj[i]为来袭敌机相对保卫目标的航路捷径,以百米为单位;
c、d为系数。
由图4和图5可得航路捷径威胁度Wd[
i]为:Wd[i]=飞机
e
-dj[
i]c
巡航导弹1
d≥dj[i]e-d
j[i]cd<dj[i烅烄烆
烅烄烆](2
)图5 巡航导弹的航路捷径威胁度
在这里根据空中目标不同建立其高度和航路捷径的系数相关的知识库(略),同时在知识库中加入空中目标的飞行状态和航路方向,其中飞行状态分为水平飞行Fs1和俯冲Fs2,
其中当水平飞行时Fs1取0.3和俯冲时Fs2取0.8;航路方向划分为临近Course1和离远Course2,其中临近时Course1取1和离远时Course2取-1。
2.3 评估因素知识库的学习算法
知识库的自学习采用自适应神经模糊推理系
统[5]
(ANFIS
),该系统是一种用来在给定的输入输出数据中产生模糊规则的系统方法。
这里以空中目标在不同天气条件下威胁度知识库为例,说明其工作过程,对其中输入和输出作了相应的简化,其工作过程如图6所示。
第一层是输入层。
其输入为飞机类型、携弹类型和天气情况,输出为轰炸机(S1)、战斗机(S2),一般炸弹(As1)、精确制导炸弹(As2),能见度较好(Wh1)、能见度不好(Wh2
)。
图6 空中目标在不同天气条件下威胁度知识库学习算法
第二层为模糊化层。
该层采用钟形激活函数。
第三层为规则层。
本例中共生成8个规则。
第四层为归一化层。
该层每个神经元接收来自规则层所有神经元的输入,并计算给定规则的归一化
·
412·
第6期刘顺利等:基于Agent的空中目标威胁度评估模型
激活强度。
第五层是逆模糊层。
第六层表示总和神经元。
ANFIS处理问题时,没有必要给出规则后项参
数的任何先验知识,ANFIS会学习这些参数并调节
成员函数。
ANFIS采用混合学习算法,其学习的过
程融合了最小二乘估算法和梯度下降法,可表示为一
个P线性方程。
利用ANFIS学习算法,经过学习可得到轰炸机
携带精确制导炸弹在能见度较高的情况下威胁度最
大,为0.788,其权重经过学习后为0.7822;而战斗机
携带一般炸弹在能见度较低情况下的威胁度较小,为
0.213,其权重经过学习后为0.112。
2.4 空中目标威胁度评估Agent学习算法实现
评估空中目标威胁度的Agent学习算法,采用神
经网络方法。
首先说明两点:1)由于在现代反空袭作
战中,敌空袭兵器可以全方位发起攻击,而且判定目
标威胁度时,空中目标并不处于攻击段,所以在此模
型中暂不考虑空袭兵器主攻方向的因素;2)计算空中
目标威胁度时,只考虑一批目标中只有一架飞机或一
枚巡航导弹,若需考虑一批目标中有多个空袭兵器,
可在一个空中目标的基础上计算。
图7 目标威胁度评估
第一层为归一化层,共取3个节点,输入为各种
机型在天气、被保卫目标类型及空中目标相对位置的
威胁度估计,其输入由评估因素知识库输出值提供;
第二层为BP网络输入层,相应也取3个节点;
第三层为隐层,此处取8个节点,输出特性函数
取S型函数;
第四层为输出层,取1个节点,输出特性函数取
S型函数,输出值即为空中目标对被保卫目标的威胁
程度,此处采用(0,1)区间的连续数。
设网络中输入层权值为ω1m
j
(m=1,2,3;j=1,
2,…,8),输入层节点为o1m(m=1,2,3);中间层的权
值为ω2
j(j=1,2,…,8),中间层的节点值为o2
j
(j=
1,2,…,8),中间层的阀门值为θ2j(j=1,2,…,8);输
出层的阀门值为θ3,输出层的节点值也即威胁度值为
w。
则节点值的数学表达式为:
o11=Wt[i],o12=Wm[i],o13=Wp[i](3)
o2j=2
1+e-u2j
-1,(j=1,2,…,8)(4)
u2j=∑
3
m=1
ω1ijo1m-θ2j,(u2j为中间变量)(5)
w=1
1+e-u3
,u3=∑8
j=1
ω2jo2j-θ3,(u3为中间变量)
(6)
3 算例分析
威胁度计算主要是用于防空作战指挥信息系统
中对空中目标的威胁度进行排序,从而为防空兵群火
力分配提供基本依据。
为了验证该模型的有效性,本
例采用10个训练样本(见表1),设定10个不同种类
和不同飞行条件的目标,其期望威胁度值由专家确
定。
将表1中的样本值输入进行BP神经网络模型的
自学习训练,得出训练后的权值和阀门值(见表2)。
表1 样本数据
目标
类型
目标速度/
(m/s)
航路
捷径/m
目标
高度/m
目标
距离/km
期望
威胁度
Style1 500 2800 3500 200 0.437
Style1 450 1500 3500 150 0.510
Style2 600 260 600 180 0.683
Style2 500 160 170 120 0.791
Style1 400 200 800 80 0.564
Style5 80 50 800 150 0.446
Style1 350 1000 3000 180 0.628
Style1 240 250 8000 80 0.561
Style4 50 100 280 180 0.497
Style4 70 200 280 210 0.460
表2 BP神经网络模型训练后的权值和阀门值
jω11jω12jω13jω2jθ2jθ3
1-0.22093-0.08879-0.50781-0.82812-1.71875
2-0.85937-0.58668 0.01562-0.76562 0.78125
3-0.41406 0.89799 0.98656-1.21875-0.85937
4 0.86718 0.93455-0.29687 1.18750 2.44375
5 0.75781-0.96888 0.13281-0.48437-3.82813
6-0.96093 0.26458-0.62718-1.71875-0.39062
7-0.84375-0.79883 0.22656-1.17188-0.62500
8-0.62500 0.19889-0.69531 0.00000-2.57813
-2.38187
(下转第223页)
·
5
1
2
·
第6期杜娟等:基于二次相关的时延估计方法研究
延。
计算得到时延为4.9405ms,距离差为:1.6798m。
3.2.3 实验值同理论值比较
重复上述步骤,得到3~6号传感器的时延值。
将理论值与实验值对比,如表2所示(表中A、B分别表示用一次相关法和二次相关法计算)。
其中,RE表示时延估计相对误差,即:
RE=
t实验值-t理论值
t理论值
从表2中可以得出:用一次相关法作时延估计时估计误差较大,平均估计误差为REA=2.6955%。
用二次相关法作时延估计时估计误差明显减小,平均估计误差为REB=1.2702%。
表2 理论值与实验值对比
传感器序号2 3 4 5 6
理论值r/m 1.7192 1.3995 0.2520 2.0349 1.0996
理论值t/ms 5.0565 4.1162 0.7412 5.9850 3.2341A B A B A B A B A B
实验值t/ms 5.1801 4.9905 4.0000 4.0567 0.7223 0.7339 5.8187 5.8940 3.1409 3.1987实验值r/m 1.7612 1.6968 1.3600 1.3793 0.2456 0.2495 1.9784 2.0040 1.0679 1.0876RE/%2.4444 1.3053 2.8230 1.4455 2.5499 0.9849 2.7786 1.5205 2.8818 1.0946
4 结论
室内环境下,在被动定位算法的基础上,以空间任意多元传感器阵列为模型,以标准的正弦信号为声源,对一次相关时延估计法和二次相关时延估计法进行了研究。
理论结果表明:二次相关法作时延估计时能够降低噪声对信号的影响,提高时延估计精度。
实验结果也表明:在对空间任意多元传感器阵列进行时延估计时,二次相关法的平均时延估计精度可以达到1.2702%,相对于一次相关方法在对时延进行估计时明显的提高了估计精度。
参考文献:
[1] 毕延文.基于时差法的飞行器声被动定位技术研究[D].西安:西安电子科技大学,2005.
[2] 庞学亮,张效民.基于二次相关水下声源定向(时延)研究[J].探测与控制学报,2005,27(3):41-43.
[3] 行鸿彦,唐娟.时延估计方法的分析[J].声学技术,2008,27(1):110-114.
[4] 王文川,韩焱.空间任意声阵列无源定位研究[J].海洋技术,2009,28(2):62-64.
[5] 唐娟,行鸿彦.基于二次相关的时延估计方法[J].计算机工程,2007,33(21):
檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪
265-267.
(上接第215页)
在此选定4个检验样本(见表3)。
将表2中的经
过自学习得出的权值和阀门值代入BP神经网络模型,
对4个检验样本进行威胁度计算,得出实际输出威胁
度值。
该模型的输出威胁度与期望威胁度排序一致且
误差均小于0.005,从而验证了该模型的有效性。
表3 检验数据
目标类型
目标
速度/
(m/s)
航路
捷径/
m
目标
高度/
m
目标
距离/
km
期望
威胁度
输出
威胁度
Style2 580 200 80 200 0.680 0.683Style1 280 100 3000 150 0.539 0.543Style1 420 50 800 180 0.550 0.547Style4 180 150 60 70 0.490 0.494
4 结束语
Agent技术应用正处于起步阶段,对于一些概念和关键技术的理解还没有达到共识。
由于考虑因素的多样性、全面性,以及自学习算法的复杂性等,实际上利用Agent评估空中目标威胁度是非常复杂的过程,文中重在说明方法和过程,因此对一些情况进行了必要的简化。
参考文献:
[1] 刘己斌.城市防空作战指挥自动化系统火力分配研究[D].郑州:防空兵指挥学院,2001.
[2] 范勇,陈有伟,李为民.弹炮结合防空武器系统火力分配模型[J].火力与指挥控制,2004,29(3):46-48.[3] 刘刚.基于智能Agent的动态协作任务求解机制及应用研究[D].北京:铁道科学研究院,2006.
[4] 石纯一,张伟.基于Agent的计算[M].北京:清华大学出版社,2007.
[5] [澳大利亚]迈克·耐格纳威斯基.人工智能智能系统指南[M].顾力栩,等译.北京:机械工业出版社,2007.
·
3
2
2
·。