动态武器目标分配问题中策略优化的改进算法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

An Improved Algorithm of Policies Optimization of Dynamic Weapon Target Assignment Problem 作者: 陈英武[1];蔡怀平[1,2];邢立宁[1]
作者机构: [1]国防科技大学信息系统与管理学院,长沙410073;[2]中国人民解放军95851部队,南京210046
出版物刊名: 系统工程理论与实践
页码: 160-165页
主题词: 运筹学;动态武器目标分配;算法;策略优化;马尔可夫决策过程
摘要:动态武器目标分配(Weapon Target Assignment,WTA)中的目标选择策略问题可以通过建立马尔可夫决策过程(Markov decision pmcesses,MDP)模型进行研究,但目前尚无有效求解此类较大规模的MDP问题中最优策略的算法.通过分析动态WTA问题的MDP模型特点,给出了求解该问题最优策略的改进算法.该算法主要在初始策略选取规则、策略改进规则以及最优策略的判断准则等方面进行了改进.该算法具有计算量小,节省内存,并可得到最优解等优点.最后,通过算例将该算法与传统算法进行了比较.改进算法可以用于解决较大规模的动态WTA中的策略优化问题。

相关文档
最新文档