动态武器目标分配问题中策略优化的改进算法

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

An Improved Algorithm of Policies Optimization of Dynamic Weapon Target Assignment Problem 作者：陈英武[1];蔡怀平[1,2];邢立宁[1]
作者机构： [1]国防科技大学信息系统与管理学院,长沙410073;[2]中国人民解放军95851部队,南京210046
出版物刊名：系统工程理论与实践
页码： 160-165页
主题词：运筹学;动态武器目标分配;算法;策略优化;马尔可夫决策过程
摘要：动态武器目标分配（Weapon Target Assignment，WTA）中的目标选择策略问题可以通过建立马尔可夫决策过程（Markov decision pmcesses，MDP）模型进行研究，但目前尚无有效求解此类较大规模的MDP问题中最优策略的算法．通过分析动态WTA问题的MDP模型特点，给出了求解该问题最优策略的改进算法．该算法主要在初始策略选取规则、策略改进规则以及最优策略的判断准则等方面进行了改进．该算法具有计算量小，节省内存，并可得到最优解等优点．最后，通过算例将该算法与传统算法进行了比较．改进算法可以用于解决较大规模的动态WTA中的策略优化问题。