基于MMDP的无人作战飞机任务分配模型研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Ab s t r a c t O n t h e b a s i s o f Ma r k o v d e c i s i o n p r o c e s s t h e o r y,a d y n a mi c t a s k a l l o c a t i o n mo d e l b a s e d o n mu h i — a g e n t Ma r k o v d e c i s i o n p r o c e s s
略; 数值仿真验证 了算法 的有效性 。 关键 词 中图分类号 多智能体 马尔科夫决策过程 无人作 战飞机 T P 3 V 2 7 9 文献标识码 A 动态任 务分 配 D O I : 1 0 . 3 9 6 9 / j . i s s n . 1 0 0 0 — 3 8 6 x . 2 0 1 3 . 0 7 . 0 7 3
( S c h o o l o f E n g i n e e r i n g, A i r F o r c e E n g i n e e r i n g U n i v e r s i t y , X i ’ a n 7 1 0 0 3 8 ,S h a a n x i ,C h i n a ) 。 ( D e p a n n  ̄ n t fT o r a i n i n g , A i r F o r c e E n g i n e e r i n g U n i v e r s i t y , Xi ’ a n 7 1 0 0 5 1 , S h a a n x i ,C h i n a ) ( R e p r e s e n t a t i v e O f f w e ft o h e P I A’ s A F o r c e , Z h e n g z h o u 4 5 0 0 0 6, H e n a n ,C h i n a )
( MMD P )i s b u i l t a i m i n g a t t h e d y n a mi c t a s k a l l o c a t i o n p r o b l e m o f mu l t i p l e u n m a n n e d c o m b a t a e i r a l v e h i c l e( U C A V) .S t a t u s m e s s a g e s ,
RES EARCH oN T AS K ALLo CATI oN M oDEL FoR UCAV B AS ED oN M M DP
L i Y u e j u a n L t i Y o n g j i a n C h a n g Q i a n z h e n Z h u L i y u n
第3 0卷 第 7期
2 0 1 3年 Biblioteka Baidu 月
计 算机应 用与软件
Co mp ut e r Ap p l i c a t i o n s a n d S o f t wa r e
Vo L 3 0 No . 7
J u 1 .2 0 1 3
基 于 MMD P的 无 人 作 战 飞 机 任 务 分 配 模 型 研 究
c l a i ms t h e ma x i mum o f t he g a i n s o f t h e mul t i — UCAV d ur in g in f i t e p e io r d a s t h e e v a l u a t i o n f u n c t i o n,a n d a p pl i e s g e n e t i c lg a o r i t h m t o d e t e r mi n e
t a r g e t a p p e a r a n c e a n d p r o i f t v a l u e i n t h e s y s t e m a r e l a l s u b j e c t e d t o t h e p r o b a b i l i t y d i s t i r b u t i o n .T h e i mp r o v e d M MD P o p t i mi s a t i o n a l g o i r t h m
( Mu h i — A g e n t Ma r k O V D e c i s i o n P r o c e s s ) 的动态任务分配模型 ; 系统 中状态信息 、 目标 的出现和 收益值 等均服从概 率分布 ; 改进 的 MM— D P寻优算 法以多 U C A V在有 限时 间内执行任务 收益值最 大为评价 函数 , 并应用遗传算法在所有可选决策集 中确定最优任务分 配策
t h e b e s t t a s k a s s i g n me n t p o l i c y i n a l l o p t i o n a l d e c i s i o n s e t s .N u me i r c l a s i mu l a t i o n v e i r i f e s t h e e f f e c t i v e n e s s o f t h e a l g o i r t h m. Ke y wo r d s Mu l t i — a g e n t Ma r k o v d e c i s i o n p r o c e s s Un ma n n e d c o mb a t a e r i l a v e h i c l e s Dy n a mi c t a s k a l l o c a t i o n
李月娟 吕永健 常迁臻 朱李云。
( 空军工程大学航空航天工程学 院 ( 空军工程大学训练部 ( 空军驻郑州地 区军事代表室 陕西 西安 7 1 0 0 3 8 ) 河南 郑州 4 5 0 0 0 6 ) 陕西 西安 7 1 0 0 5 1 )
摘
要
针对 多无人作 战飞机 动态任 务分配问题 , 以马 尔科夫决策过程理论 为基 础, 建立基于 多智 能体马 尔科夫决策过 程 MMD P
略; 数值仿真验证 了算法 的有效性 。 关键 词 中图分类号 多智能体 马尔科夫决策过程 无人作 战飞机 T P 3 V 2 7 9 文献标识码 A 动态任 务分 配 D O I : 1 0 . 3 9 6 9 / j . i s s n . 1 0 0 0 — 3 8 6 x . 2 0 1 3 . 0 7 . 0 7 3
( S c h o o l o f E n g i n e e r i n g, A i r F o r c e E n g i n e e r i n g U n i v e r s i t y , X i ’ a n 7 1 0 0 3 8 ,S h a a n x i ,C h i n a ) 。 ( D e p a n n  ̄ n t fT o r a i n i n g , A i r F o r c e E n g i n e e r i n g U n i v e r s i t y , Xi ’ a n 7 1 0 0 5 1 , S h a a n x i ,C h i n a ) ( R e p r e s e n t a t i v e O f f w e ft o h e P I A’ s A F o r c e , Z h e n g z h o u 4 5 0 0 0 6, H e n a n ,C h i n a )
( MMD P )i s b u i l t a i m i n g a t t h e d y n a mi c t a s k a l l o c a t i o n p r o b l e m o f mu l t i p l e u n m a n n e d c o m b a t a e i r a l v e h i c l e( U C A V) .S t a t u s m e s s a g e s ,
RES EARCH oN T AS K ALLo CATI oN M oDEL FoR UCAV B AS ED oN M M DP
L i Y u e j u a n L t i Y o n g j i a n C h a n g Q i a n z h e n Z h u L i y u n
第3 0卷 第 7期
2 0 1 3年 Biblioteka Baidu 月
计 算机应 用与软件
Co mp ut e r Ap p l i c a t i o n s a n d S o f t wa r e
Vo L 3 0 No . 7
J u 1 .2 0 1 3
基 于 MMD P的 无 人 作 战 飞 机 任 务 分 配 模 型 研 究
c l a i ms t h e ma x i mum o f t he g a i n s o f t h e mul t i — UCAV d ur in g in f i t e p e io r d a s t h e e v a l u a t i o n f u n c t i o n,a n d a p pl i e s g e n e t i c lg a o r i t h m t o d e t e r mi n e
t a r g e t a p p e a r a n c e a n d p r o i f t v a l u e i n t h e s y s t e m a r e l a l s u b j e c t e d t o t h e p r o b a b i l i t y d i s t i r b u t i o n .T h e i mp r o v e d M MD P o p t i mi s a t i o n a l g o i r t h m
( Mu h i — A g e n t Ma r k O V D e c i s i o n P r o c e s s ) 的动态任务分配模型 ; 系统 中状态信息 、 目标 的出现和 收益值 等均服从概 率分布 ; 改进 的 MM— D P寻优算 法以多 U C A V在有 限时 间内执行任务 收益值最 大为评价 函数 , 并应用遗传算法在所有可选决策集 中确定最优任务分 配策
t h e b e s t t a s k a s s i g n me n t p o l i c y i n a l l o p t i o n a l d e c i s i o n s e t s .N u me i r c l a s i mu l a t i o n v e i r i f e s t h e e f f e c t i v e n e s s o f t h e a l g o i r t h m. Ke y wo r d s Mu l t i — a g e n t Ma r k o v d e c i s i o n p r o c e s s Un ma n n e d c o mb a t a e r i l a v e h i c l e s Dy n a mi c t a s k a l l o c a t i o n
李月娟 吕永健 常迁臻 朱李云。
( 空军工程大学航空航天工程学 院 ( 空军工程大学训练部 ( 空军驻郑州地 区军事代表室 陕西 西安 7 1 0 0 3 8 ) 河南 郑州 4 5 0 0 0 6 ) 陕西 西安 7 1 0 0 5 1 )
摘
要
针对 多无人作 战飞机 动态任 务分配问题 , 以马 尔科夫决策过程理论 为基 础, 建立基于 多智 能体马 尔科夫决策过 程 MMD P