一种半监督学习潜艇规避防御智能决策方法

A Semi-supervised Learning Method for Intelligent Decision Making of Submarine Maneuvering Evasion

下载PDF

导出

摘要潜艇水下作战行动中,受到水下弱可观测环境影响,获取的目标信息呈现稀疏特性。机动规避是潜艇水下防御的重要战术方法,现有机动规避参数仿真与优化方法在建模时不可避免引入观测误差,缺乏对态势演变的应对手段,且由于军事专家的稀缺性,获取军事专家标签的战术对抗样本代价十分昂贵。针对上述困难提出一种基于自编码与主动Q学习策略结合的半监督学习智能决策方法。通过引入对比预测编码自编码器,最大化时序输入与上下文间互信息熵,提高对稀疏时序输入的表征能力。将表征输入与主动强化学习任务相结合,降低智能体的标签需求率,提高规避决策时对环境反馈的能力。基于3 a采集的指挥员战法研练复盘数据构建上帝视角、红方视角数据集。实验结果表明:所提算法与不采用稀疏时序自编码器的算法消融实验,在完全信息、红方视角条件下决策精度分别达到98%、78%,而标签需求率仅为4%、44%;相比于经典的时序分类算法决策精度提高了14%、9%,与有监督算法相比在标签需求率降低为原来的24%~44%条件下,决策精度误差与有监督算法仅差1%,说明所提算法在保证决策精度的同时可大幅降低标签需求量,从而为少量样本条件下的军事智能决策提供一种通用的技术框架。 When a submarine defends against the incoming torpedoes,it is subjected to the weakly observable environment under water,and the target information obtained is sparse.The setting of maneuvering parameters is a key part of submarine tactical decision-making.The existing methods for setting the maneuvering parameters inevitably introduce observation errors in modeling,there is lack of a means to respond to the evolution of situation,and due to the scarcity of military experts,and it is very expensive to obtain the flexible tactical confrontation samples of military experts.To solve the above difficulties,an intelligent tactical decision-making method based on the combination of self-coding and active Q-learning strategy is proposed.By introducing a contrasting predictive coding autoencoder,the mutual information entropy between the time series input and the context is maximized,and the representation ability of sparse time series input is improved.The representation input is combined with the active reinforcement learning task to reduce the label demand rate of the agent and improve the environmental feedback ability of parameter setting.The datasets of God perspective and red perspective are constructed based on the data collected in the past three years.Experiments based on this dataset show that the decision accuracies of the proposed method and the model ablation experiment without sparse time series auto-encoder reach 98%and 78%,respectively,while their label demand rates are only 4%and 44%,respectively.Compared with the proposed method and the classical time series classification model,the decision accuracy of the proposed method is improved by 14%and 9%,and the decision accuracy error compared with real human action is only 1%different from that of the supervised model under the condition that the label demand rate is reduced to 24%~44%.It is explained that the proposed model can greatly reduce the label demand while ensuring the decision-making accuracy.

作者杨静吴金平刘剑王永洁董汉权 YANG Jing;WU Jinping;LIU Jian;WANG Yongjie;DONG Hanquan(Navy Submarine College,Qingdao 266041,Shandong,China)

机构地区海军潜艇学院

出处《兵工学报》 EI CAS CSCD 北大核心 2024年第10期3474-3487,共14页 Acta Armamentarii

关键词潜艇规避防御标签稀疏主动Q学习自编码智能决策 submarine evasion defense sparse labels active Q-learning self coding intelligent decision-making

分类号 TJ301 [兵器科学与技术—火炮、自动武器与弹药工程]

引文网络
相关文献

参考文献11

1张磊潇,胡伟文,孙慧玲.舰艇综合防御鱼雷的作战决策及其关联分析[J].兵工学报,2020,41(5):967-974. 被引量：4
2Tao Geng,An Zhang,Guangshan Lu.Consensus intuitionistic fuzzy group decision-making method for aircraft cockpit display and control system evaluation[J].Journal of Systems Engineering and Electronics,2013,24(4):634-641. 被引量：6
3陈保香,曹奇英,夏祖勋.案例推理在海军战术决策中的应用[J].华东船舶工业学院学报,2000,14(5):45-49. 被引量：6
4丁永忠.潜射自航式声诱饵发射方向研究[J].航空计算技术,2014,44(6):59-61. 被引量：3
5陈颜辉.水面舰艇综合防御鱼雷决策关键技术[J].火力与指挥控制,2019,44(6):102-105. 被引量：8
6张方方,李文哲,董晓明,宋佳平.噪声干扰器作用下反潜鱼雷主动自导性能数值分析[J].水下无人系统学报,2020,28(1):33-38. 被引量：4
7王璐,霍其恩,李青山,王展,姜宇轩.基于并行搜索优化的指控系统自适应决策方法[J].软件学报,2022,33(5):1774-1799. 被引量：4
8施征.俄罗斯潜艇消音技术[J].现代舰船,2002,0(6):25-27. 被引量：2
9何心怡,卢军,张思宇,程善政,陈菁.国外鱼雷现状与启示[J].数字海洋与水下攻防,2020,3(2):87-93. 被引量：13
10俄拟于年内完成新型鱼雷测试[J].现代军事,2017,0(4):13-13. 被引量：2

二级参考文献92

1马国强,徐德民,刘朝晖.水声对抗试验航路优化模型研究[J].弹箭与制导学报,2005,25(S1):258-261. 被引量：7
2陈光文.垂直攻潜浅析韩国新型“红鲨鱼”反潜导弹[J].现代兵器,2010,0(3):19-22. 被引量：3
3北上.巨鲨之齿美国Mk-48重型鱼雷发展史[J].现代兵器,2008,0(10):52-55. 被引量：1
4刘桐林.揭开俄罗斯反潜导弹的神秘面纱(上)[J].现代兵器,2003,0(8):26-30. 被引量：1
5刘桐林.揭开俄罗斯反潜导弹的神秘面纱(下)[J].现代兵器,2003,0(9):20-25. 被引量：1
6陈敬军.国外鱼雷防御问题评述(四) 鱼雷防御系统中不断出现的硬杀伤能力[J].声学技术,2013,32(5):439-444. 被引量：16
7关世义,冯郅仲.国外飞航式反潜导弹浅析[J].飞航导弹,2004(10):1-6. 被引量：14
8钱东,崔立,顾险峰.MU90 HK反鱼雷鱼雷的作战效能[J].鱼雷技术,2004,12(4):5-8. 被引量：20
9裴燕,徐伯权.美国C^4ISR系统发展历程和趋势[J].系统工程与电子技术,2005,27(4):666-671. 被引量：25
10卢军,陈立强,崔和.先进的多任务轻型鱼雷MU90[J].鱼雷技术,2006,14(1):57-60. 被引量：8

共引文献38

1李雅君.基于案例推理(CBR)的工程造价估算研究[J].河北建筑工程学院学报,2012,30(1):83-85. 被引量：1
2罗朝晖,董鹏,焦燕.基于案例推理的新装备研制风险评估[J].武汉理工大学学报（信息与管理工程版）,2005,27(6):112-115. 被引量：1
3温伟,杜云艳,王春晓.珠江口土地利用变化推测的CBR方法[J].山东科技大学学报（自然科学版）,2009,28(3):91-98.
4陈云翔,蔡忠义,张诤敏,项华春.基于证据理论和直觉模糊集的群决策信息集结方法[J].系统工程与电子技术,2015,37(3):594-598. 被引量：23
5An Zhang,Haiyang Sun,Yanxia Zhang.Service allocation based on QoS evaluation in military organization cloud cooperation[J].Journal of Systems Engineering and Electronics,2016,27(2):386-394. 被引量：3
6岳建平,黄万里.基于实例的大坝安全监控专家系统研究[J].水电自动化与大坝监测,2002,26(5):42-44. 被引量：3
7王英辉,金静.持续关爱式健康教育在妊娠期糖尿病孕妇护理中的应用及对妊娠结局的影响[J].中国校医,2019,33(5):358-361. 被引量：19
8刘海光,李伟,张永.远程诱骗型UUV掩护潜艇作战效能建模与仿真[J].水下无人系统学报,2019,27(3):339-345. 被引量：1
9尹翔,张萌,陈梦乔.基于判别分析的空中目标作战意图识别[J].弹箭与制导学报,2018,38(3):46-50. 被引量：11
10汪凌.基于改进直觉模糊熵和信息集成算子的多准则群决策方法[J].信息与控制,2020,49(2):219-224. 被引量：10

1付留芳,周明,许林周,李文哲,于丹丹.潜艇旋回机动规避对声自导鱼雷发现概率的影响分析[J].舰船电子工程,2022,42(11):118-122. 被引量：2
2李文林.“学、练、赛、评”一体化视角下足球大单元教学的实践研究——以水平四“足球:‘踢墙式’二过一战术方法”为例[J].成功密码,2024(2):106-107.
3刘颖.基于自编码器的高效信息化测绘处理研究[J].科技资讯,2024,22(19):54-56.
4李熹.精度提升带来的价值爆发[J].加油站服务指南,2024(8):31-31.
5肖楚琬,刘嘉,唐小峰.面向智能决策的军事数据工程建设[J].指挥控制与仿真,2020,42(3):97-101. 被引量：3
6刘满,张宏军,郝文宁,程恺,王佳胤.战术级兵棋实体作战行动智能决策方法[J].控制与决策,2020,35(12):2977-2985. 被引量：19
7刘满,张宏军,徐有为,冯欣亮,冯玉芳.群队级兵棋实体智能行为决策方法研究[J].系统工程与电子技术,2022,44(8):2562-2569. 被引量：2
8鸣镝.坚甲长戈中国海军超级航母平台水下防御能力的考量[J].舰载武器,2024(3):33-42.
9程平,陈锐,付元承,徐婧.基于深度去噪自编码器的智能内部审计预警研究[J].中国注册会计师,2024(9):74-84.
10丁文强,丁浩,赵志允.潜艇强机动变深规避鱼雷攻击仿真研究[J].现代防御技术,2024,52(1):124-129.

兵工学报

2024年第10期

浏览历史

内容加载中请稍等...

一种半监督学习潜艇规避防御智能决策方法

参考文献11

二级参考文献92

共引文献38

相关作者

相关机构

相关主题

浏览历史