期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

面向抗干扰跳频通信的混合改进DQN决策算法

Novel mixed DQN reinforcement learning algorithm for frequency hopping anti-jamming communications

原文传递

导出

摘要针对复杂电磁环境下的跳频抗干扰通信决策问题,提出了一种新的混合深度循环Q网络(MixDRQN)决策算法。该深度决策算法有效集成了双深度Q网络(DoubleDQN)和对决深度Q网络(DuelingDQN)两种决策机理的优点,并在信号处理前端引入长短时记忆(LSTM)层,以增强决策网络对输入频谱瀑布信号的时间相关特征提取能力。研究表明,所提出的混合决策算法通过引入DoubleDQN解决了基于ε-greedy算法导致的Q值估计偏高的问题,同时通过DuelingDQN和前端增加的LSTM层,能有效学习输入频谱瀑布信号的时间相关特征。实验结果显示,所提方法在多种干扰信号下的收敛速度及抗干扰性能均显著提升,收敛速度较已有算法提升8倍以上。 This paper investigates the problem of anti-jamming communications with intelligent frequency hopping in complex electromagnetic environment.Essentially,this paper proposes a new mixed deep recurrent Q-learning network(MixDRQN)for reinforcement learning(RL)of the optimal anti-jamming strategy.The proposed deep RL algorithm effectively combines double deep Q-learning network(DoubleDQN)and dueling deep Q-learning network(DuelingDQN),and further introduces long short-term memory(LSTM)layer for preprocessing the time-sensitive inputs.With the use of DoubleDQN,the proposed RL algorithm solves the problem of Q-value over-estimation caused by ε-greedy algorithm.In the mean time,the use of DuelingDQN and the LSTM layer has been proved to be very efficient for learning the time-correlated feature of inputs.Extensive experimental results show that both the convergence speed and anti-jamming performance are significantly improved,and in particular,the convergence speed of the proposed RL algorithm is more than 8 times higher than that of the existing RL algorithms.

作者夏重阳张剑书吴晓富靳越 Xia Chongyang;Zhang Jianshu;Wu Xiaofu;Jin Yue(College of Communication and Information Engineering,Nanjing University of Posts and Telecommunication,Nanjing 210003,China;School of Computer Engineering,Nanjing Institute of Engineering,Nanjing 211167,China)

机构地区南京邮电大学通信与信息工程学院南京工程学院计算机工程学院

出处《电子测量技术》北大核心 2023年第20期50-57,共8页 Electronic Measurement Technology

基金国家自然科学基金(61771256)项目资助

关键词通信抗干扰强化学习深度Q网络长短时记忆 communication anti-jamming reinforcement learning DQN LSTM

分类号 TN973.3 [电子电信—信号与信息处理]

引文网络
相关文献

参考文献5

1荆俊明,石建明,张秀蓉,王艳.舞台载波通信自适应跳频抗干扰仿真分析[J].电子测量与仪器学报,2021,35(10):145-152. 被引量：5
2杨鸿杰,张君毅.基于强化学习的智能干扰算法研究[J].电子测量技术,2018,41(20):49-54. 被引量：17
3徐琳,赵知劲.基于CBR与合作Q学习的分布式CRN资源分配算法[J].电信科学,2019,35(2):35-42. 被引量：3
4宋佰霖,许华,蒋磊,饶宁.一种基于深度强化学习的通信抗干扰智能决策方法[J].西北工业大学学报,2021,39(3):641-649. 被引量：19
5孟磊,曲卫,马爽,刘元华.基于LSTM的雷达脉冲重复间隔调制模式识别[J].现代雷达,2021,43(1):50-57. 被引量：11

二级参考文献36

1荣海娜,张葛祥,金炜东.基于频率和形状特征的脉冲重复间隔调制识别[J].西南交通大学学报,2007,42(2):194-199. 被引量：15
2潘继飞,姜秋喜.限制雷达PRI测量精度因素分析及仿真验证[J].现代防御技术,2009,37(1):102-107. 被引量：3
3王芳,张士兵,王振朝.低压电力线载波通信调制解调技术研究[J].电视技术,2010,34(5):69-72. 被引量：7
4胡彬,黄清江.遗传算法在多目标干扰中的应用[J].空间电子技术,2010,7(3):27-31. 被引量：3
5樊孝明,林基明.锁相环解调的Chirp-UWB接收机仿真研究[J].电子技术应用,2011,37(5):121-125. 被引量：2
6陈锋.基于遗传算法的卫星通信干扰资源分配[J].指挥控制与仿真,2011,33(5):37-40. 被引量：4
7齐琳,郭黎利,姜晓斐,李超.不同调制的并扩超宽带通信系统的性能研究[J].计算机应用研究,2012,29(9):3448-3451. 被引量：2
8赖海超,赵知劲,郑仕链.应用案例推理技术的快速认知引擎[J].信号处理,2012,28(12):1700-1705. 被引量：2
9张珂,张璇,金家才.认知电子战初探[J].航天电子对抗,2013,29(1):53-56. 被引量：16
10张春磊,杨小牛.认知电子战初探[J].通信对抗,2013,32(2):1-4. 被引量：35

共引文献49

1朱云飞,张建博.基于强化学习的多干扰机干扰任务分配方法[J].电声技术,2023,47(2):141-145.
2林伟烜.多径干扰下的物联网链路负载均衡控制算法[J].电子测量技术,2019,42(9):1-5. 被引量：3
3林荣霞.基于强化学习的双足机器人的实时避障位置控制[J].电子测量技术,2019,42(10):33-37. 被引量：8
4裴绪芳,陈学强,吕丽刚,张双义,刘松仪,汪西明.基于随机森林强化学习的干扰智能决策方法研究[J].通信技术,2019,52(9):2118-2124. 被引量：8
5王佳骏,林承勋,陈瑾,李文轩.基于强化学习的通信网络入侵自适应检测方法[J].信息技术,2019,43(11):24-27. 被引量：8
6周贤来.基于语义分割的异构多核平台大数据挖掘算法[J].计算机与现代化,2020(10):40-43. 被引量：1
7邵云.基于数学图论分析的数据相似度权重调整算法[J].湖南文理学院学报（自然科学版）,2021,33(1):20-24. 被引量：1
8马海波,俞力,周新,冯熳.基于Q-learning及其改进算法的信道决策方法[J].现代信息科技,2020,4(20):81-84.
9李洁.基于解耦概要图的图数据频繁模式挖掘算法[J].内蒙古民族大学学报（自然科学版）,2021,36(5):391-395. 被引量：2
10贾志超.无线电通信抗干扰方法研究[J].长江信息通信,2022,35(3):69-71. 被引量：3

1卢春城,黄理灿,刘靖雯.基于IG-DNN混合决策算法的糖尿病预测研究[J].软件导刊,2019,18(8):21-25.
2杨会峰,魏勇,尚立,刘玮,李建岐,张孙烜.支撑配电网监测的无线传感网自适应中继选择[J].哈尔滨理工大学学报,2023,28(3):88-97.
3孟祥聘.矿山加工全流程智能化系统建设[J].中国金属通报,2023(20):234-236.
4肖田田.基于K-means-LSTM模型的证券股价预测[J].科技和产业,2024,24(3):210-215. 被引量：2
5卢小平,安家琪.基层治理中大数据赋能循证决策的机理及风险探究[J].领导科学,2024(2):121-126. 被引量：1
6裴玉龙,傅博涵,王子奇,张杰.引力理论框架下基于综合竞争力的自动驾驶拟人换道决策模型[J].交通运输系统工程与信息,2024,24(1):66-80.
7肖友刚,满香娜,伍国华,罗启章.考虑地形起伏的机载SAR测绘航线规划方法[J].航空学报,2023,44(17):213-229. 被引量：3
8赖添城,徐康康,朱成就,蔡建阳.一种基于改进CNN-GRU的建筑冷负荷单步预测方法[J].机电工程技术,2024,53(1):119-122.
9普运伟,余永鹏,姜萤,田春瑾.基于模糊函数多域特征融合与集成学习的雷达辐射源信号识别[J].控制与决策,2024,39(1):39-48.
10张蕴霖,麻壮壮,石磊,邵晋梁.基于通信连通保持约束的多智能体覆盖控制[J].北京航空航天大学学报,2024,50(2):519-528.

电子测量技术

2023年第20期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部