基于输出层具有噪声的DQN的无人车路径规划被引量：4

UGV Path Programming Based on the DQN With Noise in the Output Layer

下载PDF

导出

摘要在DQN算法的框架下,研究了无人车路径规划问题.为提高探索效率,将处理连续状态的DQN算法加以变化地应用到离散状态,同时为平衡探索与利用,选择仅在DQN网络输出层添加噪声,并设计了渐进式奖励函数,最后在Gazebo仿真环境中进行实验.仿真结果表明:①该策略能快速规划出从初始点到目标点的无碰撞路线,与Q-learning算法、DQN算法和noisynet_DQN算法相比,该文提出的算法收敛速度更快;②该策略关于初始点、目标点、障碍物具有泛化能力,验证了其有效性与鲁棒性. The path programming of the unmanned ground vehicle(UGV)was studied under the framework of the deep Q-network(DQN)algorithm.To improve the exploration efficiency,the DQN algorithm was applied through discretization of the continuous state into the discrete state.To balance between exploration and exploitation,the Gaussian noise was added only in the output layer of the network,and a progressive reward function was designed.Finally,experiments were carried out in the Gazebo simulation environment.The simulation results show that,first,this strategy can quickly program a collision-free route from the initial point to the target point,and the convergence speed is significantly higher than those of the Q-learning algorithm,the DQN algorithm and the noisynet_DQN algorithm;second,this strategy has the generalization ability about the initial point,the target point and the obstacles,as well as verified effectiveness and robustness.

作者李杨闫冬梅刘磊 LI Yang;YAN Dongmei;LIU Lei(College of Science,Hohai University,Nanjing 211100,P.R.China;School of Modern Posts,Nanjing University of Posts and Telecommunications,Nanjing 211100,P.R.China)

机构地区河海大学理学院南京邮电大学现代邮政学院

出处《应用数学和力学》 CSCD 北大核心 2023年第4期450-460,共11页 Applied Mathematics and Mechanics

基金国家自然科学基金(面上项目)(61773152)。

关键词深度强化学习无人车 DQN算法 Gauss噪声路径规划 Gazebo仿真 deep reinforcement learning UGV DQN algorithm Gaussian noise path programming Gazebo simulation

分类号 O29 [理学—应用数学]

引文网络
相关文献

参考文献14

1王洪斌,尹鹏衡,郑维,王红,左佳铄.基于改进的A^*算法与动态窗口法的移动机器人路径规划[J].机器人,2020,42(3):346-353. 被引量：154
2宋启松,李少波,柘龙炫,李志昂,张星星.基于改进遗传算法的自动导引小车路径规划[J].组合机床与自动化加工技术,2020(7):88-92. 被引量：19
3张松灿,普杰信,司彦娜,孙力帆.蚁群算法在移动机器人路径规划中的应用综述[J].计算机工程与应用,2020,56(8):10-19. 被引量：105
4马丽新,刘晨,刘磊.基于actor-critic算法的分数阶多自主体系统最优主-从一致性控制[J].应用数学和力学,2022,43(1):104-114. 被引量：4
5刘晨,刘磊.基于事件触发策略的多智能体系统的最优主-从一致性分析[J].应用数学和力学,2019,40(11):1278-1288. 被引量：10
6高阳,陈世福,陆鑫.强化学习研究综述[J].自动化学报,2004,30(1):86-100. 被引量：268
7张宁,李彩虹,郭娜,王迪.基于CM-Q学习的自主移动机器人局部路径规划[J].山东理工大学学报（自然科学版）,2020,34(4):37-43. 被引量：3
8张福海,李宁,袁儒鹏,付宜利.基于强化学习的机器人路径规划算法[J].华中科技大学学报（自然科学版）,2018,46(12):65-70. 被引量：46
9王沐晨,李立州,张珺,黄钰棋,张林,石玥.基于卷积神经网络气动力降阶模型的翼型优化方法[J].应用数学和力学,2022,43(1):77-83. 被引量：8
10高普阳,赵子桐,杨扬.基于卷积神经网络模型数值求解双曲型偏微分方程的研究[J].应用数学和力学,2021,42(9):932-947. 被引量：6

二级参考文献99

1张磊,王洪涛,刘卫,刘明红.基于高维数据和深度学习的短期电力负荷预测[J].科技通报,2021,37(3):55-59. 被引量：6
2乔俊飞,侯占军,阮晓钢.基于神经网络的强化学习在避障中的应用[J].清华大学学报（自然科学版）,2008,48(S2):1747-1750. 被引量：27
3Hai-bin Duan,Xiang-yin Zhang,Jiang Wu,Guan-jun MaSchool of Automation Science and Electrical Engineering,Beihang University,Beijing 100191,P.R.China.Max-Min Adaptive Ant Colony Optimization Approach to Multi-UAVs Coordinated Trajectory Replanning in Dynamic and Uncertain Environments[J].Journal of Bionic Engineering,2009,6(2):161-173. 被引量：33
4刘振,胡云安.一种多粒度模式蚁群算法及其在路径规划中的应用[J].中南大学学报（自然科学版）,2013,44(9):3713-3722. 被引量：12
5朱庆保,张玉兰.基于栅格法的机器人路径规划蚁群算法[J].机器人,2005,27(2):132-136. 被引量：123
6于红斌,李孝安.基于栅格法的机器人快速路径规划[J].微电子学与计算机,2005,22(6):98-100. 被引量：63
7毕盛,朱金辉,闵华清,钟汉如.基于模糊逻辑的机器人路径规划[J].机电产品开发与创新,2006,19(1):21-22. 被引量：7
8陈崚,章春芳.并行蚁群算法中的自适应交流策略(英文)[J].软件学报,2007,18(3):617-624. 被引量：10
9陈雄,袁杨.一种机器人路径规划的蚁群算法[J].系统工程与电子技术,2008,30(5):952-955. 被引量：29
10王沛栋,冯祖洪,孙志长.一种栅格模型下机器人路径规划的改进蚁群算法[J].计算机应用,2008,28(11):2877-2880. 被引量：9

共引文献638

1迟旭,李花,费继友.基于改进A^(*)算法与动态窗口法融合的机器人随机避障方法研究[J].仪器仪表学报,2021,42(3):132-140. 被引量：77
2黄志锋,刘媛华.基于改进狮群算法的城市无人机低空路径规划[J].信息与控制,2023,52(6):747-757. 被引量：3
3刘海龙,雷斌,王菀莹,云雁,柴获.基于改进黑猩猩优化算法的仓储移动机器人路径规划[J].信息与控制,2023,52(6):689-700.
4项宇,秦进,袁琳琳.结合向前状态预测和隐空间约束的强化学习表示算法[J].计算机系统应用,2022,31(11):148-156. 被引量：4
5王铎,杜峰,关志伟,赵彪,刘云鹏.狭窄紧凑环境下智能小车SLAM导航实验[J].天津职业技术师范大学学报,2022,32(4):29-34. 被引量：2
6安萌萌,樊秀梅,蔡含宇.基于雾计算和强化学习的交通灯智能协同控制研究[J].计算机应用研究,2020,37(2):465-469. 被引量：8
7金翔,王天霖,于鹏垚,赵勇.基于值迭代网络的路径规划算法[J].华中科技大学学报（自然科学版）,2020,48(2):91-96. 被引量：1
8丁志梁,潘毅群(指导),谢建彤,王尉同,黄治钟.强化学习算法在空调系统运行优化中的应用研究[J].建筑节能,2020(7):14-20. 被引量：7
9赵倩楠,黄宜庆.融合A^(*)蚁群和动态窗口法的机器人路径规划[J].电子测量与仪器学报,2023,37(2):28-38. 被引量：15
10王彦朋,郭佳佳,王晓君.基于Q-Learning的青霉素发酵过程控制方法[J].信息化研究,2023,49(3):31-35.

同被引文献47

1张纪,胡唤,张桂勇,张之凡.基于深度强化学习的地效翼船降落纵向控制研究[J].中国造船,2023,64(1):215-223. 被引量：1
2李茹杨,彭慧民,李仁刚,赵坤.强化学习算法与应用综述[J].计算机系统应用,2020,29(12):13-25. 被引量：45
3谌海云,陈华胄,刘强.基于改进人工势场法的多无人机三维编队路径规划[J].系统仿真学报,2020,32(3):414-420. 被引量：38
4谭冠政,贺欢,Aaron Sloman.Global optimal path planning for mobile robot based onimproved Dijkstra algorithm and ant system algorithm[J].Journal of Central South University of Technology,2006,13(1):80-86. 被引量：20
5刘亚军,郭凤娟.基于Agent的UAV智能导航技术研究[J].现代导航,2014,5(2):79-83. 被引量：1
6李丽,郑嘉利,王哲,袁源,石静.基于异步优势动作评价的RFID室内定位算法[J].计算机科学,2020,47(2):233-238. 被引量：5
7刘娇,田育灵,陈嫣,叶紫,魏荣华.基于“动态电子围栏”的即时配送路径优化研究[J].商场现代化,2020(15):68-70. 被引量：1
8Yang Yang,Li Juntao,Peng Lingling.Multi-robot path planning based on a deep reinforcement learning DQN algorithm[J].CAAI Transactions on Intelligence Technology,2020,5(3):177-183. 被引量：35
9袁泉,吕迅捷.基于PRM算法的移动小车路径规划优化研究[J].宁波工程学院学报,2020,32(4):31-35. 被引量：1
10董永峰,杨琛,董瑶,屈向前,肖华昕,王子秋.基于改进的DQN机器人路径规划[J].计算机工程与设计,2021,42(2):552-558. 被引量：20

引证文献4

1何玮,周雨湉,俞阳,康雨萌,朱萌,钱旭盛.蜣螂优化算法下“互联网+营销服务”虚拟机器人应用模型[J].西安工程大学学报,2024,38(1):113-120. 被引量：1
2李鹏,徐珞.一种面向城市战场的智能车自主导航方法[J].计算机与现代化,2024(1):92-98. 被引量：1
3范兴娟,刘保庆,李丽勇,吴蓬勃,李辉.基于百度地图的无人车电子围栏系统设计与实现[J].汽车与驾驶维修,2024(9):48-50.
4郑晨炜,侯凌燕,王超,赵青娟,邹智元.基于改进DQN的动态避障路径规划[J].北京信息科技大学学报（自然科学版）,2024,39(5):14-22.

二级引证文献2

1尤敬尧,段洁,伍瑞泽.基于改进蜣螂算法优化LSSVM的断路器故障诊断方法研究[J].红水河,2024,43(4):132-137.
2李徐,董伟,杜泽弘.复杂环境约束下的飞行航路规划研究[J].空天防御,2024,7(4):99-105.

1熊蓉玲,段春怡,冉华明,杨萌,冯旸赫.基于深度强化学习的智能决策方法[J].电讯技术,2023,63(1):1-6. 被引量：2
2杨帆,王海名.白宫发布的首份国家地月空间科技战略[J].空间科学学报,2023,43(1):1-5.
3敖国鑫,李林.基于改进BI-RRT算法的AGV路径规划[J].计算机时代,2023(5):57-60. 被引量：3
4张洪鹏,刘星,兀伟,王秉政.基于改进LMS的引信回波自适应滤波算法[J].弹箭与制导学报,2023,43(2):88-93. 被引量：1
5陈思.基于蝙蝠算法的无人艇全局路径规划[J].军事交通学报,2022(12):42-46. 被引量：1
6李俊刚.MySQL数据库表连接查询中的数理思维与工程思维辨析[J].中文科技期刊数据库（文摘版）教育,2022(7):181-183.
7李亚鹏,唐小林,胡晓松.基于分层式控制的混合动力汽车生态驾驶研究[J].汽车工程,2023,45(4):551-560. 被引量：1
8欧阳云,高振国,范丽玲,王继斌,蒋坤良.采用RSPM-PS算法的机械手末端避障路径规划[J].华侨大学学报（自然科学版）,2023,44(3):290-300.
9杨娇,张庆年,杨杰,吴绩伟,凌强.内河无人船的自主路径规划模型研究[J].武汉理工大学学报（交通科学与工程版）,2023,47(2):263-268. 被引量：1
10吴健发,魏春岭,张海博,李克行,郝仁剑.基于深度强化学习的航天器多约束规避动作快速规划[J].空间控制技术与应用,2023,49(2):1-9. 被引量：4

应用数学和力学

2023年第4期

浏览历史

内容加载中请稍等...

基于输出层具有噪声的DQN的无人车路径规划被引量：4

参考文献14

二级参考文献99

共引文献638

同被引文献47

引证文献4

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于输出层具有噪声的DQN的无人车路径规划 被引量：4

参考文献14

二级参考文献99

共引文献638

同被引文献47

引证文献4

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于输出层具有噪声的DQN的无人车路径规划被引量：4