基于深度强化学习的协同式自适应巡航控制被引量：8

Collaborative Adaptive Cruise Control Based on Deep Reinforcement Learning

下载PDF

导出

摘要针对传统的协同式自适应巡航控制的算法响应慢、无法快速准确地对突发危险路况做出反应的问题,设计了基于深度强化学习的协同式自适应巡航控制框架,提出了双经验池和优化评价的深度确定性策略梯度算法。在传统算法基础上新建了2个包含车辆状态信息的经验池(优先价值经验池和撒普列经验池),训练数据样本分别从2个经验池按比例选取;critic评价模块采用多维向量对输出的踏板开度策略精确评价。结果表明,该算法在正常行驶工况和突发危险工况下:平均跟车间距误差分别下降1.8m和1.5m,跟车调节时间分别降低30%和25%,可以提升控制的准确性和系统紧急反应能力。 Aiming at problems that traditional algorithms of cooperative adaptive cruise control cannot quickly and accurately respond to emergency situations,a framework of cooperative adaptive cruise control based on deep reinforcement learning is built.Then,a gradient algorithm of deep deterministic strategy with advantages of double experience pools and optimal evaluation is proposed.Based on traditional algorithms,two new experience pools(priority value experience pool and Sapler experience pool)which contain vehicle information are established.Data of training samples is proportionally selected from the two experience pools,and a method of pedal opening strategy with multi-dimensional vectors is adopted in critic module for accurate evaluation.The experimental results show that under normal driving conditions and sudden dangerous conditions,the average spacing error decreases by 1.8 m and 1.5 m,respectively.The follow-up time decreases by 30%and 25%,respectively.Apparently,this algorithm can improve the accuracy of control and the ability of emergency response of the system.

作者王文飒梁军陈龙陈小波朱宁华国栋 WANG Wensa;LIANG Jun;CHEN Long;CHEN Xiaobo;ZHU Ning;HUA Guodong(School of Automotive,Jiangsu University,Zhenjiang 212013,Jiangsu,China;Department of Mechanical,Shizuoka Institute of Science and Technology,Fukuroi,Shizuoka 437-0032,Japan;Jiangsu Zhixing Future Automobile Research Institute,Nanjing 210000,China)

机构地区江苏大学汽车工程研究院静冈理工科大学机械系江苏智行未来汽车研究院

出处《交通信息与安全》 CSCD 北大核心 2019年第3期93-100,共8页 Journal of Transport Information and Safety

基金国家重点研发计划项目(2017YFB0102503) 国家自然科学基金项目(U1564201、61773184、61806086)资助

关键词智能驾驶自动控制协同式自适应巡航控制深度强化学习深度确定性策略梯度 intelligent driving automatic control Collaborative Adaptive Cruise Control deep reinforcement learning deep deterministic policy gradient

分类号 U471.1 [机械工程—车辆工程]

引文网络
相关文献

参考文献13

1宋晓琳,周南,黄正瑜,曹昊天.改进RRT在汽车避障局部路径规划中的应用[J].湖南大学学报（自然科学版）,2017,44(4):30-37. 被引量：61
2刘凯,龚建伟,陈舒平,张玉,陈慧岩.高速无人驾驶车辆最优运动规划与控制的动力学建模分析[J].机械工程学报,2018,54(14):141-151. 被引量：55
3李朋,魏民祥,侯晓利.自适应巡航控制系统的建模与联合仿真[J].汽车工程,2012,34(7):622-626. 被引量：33
4陆丽丽,郑彭军,任刚,王炜.车联网环境下CACC车辆通信概率分析模型[J].交通运输系统工程与信息,2017,17(1):112-119. 被引量：6
5梁军,赵彤阳,熊晓夏,张婉婉,陈龙,朱宁.基于PNNPID的车辆加速度控制器设计[J].西南交通大学学报,2017,52(3):626-632. 被引量：5
6王淼,徐志刚,赵祥模,刘丁贝,李骁驰.车辆网联环境下的交通感知路由协议综述[J].汽车工程学报,2018,8(5):313-323. 被引量：2
7WANG Pangwei,WANG Yunpeng,YU Guizhen,TANG Tieqiao.An Improved Cooperative Adaptive Cruise Control(CACC) Algorithm Considering Invalid Communication[J].Chinese Journal of Mechanical Engineering,2014,27(3):468-474. 被引量：3
8高振海,严伟,李红建,胡振程.基于模拟驾驶员多目标决策的汽车自适应巡航控制算法[J].汽车工程,2015,37(6):667-673. 被引量：18
9孙涛,夏维,李道飞.基于模型预测控制的协同式自适应巡航控制系统[J].中国机械工程,2017,28(4):486-491. 被引量：22
10张亮修,吴光强,郭晓晓.车辆自适应巡航控制系统的建模与分层控制[J].汽车工程,2018,40(5):547-553. 被引量：28

二级参考文献65

1张令文,刘留,和雨佳,陶成.全球车载通信DSRC标准发展及应用[J].公路交通科技,2011,28(S1):71-76. 被引量：13
2李以农,郑玲,谯艳娟.汽车纵向动力学系统的模糊—PID控制[J].中国机械工程,2006,17(1):99-103. 被引量：17
3詹军.用于自适应巡航控制的汽车纵向动力学模型的建立[J].吉林大学学报（工学版）,2006,36(2):157-160. 被引量：8
4陈军,朱忠祥,鸟巢谅,武田纯一.拖拉机沿曲线路径的跟踪控制[J].农业工程学报,2006,22(11):108-111. 被引量：23
5赵瑞琴,杨君刚,刘增基.无线移动自组织网路由协议性能研究[J].计算机科学,2007,34(7):55-57. 被引量：10
6Vahidi A,Eskandarian A.Research Advances in Intelligent Collision Avoidance and Adaptive Cruise Control[J].IEEE Transactions on Intelligent Transportation System,2003,4(3):143-153.
7The Mechanical Simulation Corporation.Running Multiple VS Vehicle in Simulink[EB/OL].[2010-11-4].www.carsim.com/publications/technical/index.php.
8Tejas Shrikant Kinjawadekar.Model-based Design of Electronic Stability Control Systerm for Passenger Cars Using Carsim and MatlabSimulink[D].Ohio:The Ohio State University,2009.
9Seungwuk Moon,llki Moon,Kyongsu Yi.Design,Tuning,and Evaluation of A Full-range Adaptive Cruise Control System with Collision Avoidance[J].Control Engineering Practice,2009 (17):442-455.
10Han D,Yi K.Design and Evaluation of Intelligent Vehicle Cruise Control Systems Using a Vehicle Simulator[J].International Journal of Automotive Technology,2006,7 (3):377-383.

共引文献264

1朱茂琳,裴晓飞.自适应巡航的车辆动力学系统建模与仿真[J].数字制造科学,2020(2):118-121. 被引量：1
2迟瑞娟,熊泽鑫,姜龙腾,马悦琦,黄修炼,朱晓龙.基于模型预测的插秧机路径跟踪控制算法[J].农业机械学报,2022,53(11):22-30. 被引量：13
3王星烨.矿用卡车无人驾驶系统路径规划方案研究[J].工矿自动化,2023,49(S01):99-102. 被引量：1
4杜荣华,胡鸿飞,高凯,黄浩.基于变预测时域MPC的自动驾驶汽车轨迹跟踪控制研究[J].机械工程学报,2022,58(24):275-288. 被引量：8
5张美.海上应急物资配送路径规划模型的构建[J].舰船科学技术,2019,41(22):205-207. 被引量：1
6施成龙,行鸿彦,王水璋,娄华生.融合三步平滑与改进RRT算法的无人机路径规划[J].电子测量技术,2023,46(23):43-49. 被引量：1
7樊国根,蒙芳.基于粒子群智能优化的机器人路径全局规划算法[J].电子测量技术,2020(7):41-45. 被引量：7
8安希旭.基于MPC模型的风电场巡检机器人轨迹规划[J].轻工科技,2021,37(2):56-58. 被引量：1
9李鑫,韩鹏.车辆电控主动制动系统的建模与仿真[J].自动化与仪器仪表,2016(2):87-90. 被引量：3
10尹梅,程平.输液与中药注射液配伍微粒变化考察[J].中成药,2000,22(4):309-310. 被引量：88

同被引文献45

1王辉,任俊生,刘新召.基于OpenMP的船舶操纵运动局部加权学习辨识建模[J].计算机应用研究,2020,37(S02):173-175. 被引量：1
2张松涛,任光.基于反馈线性化的船舶航向保持模糊自适应控制[J].交通运输工程学报,2005,5(4):72-76. 被引量：13
3刘胜,方亮,葛亚明,傅荟璇.船舶航向GA-PID自适应控制研究[J].系统仿真学报,2007,19(16):3783-3786. 被引量：13
4郭晨,汪洋,孙富春,沈智鹏.欠驱动水面船舶运动控制研究综述[J].控制与决策,2009,24(3):321-329. 被引量：67
5朱俊,张玮.基于跟驰理论的内河航道通过能力计算模型[J].交通运输工程学报,2009,9(5):83-87. 被引量：30
6李升波,王建强,李克强,张磊.MPC实用化问题处理及在车辆ACC中的应用[J].清华大学学报（自然科学版）,2010,50(5):645-648. 被引量：23
7黄珍,吴浩然,库峰,徐小强.车辆自适应巡航控制算法的设计与仿真[J].武汉理工大学学报（交通科学与工程版）,2012,36(4):708-711. 被引量：5
8洪碧光.船舶风压系数计算方法[J].大连海运学院学报,1991,17(2):113-121. 被引量：18
9李国定,古文贤.螺旋桨推力系数K_T值的数学表达[J].大连海运学院学报,1991,17(3):261-267. 被引量：7
10WANG Pangwei,WANG Yunpeng,YU Guizhen,TANG Tieqiao.An Improved Cooperative Adaptive Cruise Control(CACC) Algorithm Considering Invalid Communication[J].Chinese Journal of Mechanical Engineering,2014,27(3):468-474. 被引量：3

引证文献8

1张旋武,谢磊,初秀民,谢朔,柳晨光,张代勇.无人船路径跟随控制方法综述[J].交通信息与安全,2020,38(1):20-26. 被引量：8
2刘文祥,李强.基于MPC自适应巡航系统控制策略联合仿真研究[J].浙江科技学院学报,2020,32(4):313-320. 被引量：4
3张立发,赵秀春,高天一.基于滑模控制的车辆自适应巡航系统设计[J].大连民族大学学报,2021,23(1):36-39. 被引量：1
4吴金.基于LSTM改进的Q-learning协同式自适应巡航控制算法[J].长春工程学院学报（自然科学版）,2020,21(4):65-70. 被引量：1
5吴文祥,初秀民,柳晨光,毛文刚.基于模型预测控制的船舶纵向航速协同控制方法[J].交通信息与安全,2021,39(1):52-63. 被引量：6
6刘爽爽,于欣策,邹广奕.智能汽车执行控制技术研究[J].时代汽车,2021(16):18-19. 被引量：2
7王启明,蒋江月,吕志超,张汉祖.基于改进MPC的协同自适应巡航控制策略研究[J].系统仿真学报,2022,34(9):2087-2097. 被引量：1
8朱曼,文元桥,孙吴强,张家辉,Axel HAHN.船舶运动模型参数辨识研究综述[J].交通信息与安全,2022,40(5):1-11. 被引量：4

二级引证文献27

1刘晋,张喜亮,王骏翔,龚沛朱,俞子俊,李兴业.基于认知互动的船舶自主进出港关键技术分析[J].港口科技,2023(8):10-14.
2郭子淳,黄家怿,王水传,俞舜庭,张林泉.智能投饵船研究现状与展望[J].农业机械学报,2020,51(S01):385-396. 被引量：11
3祝亢,黄珍,王绪明.基于深度强化学习的智能船舶航迹跟踪控制[J].中国舰船研究,2021,16(1):105-113. 被引量：24
4罗鹏,黄珍,秦易晋,陈志军.基于DQN的车辆驾驶行为决策方法[J].交通信息与安全,2020,38(5):67-77. 被引量：7
5葛爱党.水库管理实时控制方法的有效性研究[J].水利科学与寒区工程,2021,4(3):138-141.
6胡庆松,陈研霖,陈普坤,陈雷雷,匡兴红.虾塘差速无人投饲船巡边算法设计与仿真分析[J].渔业现代化,2021,48(4):1-8. 被引量：3
7徐凌峰,高洪.基于LSTM神经网络的乘用车能耗预测[J].井冈山大学学报（自然科学版）,2021,42(5):78-84.
8张云,吴昊.基于滑模变结构的航迹跟踪控制器设计[J].通信电源技术,2021,38(12):45-48.
9闫茂德,杜正源,左磊.空气流动阻力下非线性车辆队列最优能耗控制方法[J].计算机测量与控制,2022,30(1):98-105. 被引量：1
10雷超凡,初秀民,柳晨光,吴文祥,李松龙.船闸水域船舶列队协同停船预测控制器[J].中国机械工程,2022,33(4):421-431. 被引量：2

1杜江,孙铭阳.变压器设计方案多指标评估方法的研究[J].变压器,2019,56(7):19-23. 被引量：1
2湖大智能拖拉机团队:青春在于奋力扑腾[J].发明与创新（大科技）,2019,0(6):21-22. 被引量：1
3蒋永穆,鲜阳红,周宇晗.基于“三有”的高质量精准脱贫研究[J].农村经济,2019,0(7):49-54. 被引量：8
4杨艳,高玉英.智能网联产业链分析:毫米波雷达成关键部件[J].汽车与配件,2019,0(6):64-69. 被引量：6
5鲁俊.地铁深基坑施工安全控制框架思路构建[J].智能城市,2019,5(13):88-89.
6冯翔,邱龙辉,郭晓然.基于LSTM模型的学生反馈文本学业情绪识别方法[J].开放教育研究,2019,25(2):114-120. 被引量：20
7黄震,刘广军,刘超,张怀.基于Android的MOCA认知诊断软件设计和算法研究[J].机电一体化,2018,24(9):3-8.
8李忠鹏.基于风险管理的内部控制体系研究——以X集团为例[J].营销界,2019,0(21):34-34.
9麦丽莹.新医改背景下医院档案管理的改进方法[J].现代企业文化,2019,0(18):117-117.
10何永,文成林.基于多传感器与多维空间的故障分类方法[J].自动化与仪表,2019,34(5):15-18.

交通信息与安全

2019年第3期

浏览历史

内容加载中请稍等...

基于深度强化学习的协同式自适应巡航控制被引量：8

参考文献13

二级参考文献65

共引文献264

同被引文献45

引证文献8

二级引证文献27

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的协同式自适应巡航控制 被引量：8

参考文献13

二级参考文献65

共引文献264

同被引文献45

引证文献8

二级引证文献27

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的协同式自适应巡航控制被引量：8