基于深度强化学习的车辆跟驰控制被引量：24

A Car-following Control Algorithm Based on Deep Reinforcement Learning

导出

摘要针对自适应巡航控制系统在控制主车跟驰行驶中受前车运动状态的不确定性影响问题,在分析车辆运动特点的基础上.提出一种能够考虑前车运动随机性的跟驰控制策略。搭建驾驶人实车驾驶数据采集平台,招募驾驶人进行实车跟驰道路试验.建立驾驶人真实驾驶数据库。假设车辆未来时刻的加速度决策主要受前方目标车辆运动影响.建立基于双前车跟驰结构的主车纵向控制架构。将驾驶数据库中的驾驶数据分别视作前车和前前车运动变化历程,利用高斯过程算法建立了前车纵向加速度变化随机过程模型.实现对前方目标车运动状态分布的概率性建模。将车辆跟驰问题构建为一定奖励函数下的马尔可夫决策过程,引入深度强化学习研究主车跟驰控制问题。利用近端策略优化算法建立车辆跟驰控制策略.通过与前车运动随机过程模型进行交互式迭代学习,得到具有运动不确定性跟驰环境下的主车纵向控制策略,实现对车辆纵向控制的最优决策。最后基于真实驾驶数据,对控制策略进行测试。研究结果表明:该策略建立了车辆纵向控制与主车和双前车状态之间的映射关系,在迭代学习过程中对前车运动的随机性进行考虑,跟驰控制中不需要对前车运动进行额外的概率预测,能够以较低的计算量实现主车稳定跟随前车行驶。 Longitudinal acceleration decisions in a car-following control mode are directly determined by the state of the preceding vehicle.A driver's uncertainty makes car-following control difficult because of the complexity in state prediction of the target vehicle.To address the problem in which the performance of adaptive cruise control may deteriorate without consideration of the uncertainty of the preceding vehicle,a car-following control strategy based on deep reinforcement learning was proposed.To study the characteristics of human drivers,a drivingdata-acquisition platform was established,and substantial amounts of human-driving data were collected.Based on the assumption that longitudinal control decisions are mainly affected by the preceding vehicle,a two-predecessor following structure was established.The vehicles in the driving dataset were taken as target vehicles 1^# and 2^# of the car-following control.Based on the real-world driving dataset,a stochastic process model was established to describe the characteristics of preceding vehicle 1^# based on Gaussian process algorithm.Then car-following control was established as a Markov decision process.A car-following control method based on deep reinforcement learning was obtained through iterative learning with the stochastic process model using proximal policy optimization.Finally,the algorithm was verified based on the driving dataset.The results demonstrate that the mapping between longitudinal acceleration decisions and the states of the host and preceding vehicles can be obtained through iterative learning with consideration of the uncertainty of the target vehicle.

作者朱冰蒋渊德赵健陈虹邓伟文 ZHU Bing;JIANG Yuan-de;ZHAO Jian;CHEN Hong;DENG Wei-wen(State Key Laboratory of Automotive Simulation and Control,Jilin University,Changchun 130025,Jilin,China;School of Transportation Science and Engineering. Beihang University,Beijing 100083,China)

机构地区吉林大学汽车仿真与控制国家重点实验室北京航空航天大学交通科学与工程学院

出处《中国公路学报》 EI CAS CSCD 北大核心 2019年第6期53-60,共8页 China Journal of Highway and Transport

基金国家重点研发计划项目(2016YFB0100904) 国家自然科学基金项目(51775235) 吉林省科技发展计划重点科技研发项目(20180201056GX) 吉林省发改委科技研发项目(2019C036-6)

关键词汽车工程跟驰控制深度强化学习自适应巡航控制运动不确定高斯过程 automotive engineering car-following control deep reinforcement learning adaptive cruise control driver's uncertainty Gaussian process

分类号 U469.91 [机械工程—车辆工程]

引文网络
相关文献

参考文献5

1王建强,杨波,张德兆,李升波.基于双模式执行器的商用车自适应巡航控制系统[J].中国公路学报,2011,24(3):104-112. 被引量：9
2朱敏,陈慧岩.考虑车间反应时距的汽车自适应巡航控制策略[J].机械工程学报,2017,53(24):144-150. 被引量：33
3王雪松,朱美新.基于自然驾驶数据的中国驾驶人城市快速路跟驰模型标定与验证[J].中国公路学报,2018,31(9):129-138. 被引量：20
4钱立军,荆红娟,邱利宏.基于随机模型预测控制的四驱混合动力汽车能量管理[J].中国机械工程,2018,29(11):1342-1348. 被引量：23
5朱冰,蒋渊德,邓伟文,杨顺,何睿,苏琛.基于KL散度的驾驶员驾驶习性非监督聚类[J].汽车工程,2018,40(11):1317-1323. 被引量：6

二级参考文献32

1王殿海,陶鹏飞,金盛,马东方.跟驰模型参数标定及验证方法[J].吉林大学学报（工学版）,2011,41(S1):59-65. 被引量：28
2高锋,王建强,侯德藻,李克强,连小珉.基于高速开关阀的电控汽车辅助制动系统[J].清华大学学报（自然科学版）,2004,44(11):1532-1535. 被引量：15
3YI K, KWON Y D. Vehicle-to vehicle Distance and Speed Control Using an Eleetronie-vacuum Booster [J]. JSAE Review, 2001,22(4) :403-412.
4LEE C, YI K. Modeling and Control of an Electronic vacuum Booster for Vehicle Cruise Control. Journal of Mechanical Science and Technology, 2002, 16 (10):1314 1319.
5MACIUCA D B, CHRISTIAN G J, KARL J H. Automatic Braking Control for IVHS[J]. JSAE Paper, 1995,16(2):219-224.
6SUBRAMANIAN S C, DARBH A S, RAJ AGOPAL K R. Modeling the Pneumatic Subsystem of an S-cam Air Brake System[J]. Journal of Dynamic Systems, Measurement and Control, 2004,126 (1) : 36-46.
7TAI M. Advanced Vehicle Control of Heavy Vehicles for Automated Highway Systems[D]. Berkeley: University of California, 2001.
8FRITZ A,SCHIEHLEN W. Nonlinear ACC in Simulation and Measurement[J]. Vehicle System Dynamics: International Journal of Vehicle Mechanics and Mobility, 2001,36(2/3): 159-177.
9YI K, MOON I, KWON Y D. A Vehicle to-vehicle Distance Control Algorithm for Stop-and-go Cruise Control[C]//IEEE. Proceeding of the 2001 Intelligent Transportation Systems Conference. Oakland.. IEEE, 2001:25-29.
10WU W,CHOU Y S. Output Tracking Control of Un certain Nonlinear Systems with an Input Time Delay [J]. IEE Proceedings--Control Theory and Appliea tions, 1996,143(4) : 309-318.

共引文献86

1袁焕涛,赵红,潘广纯,仇俊政.基于马尔科夫的混合动力汽车行驶车速预测研究[J].智能城市,2021(3):18-22. 被引量：2
2郑晏群,张进,罗玲.交通运行监测数据在交通模型参数标定中的应用研究——以深圳市为例[J].建筑经济,2020(S01):338-341.
3李鑫,韩鹏.车辆电控主动制动系统的建模与仿真[J].自动化与仪器仪表,2016(2):87-90. 被引量：3
4王建强,杨波,李升波,李克强.基于高速开关阀的气压电控辅助制动装置[J].交通运输工程学报,2011,11(4):61-67. 被引量：4
5胡波,孔祥英,杨科,王鑫,巩伟丽.IL-6及其与其他细胞因子联合应用对白血病细胞体外增殖的影响[J].第三军医大学学报,2000,22(5):455-458.
6陈慧岩,张瑞琳,朱晓龙,熊光明.越野无人驾驶车双回路电控-液压制动系统设计及试验[J].北京理工大学学报,2016,36(7):695-700. 被引量：13
7<中国公路学报>编辑部.中国汽车工程学术研究综述·2017[J].中国公路学报,2017,30(6):1-197. 被引量：379
8裴晓飞,陈祯福,武冬梅,吴学杰,褚端峰.无人驾驶汽车串联式制动系统控制研究[J].汽车技术,2018,0(9):12-16. 被引量：6
9白广路,曹聪聪,吕敏煜,高峰.模糊控制在跟车行驶中的应用[J].农业装备与车辆工程,2019,57(3):69-73. 被引量：1
10覃频频,张敏,侯晓磊,莫基强,万千.针对变道行为的自适应巡航控制系统上层速度控制模型仿真[J].科学技术与工程,2019,19(16):193-199. 被引量：3

同被引文献209

1吕超,鲁洪良,于洋,王昊阳,吴绍斌.基于分层强化学习和社会偏好的自主超车决策系统[J].中国公路学报,2022,35(3):115-126. 被引量：9
2朱宇,赵祥模,徐志刚,王润民.基于蒙特卡洛模拟的无人车高速公路变道虚拟测试场景自动生成算法[J].中国公路学报,2022,35(3):89-100. 被引量：12
3赵健,宋东鉴,朱冰,刘斌,陈志成,张培兴.基于自学习和监督学习混合驱动的智能汽车跟驰控制策略[J].中国公路学报,2022,35(3):55-65. 被引量：4
4陈慧,王洁新.基于驾驶人不满度的高速公路自动驾驶换道决策[J].中国公路学报,2019,32(12):1-9. 被引量：23
5周博林,张宗实,陈蔯.ASAM OpenX与基于场景的自动驾驶仿真测试[J].标准科学,2021(S01):110-122. 被引量：3
6刘法旺,李艳文.自动驾驶系统功能安全与预期功能安全研究[J].工业技术创新,2021,8(3):62-68. 被引量：6
7蒙昊蓝,陈君毅,邢星宇,陈磊,余卓平.汽车乘员不舒适感的客观表征研究[J].同济大学学报（自然科学版）,2019,47(S01):54-63. 被引量：5
8金立生,Bartvan Arem,杨双宾,Mascha van der Voort,Martijn Tideman.高速公路汽车辅助驾驶安全换道模型[J].吉林大学学报（工学版）,2009,39(3):582-586. 被引量：28
9石君友,康锐,田仲.基于信息模型的测试性试验样本集充分性研究[J].北京航空航天大学学报,2005,31(8):874-878. 被引量：15
10鲍秀之,陈新望,卢明岳.建筑物真三维图形的摄影测量方法[J].铁路航测,1996,22(3):1-4. 被引量：1

引证文献24

1赵健,宋东鉴,朱冰,刘斌,陈志成,张培兴.基于自学习和监督学习混合驱动的智能汽车跟驰控制策略[J].中国公路学报,2022,35(3):55-65. 被引量：4
2魏福禄,刘攀,陈龙,郭永青,蔡正干.信号交叉口左转车辆跟驰行为建模[J].科学技术与工程,2020,20(18):7493-7498. 被引量：11
3张亮修,陈鹏飞,张学义.纯电动汽车纵向跟车动力学建模与分层控制[J].山东交通学院学报,2020,28(3):1-7. 被引量：2
4宋晓琳,盛鑫,曹昊天,李明俊,易滨林,黄智.基于模仿学习和强化学习的智能车辆换道行为决策[J].汽车工程,2021,43(1):59-67. 被引量：18
5李文礼,张友松,韩迪,钱洪,石晓辉.基于深度强化学习的车辆自主避撞决策控制模型[J].汽车安全与节能学报,2021,12(2):201-209. 被引量：7
6余晓玫,何春燕,谭祥.基于激光传感技术的远距离车辆无线控制研究[J].激光杂志,2021,42(8):151-155.
7高振海,闫相同,高菲,孙天骏.仿驾驶员DDPG汽车纵向自动驾驶决策方法[J].汽车工程,2021,43(12):1737-1744. 被引量：11
8任玥,邹博文,尹旭,刘学高,梁新成.考虑驾驶员特性的个性化跟驰控制策略研究[J].西南大学学报（自然科学版）,2022,44(3):12-19.
9裴晓飞,莫烁杰,陈祯福,杨波.基于TD3算法的人机混驾交通环境自动驾驶汽车换道研究[J].中国公路学报,2021,34(11):246-254. 被引量：18
10李孟凡,秦文虎,云中华.基于横纵向联合控制的多目标优化车辆跟驰研究[J].计算机应用研究,2022,39(8):2409-2413. 被引量：2

二级引证文献107

1宋绍京,陆婷婷,孙翔,龚玉梅,陈建.面向自动驾驶的多任务环境感知算法[J].电子测量技术,2023,46(24):157-163.
2王澎斌.基于DUKF方法的汽车自动驾驶状态联合观测[J].工程机械文摘,2023(3):18-20. 被引量：1
3贾晓霞,刘文伟.基于层次优化算法的低温环境电动汽车变速器可靠性评估[J].环境技术,2021,39(2):103-108. 被引量：2
4任卫群,杜常清.新技术趋势下汽车工业中的系统仿真技术[J].计算机仿真,2021,38(8):1-6. 被引量：1
5龙岩松,徐进,潘存书,孙子秋.基于实车驾驶数据的信号交叉口车辆运行特性[J].科学技术与工程,2021,21(31):13567-13573. 被引量：6
6郝悦.智能汽车横纵向运动控制方法综述[J].汽车实用技术,2022,47(4):158-161. 被引量：2
7杨璐,王一权,刘佳琦,段玉林,张荣辉.基于融合离散动作的双延迟深度确定性策略梯度算法的自动驾驶端到端行为决策方法[J].交通信息与安全,2022,40(1):144-152. 被引量：2
8任玥,邹博文,尹旭,刘学高,梁新成.考虑驾驶员特性的个性化跟驰控制策略研究[J].西南大学学报（自然科学版）,2022,44(3):12-19.
9李远哲,胡纪滨.强化学习在无人车领域的应用与展望[J].信息与控制,2022,51(2):129-141. 被引量：6
10杨娇,张庆年,杨杰,阮军,吴绩伟,凌强.内河无人船的驾驶行为决策模型[J].武汉理工大学学报（交通科学与工程版）,2022,46(3):552-558. 被引量：1

1王斯民,王家瑞,宋晨,张早校,文键.造粒塔粉尘洗涤过程中流体力学特性与除尘效率研究[J].高校化学工程学报,2018,32(4):785-793. 被引量：2
2邓宇菁,胡列格,冯页新.基于改进的社会力模型对相向运动人群流中自组织现象的模拟[J].现代计算机,2018,24(20):15-19. 被引量：1
3罗浩.无人机飞行姿态检测及控制研究[J].电子世界,2018,0(1):175-176. 被引量：6
4江毓,昌诚程,陈青云,郑燕萍.窄道自动驾驶系统初探[J].交通技术,2017,6(1):10-16.
5申勇,马天奕,李祥尘.考虑速度对反应强度影响的车辆跟驰模型[J].交通运输工程与信息学报,2019,17(2):153-159. 被引量：4
6刘文竹,黄勃,高永彬,姜晓燕,张娟,余宇新.Item2vec与改进DDPG相融合的推荐算法[J].武汉大学学报（理学版）,2019,65(3):297-302. 被引量：2
7王亚东,黄云峰,李晓彤,赵建立,奚培锋.基于强化学习的复合储能微电网控制技术[J].山东工业技术,2019(6):159-159. 被引量：1
8新型神经网络系统能帮汽车处理未知情况[J].汽车工程师,2019(4):6-6.
9Elektrobit.验证自动驾驶技术的挑战将真实数据与基于云的模拟技术相结合[J].汽车与配件,2019,0(7):51-53.
10王萌,孙永厚,刘夫云,杨帅.基于模糊推理的车辆跟驰行驶仿真研究[J].桂林电子科技大学学报,2018,38(1):69-74. 被引量：5

中国公路学报

2019年第6期

浏览历史

内容加载中请稍等...

基于深度强化学习的车辆跟驰控制被引量：24

参考文献5

二级参考文献32

共引文献86

同被引文献209

引证文献24

二级引证文献107

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的车辆跟驰控制 被引量：24

参考文献5

二级参考文献32

共引文献86

同被引文献209

引证文献24

二级引证文献107

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的车辆跟驰控制被引量：24