基于人-车风险状态的人机共驾控制权决策方法被引量：4

Decision Making Method for Control Right Transition of Human-machine Shared Driving Based on Driver-vehicle Risk State

原文传递

导出

摘要频发的交通事故证明驾驶车辆是一类高风险行为,驾驶人的风险驾驶行为是引发交通事故的主要诱因,自动驾驶系统辅助或代替人类驾驶人被视为从根本上解决人为因素导致行车风险的有效途径。首先,以智能汽车的整体安全性最大化为目标,使用熵权-逼近理想解排序法(Technique for Order Preference by Similarity to Ideal Solution,TOPSIS)和完全静态博弈理论建立了人、车风险博弈模型,提出了相对效用最大化的策略函数并嵌入强化学习奖励函数中,推理了以最大化车辆安全性期望为导向的强化学习奖惩机制。其次,利用强化学习算法擅长解决序列决策问题的优势,提出了基于优势演员评论家(Advantage Actor Critic,A2C)的人机共驾控制权决策方法,通过迭代人、车风险决策权重和奖励函数优化了决策模型的输出效果,借助模型性能评价指标进行了训练过程和结果的有效性验证。最后,通过仿真试验分析了不同切换时机对车辆安全性的影响,提出了能够及时有效地限制驾驶人风险行为并提升车辆安全性的控制权决策方法。研究结果表明:研究创新地以人、车风险监测模块分别映射至A2C的演员、评论家模块为研究框架,充分发挥了智能汽车与人、车风险状态进行交互并通过获取奖励来迭代更新取得最大回报的效果,实现了以促进车辆安全性最大化为导向的人机共驾控制权决策方法。 Frequent traffic accidents have proved that driving is a high-risk event and risky driving behaviors are one of the main causes.Using an automatic driving system as an agent to assist or replace human drivers is considered an effective way to fundamentally solve the threats caused by human factors.First,to maximize the overall safety of intelligent vehicles,a human-vehicle risk game model was established by utilizing entropy-technique for order preference by similarity to ideal solution(TOPSIS)and complete static game theory.A strategy function to maximize the relative utility was proposed and embedded in the reinforcement learning reward function,then the reward and punishment mechanism guided by maximizing vehicle safety expectation were deduced.Second,taking advantage of reinforcement learning which is good at solving sequence decision-making problems,a human-vehicle driving control transition method based on advantage actor critical(A2 C)was proposed.The output effect of the decision model was optimized by iterating the decision weights and reward functions,and the validity of the training process and result was verified by the model performance evaluation indices.Finally,the influence of different transition times on vehicle safety was analyzed through simulation test.A control right decision-making method that can limit risky behaviors and improve vehicle safety timely and effectively was proposed.The results showed that this research innovatively takes the actor and critic modules mapped from the human and vehicle risk monitoring module to A2 C as the framework,which fully utilizes the interaction between intelligent vehicle and human-vehicle risk state.Moreover,it achieves the maximum return by obtaining rewards updated iteratively.The decision-making method of human-machine driving control right guided by promoting the maximization of vehicle safety is realized.

作者郭柏苍王胤霖谢宪毅金立生韩广德 GUO Bo-cang;WANG Yin-lin;XIE Xian-yi;JIN Li-sheng;HAN Guang-de(School of Vehicle and Energy,Yanshan University,Qinhuangdao 066004,Hebei,China)

机构地区燕山大学车辆与能源学院

出处《中国公路学报》 EI CAS CSCD 北大核心 2022年第3期153-165,共13页 China Journal of Highway and Transport

基金国家自然科学基金项目(52072333,U19A2069) 河北省省级科技计划资助项目(E2020203092,20310801D,F2021203107).

关键词汽车工程控制权决策强化学习人机共驾汽车人因工程智能车辆 automotive engineering control right transition reinforcement learning human-machine shared driving automotive human factors engineering intelligent vehicle

分类号 U463.6 [机械工程—车辆工程]

引文网络
相关文献

参考文献5

1宗长富,代昌华,张东.智能汽车的人机共驾技术研究现状和发展趋势[J].中国公路学报,2021,34(6):214-237. 被引量：48
2何仁,赵晓聪,杨奕彬,王建强.基于驾驶人风险响应机制的人机共驾模型[J].吉林大学学报（工学版）,2021,51(3):799-809. 被引量：18
3Chao Huang,Fazel Naghdy,Haiping Du,Hailong Huang.Shared Control of Highly Automated Vehicles Using Steer-By-Wire Systems[J].IEEE/CAA Journal of Automatica Sinica,2019,6(2):410-423. 被引量：10
4刘瑞,朱西产,刘霖,马志雄.基于非合作模型预测控制的人机共驾策略[J].同济大学学报（自然科学版）,2019,47(7):1037-1045. 被引量：16
5乔骥,王新迎,张擎,张东霞,蒲天骄.基于柔性行动器–评判器深度强化学习的电–气综合能源系统优化调度[J].中国电机工程学报,2021,41(3):819-832. 被引量：70

二级参考文献43

1郭烈,葛平淑,夏文旭,秦增科.基于人机共驾的车道保持辅助控制系统研究[J].中国公路学报,2019,32(12):46-57. 被引量：15
2周念成,何宽,王强钢,雷超,蒋一平.高压配电网与天然气管网互联的转供优化模型[J].中国电机工程学报,2020,40(5):1432-1443. 被引量：6
3许洪国,张慧永,宗芳.交通事故致因分析的贝叶斯网络建模[J].吉林大学学报（工学版）,2011,41(S1):89-94. 被引量：18
4李兴泉,贺岩松,徐中明,张志飞.汽车方向控制驾驶员模型[J].重庆大学学报（自然科学版）,2006,29(4):5-8. 被引量：15
5吕岸,胡振程,陈慧.基于高斯混合隐马尔科夫模型的高速公路超车行为辨识与分析[J].汽车工程,2010,32(7):630-634. 被引量：28
6李亚秋,吴超仲,马晓凤,黄珍,张晖.基于EKF学习方法的BP神经网络汽车换道意图识别模型研究[J].武汉理工大学学报（交通科学与工程版）,2013,37(4):843-847. 被引量：19
7吴超仲,吴浩然,吕能超.人机共驾智能汽车的控制权切换与安全性综述[J].交通运输工程学报,2018,18(6):131-141. 被引量：47
8刘洪,李吉峰,葛少云,张鹏,陈星屹.基于多主体博弈与强化学习的并网型综合能源微网协调调度[J].电力系统自动化,2019,43(1):40-48. 被引量：62
9张良力,祝贺,马天宇.基于贝叶斯网络的机动车驾驶行为状态分析建模[J].交通信息与安全,2014,32(5):77-82. 被引量：6
10谈东奎,陈无畏,王家恩,汪洪波,黄鹤.基于人机共享和分层控制的车道偏离辅助系统[J].机械工程学报,2015,51(22):98-110. 被引量：16

共引文献138

1赵轩,王姝,马建,余强,郑字琛.分布式驱动电动汽车底盘集成控制技术综述[J].中国公路学报,2023,36(4):221-248. 被引量：9
2刘卓凡,丁涛,吴付威,张海伦.平直高速公路低交通量下L2自动驾驶对驾驶人心理负荷的影响[J].中国公路学报,2022,35(4):256-266. 被引量：3
3范佳琦,李鑫,霍天娇,洪金龙,高炳钊,陈虹.基于单阶段算法的智能汽车跨域检测研究[J].中国公路学报,2022,35(3):249-262. 被引量：8
4韩嘉懿,朱冰,赵健,马驰.基于握力分布的驾驶人人机共驾状态识别研究[J].中国公路学报,2022,35(3):166-176. 被引量：4
5刘俊,时婉晴,郭洪艳,戴启坤,高振海.一种驾驶权动态调整的人机主从博弈共驾方法[J].中国公路学报,2022,35(3):127-138. 被引量：3
6曹丹妮,吴建军,屈云超,刘浩.考虑自动车队强度的高速公路非常规瓶颈交通流控制策略研究[J].中国公路学报,2022,35(3):78-88. 被引量：5
7胡悦,朱家明,凤君仪.“同心协力”项目多因素分析研究[J].湖南文理学院学报（自然科学版）,2020,32(3):8-13.
8Wenshuo Wang,Xiaoxiang Na,Dongpu Cao,Jianwei Gong,Junqiang Xi,Yang Xing,Fei-Yue Wang.Decision-Making in Driver-Automation Shared Control:A Review and Perspectives[J].IEEE/CAA Journal of Automatica Sinica,2020,7(5):1289-1307. 被引量：19
9何仁,赵晓聪,杨奕彬,王建强.基于驾驶人风险响应机制的人机共驾模型[J].吉林大学学报（工学版）,2021,51(3):799-809. 被引量：18
10Eman Mousavinejad,Xiaohua Ge,Senior Member,Qing-Long Han,Teng Joon Lim,Ljubo Vlacic.An Ellipsoidal Set-Membership Approach to Distributed Joint State and Sensor Fault Estimation of Autonomous Ground Vehicles[J].IEEE/CAA Journal of Automatica Sinica,2021,8(6):1107-1118. 被引量：4

同被引文献82

1韩嘉懿,朱冰,赵健,马驰.基于握力分布的驾驶人人机共驾状态识别研究[J].中国公路学报,2022,35(3):166-176. 被引量：4
2刘俊,时婉晴,郭洪艳,戴启坤,高振海.一种驾驶权动态调整的人机主从博弈共驾方法[J].中国公路学报,2022,35(3):127-138. 被引量：3
3吴超仲,吴浩然,吕能超.基于间接共享控制的智能车协同接管方法[J].中国公路学报,2022,35(3):101-114. 被引量：3
4郭烈,葛平淑,夏文旭,秦增科.基于人机共驾的车道保持辅助控制系统研究[J].中国公路学报,2019,32(12):46-57. 被引量：15
5李韶华,杨泽坤,王雪玮.基于T-S模糊变权重MPC的智能车轨迹跟踪控制[J].机械工程学报,2023,59(4):199-212. 被引量：14
6芦勇,田贺.基于模糊逻辑的车道保持系统控制策略[J].电子技术（上海）,2020(2):50-51. 被引量：1
7徐鑫,王孝兰,郭晨.多车道纵向避障控制算法研究[J].智能计算机与应用,2022,12(1):53-57. 被引量：1
8张晓斐,王孝兰,郭晨.考虑路面状态的车辆纵向避障控制策略研究[J].智能计算机与应用,2022,12(1):21-27. 被引量：1
9刘小明,郑淑晖,蒋新春.基于动态重复博弈的车辆换道模型[J].公路交通科技,2008,25(6):120-125. 被引量：12
10吴超仲,吴浩然,吕能超.人机共驾智能汽车的控制权切换与安全性综述[J].交通运输工程学报,2018,18(6):131-141. 被引量：47

引证文献4

1吴超仲,冷姚,陈志军,罗鹏.基于强化学习的智能车人机共融转向驾驶决策方法[J].交通运输工程学报,2022,22(3):55-67. 被引量：1
2李鹏洲,高振刚,蒲德全.智能汽车发展背景下的人机协同控制研究现状分析[J].汽车文摘,2023(6):9-23. 被引量：4
3李凯,韩增文,陈金建,李斌,王洪波.车辆车道保持系统人机共享转向控制[J].交通节能与环保,2024,20(4):104-110.
4章军辉,郭晓满,刘禹希,郑明强,钱宇晗,丁羽璇.人机共驾型车道保持鲁棒控制[J].汽车工程,2024,46(10):1853-1862.

二级引证文献5

1江学焕,隋纪祥,彭国生,程诗卿,程登良,黄海波.汽车电子综合实训平台建设与教学改革实施探索[J].电脑与电信,2023(7):13-15.
2蔡婷,孙云霞.智慧驾驶应用场景下的新能源汽车导航交互设计策略[J].汽车与新动力,2024,7(2):28-31. 被引量：2
3刘星星,王楠,薛荣辉.基于自适应模型预测的智能网联车辆主动避障研究[J].内燃机与配件,2024(9):31-33.
4姜涵,张健,张海燕,郝威,马昌喜.基于强化学习的交叉口智能网联车多目标通行控制方法[J].交通信息与安全,2024,42(1):84-93.
5邹蕴涵.加快培育壮大消费新动力[J].宏观经济管理,2024(5):35-44.

1康恒武.交通事故责任不清工伤如何认定[J].劳动和社会保障法规政策专刊,2020(10):47-50.
2任元明.城市房价、人口流动与全要素生产率--来自中国2005-2018年194个城市数据的证据[J].西南大学学报（自然科学版）,2022,44(1):160-174. 被引量：7
3方松,马健霄,李根,沈玲宏,徐楚博.城市快速路右侧车道移动作业区行车风险分析[J].吉林大学学报（工学版）,2022,52(8):1786-1791. 被引量：2
4高涛.智能汽车泊车轨迹规划应用[J].汽车实用技术,2022,47(17):31-35.
5刘芳.“一带一路”倡议实施中的乌兹别克斯坦宗教风险研究——基于全球宗教风险理论的分析视角[J].世界宗教文化,2022(4):55-62. 被引量：2
6郭紫奕,董颖,陈劲.中国区域制造业高质量发展水平评价研究[J].浙江科技学院学报,2022,34(4):328-337. 被引量：3
7罗锦彬.基于人工智能算法的无人机自动控制研究[J].蚌埠学院学报,2022,11(5):29-33. 被引量：1
8王珂,姚建国,余佩遥,杨胜春,钟海旺,严嘉豪.基于深度强化学习的电网前瞻调度智能决策架构及关键技术初探[J].中国电机工程学报,2022,42(15):5430-5438. 被引量：17
9周金泉,宋彦伟,袁宇君,尹小剑.花式种植,点土成金[J].农药市场信息,2022(13):62-63.
10Amit Gupta,Ranganathan Kumar.Two-Dimensional Lattice Boltzmann Model for Droplet Impingement and Breakup in Low Density Ratio Liquids[J].Communications in Computational Physics,2011,10(8):767-784. 被引量：1

中国公路学报

2022年第3期

浏览历史

内容加载中请稍等...

基于人-车风险状态的人机共驾控制权决策方法被引量：4

参考文献5

二级参考文献43

共引文献138

同被引文献82

引证文献4

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于人-车风险状态的人机共驾控制权决策方法 被引量：4

参考文献5

二级参考文献43

共引文献138

同被引文献82

引证文献4

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于人-车风险状态的人机共驾控制权决策方法被引量：4