基于注意力机制的多模态自动驾驶行为决策模型被引量：2

Multimodal Autonomous Driving-behavior Prediction Model Based on Attention Mechanism

导出

摘要针对现有端到端自动驾驶模型未考虑驾驶场景中不同区域的重要性和不同语义类别之间的关系而导致预测准确率低的问题,受驾驶人注意力机制和现有端到端自动驾驶模型的启发,充分考虑驾驶场景的动态变化、驾驶场景的语义信息和深度信息对驾驶行为决策的影响,以连续多帧驾驶场景的RGB图像为输入,构建一种基于注意力机制的多模态自动驾驶行为预测模型,实现对方向盘转角和车速的准确预测。首先,通过语义分割模型和单目深度估计模型分别获取RGB图像的语义图像和深度图像;其次,为剔除与驾驶行为决策无关信息,以神经科学和空间抑制理论为基础,设计一种拟人化注意力机制作为能量函数来计算驾驶场景中不同区域的重要度;为学习语义图像中与驾驶行为决策最为相关类别之间的关系,采用图注意力网络(Graph Attention Network, GAT)对驾驶场景的语义图像进行特征提取;然后,以保留RGB特征为原则对提取的驾驶场景的图像特征、语义特征和深度特征进行融合,采用卷积长短期记忆网络(Convolutional Long Short Term Memory, ConvLSTM)实现融合特征在连续多帧之间的传递,进而实现下一帧驾驶场景对应驾驶行为的预测;最后,与其他模型的对比试验、消融试验、泛化试验和特征可视化试验来充分验证所提出自动驾驶行为预测模型的性能。试验结果表明:与其他驾驶行为预测模型相比,所提出模型的训练误差为0.021 2,预测准确率为86.97%,均方误差为0.031 5,其驾驶行为的预测性能优于其他模型;连续多帧的语义图像和深度图像、拟人化注意力机制和面向语义特征提取的GAT有助于提升驾驶行为预测的性能;该模型具有较好的泛化能力,其做出驾驶行为预测所依赖的特征与经验丰富的驾驶人所关注的特征基本一致。 The accuracy of existing end-to-end autonomous driving behavior prediction models is low because the importance of each image area and the strong relationship between different semantic parts in semantic images are not considered. To solve this problem, inspired by the driver attention mechanism and existing autonomous driving behavior prediction models, and considering the impact of dynamic changes in driving scenes, and the semantic and depth information of driving scenes on driving-behavior prediction, a novel multimodal autonomous driving behavior prediction model based on the attention mechanism was developed. This was achieved by inputting continuous multiple frames of RGB images, which accurately predict the vehicle speed and steering wheel angle. First, semantic and depth images of RGB video frames were generated based on the segmentation network and monocular depth estimation model. Second, an anthropomorphic attention mechanism was proposed as energy to calculate the importance of each area in an image based on well-established neuroscience and spatial suppression theories, which ignore driving behavior-irrelevant information. Third, a graph attention network(GAT) was adopted to extract semantic image features, which can learn the relationship between the categories in the semantic image that are most relevant to driving behavior decisions. Fourth, RGB, semantic, and depth features were fused based on the principle that RGB features should be preserved. Convolutional long short-term memory(ConvLSTM) was used to fulfill the transition of fused features in multiple continuous frames. Subsequently, driving behavior of the next driving scene was predicted. Finally, these experiments, including a comparison with state-of-the-art models, an ablation study of our proposed model, a generalization experiment, and driving behavior feature visualization, were conducted to validate the performance of the proposed model. The results demonstrate that the performance is better than that of other models(training loss is 0.021 2, accuracy is 86.97%, and mean square error is 0.031 5). The ablation study indicates that the semantic and depth images of continuous multiple frames, the anthropomorphic attention mechanism, and the GAT for extracting semantic features, assists in improving driving-behavior prediction performance. The generalization experiment also demonstrated that the proposed model has a good generalization performance. The feature visualization experiments demonstrate that the features upon which our proposed model relies to predict driving behavior are fundamentally identical to those of experienced drivers.

作者郭应时黄涛 GUO Ying-shi;HUANG Tao(School of Automobile,Chang'an University,Xi'an 710064,Shaanxi,China)

机构地区长安大学汽车学院

出处《中国公路学报》 EI CAS CSCD 北大核心 2022年第9期141-156,共16页 China Journal of Highway and Transport

基金国家重点研发计划项目(2019YFB1600500) 长安大学研究生科研实践创新项目(300103722003)。

关键词汽车工程自动驾驶模型注意力机制驾驶行为多模态 automotimve engineering autonomous driving model attention mechanism driving behavior multimodal

分类号 U471.15 [机械工程—车辆工程]

引文网络
相关文献

参考文献6

1解仑,王志良,任冬淳,滕少冬.简化路况模式下驾驶员情绪模型的研究[J].自动化学报,2010,36(12):1732-1743. 被引量：7
2胡云峰,曲婷,刘俊,施竹清,朱冰,曹东璞,陈虹.智能汽车人机协同控制的研究现状与展望[J].自动化学报,2019,45(7):1261-1280. 被引量：62
3宗长富,代昌华,张东.智能汽车的人机共驾技术研究现状和发展趋势[J].中国公路学报,2021,34(6):214-237. 被引量：49
4孙秦豫,付锐,王畅,郭应时,袁伟,刘卓凡.人机协作系统中车辆轨迹规划与轨迹跟踪控制研究[J].中国公路学报,2021,34(9):146-160. 被引量：20
5张新钰,高洪波,赵建辉,周沫.基于深度学习的自动驾驶技术综述[J].清华大学学报（自然科学版）,2018,58(4):438-444. 被引量：116
6赵祥模,连心雨,刘占文,沈超,董鸣.基于MM-STConv的端到端自动驾驶行为决策模型[J].中国公路学报,2020,33(3):170-183. 被引量：12

二级参考文献66

1郑南宁.人工智能新时代[J].智能科学与技术学报,2019,0(1):1-3. 被引量：64
2郭烈,葛平淑,夏文旭,秦增科.基于人机共驾的车道保持辅助控制系统研究[J].中国公路学报,2019,32(12):46-57. 被引量：15
3胡腾波,叶建栲.马尔科夫链模型在GIS数据预测中的应用[J].计算机系统应用,2008,17(8):90-93. 被引量：17
4李兴泉,贺岩松,徐中明,张志飞.汽车方向控制驾驶员模型[J].重庆大学学报（自然科学版）,2006,29(4):5-8. 被引量：15
5方予,陈增强,袁著祉.基于人工智能的情感模型建立[J].信息与控制,2006,35(6):673-678. 被引量：11
6Reichardt D M. Approaching driver models which integrate models of emotion and risk. In: Proceedings of the IEEE Intelligent Vehicles Symposium. Eindhoven, The Kingdom of the Nethelands: IEEE, 2008. 234-239.
7Nass C, Jonsson I M, Harris H, Reaves B, Endo J, Brave S. Improving automotive safety by pairing driver emotion and car voice emotion. In: Proceedings of the CHI Extended Abstracts of Human Factors in Computing Systems. Portland, USA: ACM, 2005. 1973-1976.
8Leng H, Lin Y, Zanzi L A. An experimental study on physiological parameters toward driver emotion recognition. In: Proceedings of the International Conference on Ergonomics and Health Aspects of Work with Computers. Berlin, Germany: Springer, 2007. 237-246.
9Fukuda S. Detecting driver's emotion: a step toward emotion-based reliability engineering. Recent Advances in Reliability and Quality in Design. Berlin: Springer, 2008. 491-507.
10滕少冬.应用于个人机器人的人工情感模型研究[博士学位论文].北京科技大学,中国,2006.

共引文献243

1崔驰,游聪,李晓冲.针对自动驾驶车辆的对抗攻击与防御研究进展[J].郑州师范教育,2021,10(6):18-22.
2朱冰,党瑞捷,赵健,陈志成,隋清海,官浩,劳德杏,刘志鹏.智能汽车冗余电控制动系统电流传感器故障容错控制[J].中国公路学报,2023,36(4):249-260. 被引量：4
3赵轩,王姝,马建,余强,郑字琛.分布式驱动电动汽车底盘集成控制技术综述[J].中国公路学报,2023,36(4):221-248. 被引量：9
4刘卓凡,丁涛,吴付威,张海伦.平直高速公路低交通量下L2自动驾驶对驾驶人心理负荷的影响[J].中国公路学报,2022,35(4):256-266. 被引量：3
5吕宜生,刘雅慧,陈圆圆,朱凤华.融合时空特征的端到端自动驾驶车辆转向角预测[J].中国公路学报,2022,35(3):263-272. 被引量：2
6范佳琦,李鑫,霍天娇,洪金龙,高炳钊,陈虹.基于单阶段算法的智能汽车跨域检测研究[J].中国公路学报,2022,35(3):249-262. 被引量：8
7韩嘉懿,朱冰,赵健,马驰.基于握力分布的驾驶人人机共驾状态识别研究[J].中国公路学报,2022,35(3):166-176. 被引量：4
8郭柏苍,王胤霖,谢宪毅,金立生,韩广德.基于人-车风险状态的人机共驾控制权决策方法[J].中国公路学报,2022,35(3):153-165. 被引量：4
9刘俊,时婉晴,郭洪艳,戴启坤,高振海.一种驾驶权动态调整的人机主从博弈共驾方法[J].中国公路学报,2022,35(3):127-138. 被引量：3
10曹丹妮,吴建军,屈云超,刘浩.考虑自动车队强度的高速公路非常规瓶颈交通流控制策略研究[J].中国公路学报,2022,35(3):78-88. 被引量：5

同被引文献18

1李恒,张氢,秦仙蓉,孙远韬.基于短时傅里叶变换和卷积神经网络的轴承故障诊断方法[J].振动与冲击,2018,37(19):124-131. 被引量：286
2孙琦,刘新厂,张兵,陈春俊.直齿轮系齿根裂纹损伤程度检测方法[J].振动．测试与诊断,2019,39(2):327-333. 被引量：7
3陈仁祥,周君,胡小林,韩兴波,朱孙科,张晓.基于深度Q学习和连续小波变换的旋转机械故障诊断方法[J].振动工程学报,2021,34(5):1092-1100. 被引量：23
4刘飞,陈仁文,邢凯玲,丁汕汕,张迈一.基于迁移学习与深度残差网络的滚动轴承快速故障诊断算法[J].振动与冲击,2022,41(3):154-164. 被引量：48
5王宏伟,孙文磊,张小栋,何丽.基于优化VMD复合多尺度散布熵及LSTM的风力发电机齿轮箱故障诊断方法研究[J].太阳能学报,2022,43(4):288-295. 被引量：12
6孙曙光,张婷婷,王景芹,魏硕,邵旭.基于连续小波变换和MTL-SEResNet的断路器故障程度评估[J].仪器仪表学报,2022,43(6):162-173. 被引量：11
7黄子恒,许钊源,伍剑波,方辉,李晋航,宁琨.基于优化模态分解和Xgblr的风机叶片故障诊断方法[J].机械设计,2022,39(7):56-62. 被引量：8
8何婷,乔俊强,包建勤,张亚东.基于EMD和SVM的电力系统故障分类识别[J].仪表技术,2022(4):64-69. 被引量：9
9王建,吴昊,张博,南东亮,欧阳金鑫,熊小伏.不平衡样本下基于迁移学习-AlexNet的输电线路故障辨识方法[J].电力系统自动化,2022,46(22):182-191. 被引量：19
10巩泉役,彭克,陈羽,王玮,刘发英.基于电弧随机性和卷积网络的交流串联电弧故障识别方法[J].电力系统自动化,2022,46(24):162-169. 被引量：16

引证文献2

1薛森.基于换道意图识别的高速公路换道驾驶行为预测研究[J].中国新技术新产品,2023(20):140-142.
2李练兵,肖亚泽,张萍,张国峰,吴伟强,陈程.基于CWT-RES34的风电机组叶片裂纹状态评估[J].噪声与振动控制,2024,44(2):143-148.

1张俊生,伍寒英.新时代党的意识形态工作制度建构的基本特征与经验启示[J].阜阳师范大学学报（社会科学版）,2022(5):99-104.
2法苏恬.启功的“学”与“教”对新时代高等书法教育人才培养的启示[J].艺术教育,2022(10):135-138.
3卞华军,王华军,赵赫威.基于通道权重的顺序精炼RGB-D显著检测网络[J].计算机应用研究,2022,39(9):2854-2860.
4赵伸.基于特征点提取的影视动画场景色彩搭配系统[J].吉林大学学报（信息科学版）,2022,40(4):688-693. 被引量：1
5王烨,沈娉,张嘉颖.新加坡适老化住宅建设特征与经验[J].建设科技,2022(21):57-60.
6周卫林,王玉龙,裴锋,黄明亮,闫春香.基于分段学习模型的自动驾驶行为决策算法研究[J].中国公路学报,2022,35(6):324-338.
7王一波,梁伟鄯,赵云.面向视觉SLAM的改进RGB特征点检测算法[J].物联网技术,2022,12(9):17-19. 被引量：2
8雷基林,李建微,刘懿,苟瑶,刘阳,邓晰文.液滴高速撞击低温壁面的动态特性及破碎机理研究[J].实验流体力学,2022,36(5):96-101. 被引量：2
9徐然.以色列技术转移机构运行模式及其对中国的启示[J].科技和产业,2022,22(9):87-91. 被引量：3
10田文浩,陈俊洪,钟经谋,刘文印.基于局部特征移位网络的手部骨架动作识别[J].计算机科学与应用,2022,12(8):1877-1886.

中国公路学报

2022年第9期

浏览历史

内容加载中请稍等...

基于注意力机制的多模态自动驾驶行为决策模型被引量：2

参考文献6

二级参考文献66

共引文献243

同被引文献18

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于注意力机制的多模态自动驾驶行为决策模型 被引量：2

参考文献6

二级参考文献66

共引文献243

同被引文献18

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于注意力机制的多模态自动驾驶行为决策模型被引量：2