用轻量化卷积神经网络图像语义分割的交通场景理解被引量：11

Traffic scene understanding using image semantic segmentation with an improved lightweight convolutional-neural-network

下载PDF

导出

摘要为提高汽车自动驾驶系统中视觉感知模块的鲁棒性,提出了使用图像语义分割方法进行交通场景理解。采用基于深度学习的语义分割方法,设计了兼顾运行速度和准确率的轻量化卷积神经网络。在特征提取部分,用轻量化特征提取模型MobileNetV2结构,用可变形卷积代替步长为2的卷积层;在特征解码部分,缩减卷积核数目、引入多尺度的空洞可变形卷积,补充低层特征细节。用扩充的Pascal VOC 2012数据集进行预训练和评估,用交通场景数据集Cityscapes进行测试。结果表明:该网络结构的准确率达到了平均交互比(mean IoU) 69.2%,超过了用MobileNetV2的DeepLab语义分割网络,运行速度127 ms/帧,占内存1.073 GB,优于使用VGG-16、ResNet-101的结果。 A method of traffic scene understanding was proposed using image semantic segmentation method to improve the robustness of a visual perception model in an automotive autonomous driving system.A lightweight convolutional-neural-network was designed adopting semantic segmentation using deep learning with striking an optimal balance between efficiency and performance.The lightweight model,Mobile Net V2,was adopted in the feature-extraction section,and the convolution layers were replaced using stride=2with deformable convolution layers;In feature-decoder section,multi-scale Atrous deformable convolution module was designed and low-level features were also used to add more detail information.Augmented PASCAL VOC2012dataset was used to pre-train and evaluate the network and the traffic scene dataset,Cityscapes,was used to fine-tune and test.The results show that the new network achieves an accuracy of mean IoU(intersection over union)of69.2%,and has better performances than that from DeepLab semantic segmentation networks with MobileNetV2.The new network takes only127ms per frame and1.073GB memory and is more efficient than that by the networks with VGG-16and ResNet-101.

作者白傑郝培涵陈思汉 BAI Jie;HAO Peihan;CHEN Sihan(School of Automotive Studies, Tongji University, Shanghai 201804, China)

机构地区同济大学汽车学院

出处《汽车安全与节能学报》 CAS CSCD 2018年第4期433-440,共8页 Journal of Automotive Safety and Energy

基金国家重点研发计划(2016YFB0101101)

关键词汽车自动驾驶场景理解视觉感知图像语义分割轻量化卷积神经网络深度学习 automotive autonomous driving scene understanding visual perception image semantic segmentation lightweight convolutional neural network deep learning

分类号 U461.6 [机械工程—车辆工程] U467.1 [机械工程—车辆工程]

引文网络
相关文献

参考文献3

1陈思汉,余建波.基于二维局部均值分解的图像多尺度分析处理[J].计算机辅助设计与图形学学报,2015,27(10):1842-1850. 被引量：11
2陈思汉,余建波.基于二维局部均值分解的自适应保真项全变分图像滤噪方法[J].计算机辅助设计与图形学学报,2016,28(6):986-994. 被引量：4
3鹿文浩,王生进.鲁棒的车载摄像头对向车辆检测与跟踪方法[J].清华大学学报（自然科学版）,2013,53(11):1509-1514. 被引量：3

二级参考文献41

1朱立新,王平安,夏德深.非线性扩散图像去噪中的耦合自适应保真项研究[J].计算机辅助设计与图形学学报,2006,18(10):1519-1524. 被引量：12
2ZHOU Jie, GAO Dashan , ZHANG David. Moving vehicle detection for automatic traffic monitoring [J]. IEEE Trans Vehicular Technology, 2007, S60), 51 - 59.
3Barnich 0, Droogenbroeck V M. ViBE, A powerful random technique to estimate the background in video sequences [C]/ /Proc IEEE Int Conf Acoustics, Speech, and Signal Processing, Taipei, China, IEEE Press, 2009, 945 - 948.
4Massimo P. Background subtraction techniques, a review [C]// Proc IEEE Int Conf Systems, Man, Cybernetics, Hague, IEEE Press, 2004, 3099 - 3104.
5Cheon M, Lee W, Yoon C, Park M. Vision-based vehicle detection system with consideration of the detecting location [J], IEEE Trans l ntell ig ent Transportation Systems, 2009, 13(3), 1243 -1252.
6CAO Xianbin , WU Changxia , Y AN Pingkun , LI Xuelong. Linear SVM classification using boosting HOG features for vehicle detection in low-altitude airborne videos [C]/ / Proc 18th IEEE Int Conf Image Processing, Brussels, IEEE Press, 2011, 2421 - 2424.
7TAN Feng , LI Luoxin , CAl Bo, ZHANG Dengyi. Shape template based side-view car detection algorithm [C]/ / Proc 3rd Int Workshop on Intelligent Systems and Applications, WuHan, China, IEEE Press, 2011, 28 - Z9.
8CAl Bo, TAN Feng, LU Yi, ZHANG Dengyi. Knowledge template based multi-perspective car recognition algorithm [J]. Int Journal of Information Engineering and Electronic Business, ZOI0, 2(2), 38 - 45.
9Viola P, Jones M. Rapid objects detection using a boosted cascade of simple features [C]/ / Proc IEEE Conf on Computer Vision and Pattern Recognition, Kauai , IEEE Press, ZOOl, 511 - 518.
10Dalal N, Triggs B. Histograms of oriented gradients for human detection [C]/ / Proc IEEE Conf Computer Vision and Pattern Recognition, S. Diego, IEEE Press, 2005, 886 - 893.

共引文献14

1李涛,陈建英,刘莉.基于多尺度下LBP和PSO的织物瑕疵检测方法研究[J].西南民族大学学报（自然科学版）,2019,45(1):66-71. 被引量：5
2成正国,潘广贞.基于TLD的动态背景下视觉跟踪技术研究[J].电视技术,2015,39(7):111-114. 被引量：1
3陈思汉,余建波.基于二维局部均值分解的自适应保真项全变分图像滤噪方法[J].计算机辅助设计与图形学学报,2016,28(6):986-994. 被引量：4
4陈思汉,余建波.基于二维局部均值分解的图像边缘检测算法[J].计算机科学与探索,2016,10(6):847-855. 被引量：4
5苏卓,吴学标,曾碧怡,颜吉超,罗笑南.基于双边核回归的相对约减纹理分解方法[J].计算机辅助设计与图形学学报,2016,28(12):2202-2209. 被引量：2
6李艳玮,郑伟勇.基于目标提取和信息逼真度的图像融合[J].计算机工程与设计,2017,38(4):965-969. 被引量：2
7杨珍.局部自交干扰的全变分图像自适应滤噪算法[J].科学技术与工程,2017,17(32):280-284. 被引量：1
8陈佳林.基于健全逻辑的煤矿监测预警决策模型研究[J].计算机与数字工程,2017,45(6):1138-1140. 被引量：3
9刘海强,余建波.二维局部均值分解算法[J].计算机辅助设计与图形学学报,2018,30(10):1859-1869. 被引量：2
10刘国辉,张伟伟,吴训成,宋晓琳,许莎,温培刚.基于VGG-M网络模型的前方车辆跟踪[J].汽车工程,2019,41(1):57-63. 被引量：5

同被引文献97

1周继苗,李必军,陈世增.一种多层特征融合的道路场景实时分割方法[J].测绘通报,2020(1):10-15. 被引量：8
2张长江,汪晓东,吴建斌,张浩然,汪金山.图像对比度增强的小波变换法[J].仪器仪表学报,2005,26(z1):630-631. 被引量：5
3蔡梅艳,吴庆宪,姜长生.改进Otsu法的目标图像分割[J].电光与控制,2007,14(6):118-119. 被引量：48
4徐丽珍,孙霖.基于AdaBoost的人行横道红绿灯自动识别算法[J].计算机应用与软件,2010,27(3):241-243. 被引量：3
5武莹,张小宁,何斌.基于图像处理的交通信号灯识别方法[J].交通信息与安全,2011,29(3):51-54. 被引量：19
6刘志刚.汽车发展史简述[J].汽车运用,2000,0(12):15-16. 被引量：8
7郑胤,陈权崎,章毓晋.深度学习及其在目标和行为识别中的新进展[J].中国图象图形学报,2014,19(2):175-184. 被引量：147
8杨帆.无人驾驶汽车的发展现状和展望[J].上海汽车,2014(3):35-40. 被引量：97
9李德毅,赵菲,刘萌,王建.自动驾驶量产的难点分析及展望[J].武汉大学学报（信息科学版）,2018,43(12):1775-1779. 被引量：13
10吴超仲,吴浩然,吕能超.人机共驾智能汽车的控制权切换与安全性综述[J].交通运输工程学报,2018,18(6):131-141. 被引量：49

引证文献11

1张宏钊,吕启深,党晓婧,李炎裕,代德宇.基于加权损失函数的多尺度对抗网络图像语义分割算法[J].计算机应用与软件,2020,37(1):284-291. 被引量：3
2夏雪,孙琦鑫,侍啸,柴秀娟.基于轻量级无锚点深度卷积神经网络的树上苹果检测模型[J].智慧农业（中英文）,2020,2(1):99-110. 被引量：8
3程晓悦,赵龙章,胡穹,史家鹏.基于膨胀卷积平滑及轻型上采样的实时语义分割[J].激光与光电子学进展,2020,57(2):177-184. 被引量：12
4章军辉,陈大鹏,李庆.自动驾驶技术研究现状及发展趋势[J].科学技术与工程,2020,20(9):3394-3403. 被引量：38
5刘影,姚振鑫.基于NVIDIA Jetson TX2的实时交通信号灯检测算法[J].农业装备与车辆工程,2020,58(7):49-53. 被引量：3
6齐榕,贾瑞生,徐志峰,毛其超.基于YOLOv3的轻量级目标检测网络[J].计算机应用与软件,2020,37(10):208-213. 被引量：18
7高振海,于桐,孙天骏,王雨蒙.面向无人驾驶的数据采集与分析系统研究综述[J].汽车技术,2021(6):1-11. 被引量：9
8杨贞,彭小宝,朱强强,殷志坚.基于Deeplab V3 Plus的自适应注意力机制图像分割算法[J].计算机应用,2022,42(1):230-238. 被引量：11
9郭克友,贺成博,王凯迪,王苏东,李雪,张沫.COVID‐19疫情下基于YOLOv4的安全社交距离风险评估[J].计算机工程,2022,48(10):28-36.
10张文博,瞿珏,王崴,胡俊,王庆力.融合多尺度特征的改进Deeplab v3+图像语义分割算法[J].电光与控制,2022,29(11):12-16. 被引量：5

二级引证文献108

1黎国溥,陈升东,王亮,邹凯,袁峰.基于改进YOLOv5的车辆端目标检测[J].计算机系统应用,2022,31(12):127-134. 被引量：7
2赵浙栋,张成涛.改进YOLO v5s的道路目标检测模型轻量化研究[J].汽车零部件,2023(8):67-71.
3张涛,谢探阳,李玉梅,白俊华.基于改进YOLOv4算法的玻璃杯缺陷识别方法研究[J].电子测量技术,2023,46(2):46-51. 被引量：5
4王鑫,窦爱霞,郭红梅,袁小祥.基于Deeplab V3+的2019年长宁M6.0地震建筑物震害信息提取研究[J].地震,2022,42(3):124-140.
5门长贵.干法粉煤加压气化技术的开发现状和应用前景[J].煤化工,2000,28(1):16-19. 被引量：17
6刘恒权,孙时知,赵国鹏,于欣伟,尚世南.粘性溶液中炭渣颗粒的去除研究[J].中国矿业,2000,9(3):61-63.
7方健.电导率监测在研究碳酸钙水溶液析晶过程中的应用[J].工科物理,2000,10(4):41-45.
8史兴萍,徐江涛,蒋永唐,秦书臻,路凯歌.用于多光谱语义分割的LBP特征增强神经网络[J].激光与光电子学进展,2020,57(14):46-53. 被引量：1
9徐华.浅谈交通检测技术及其未来发展趋势[J].智能城市应用,2020,3(6):35-36. 被引量：1
10陈思宇,刘彦,田富林.基于深度学习的批量二维码识别系统[J].信息技术与信息化,2021(1):232-235. 被引量：2

1殷凡青,李传友,姜良超,程吉鹏.自动驾驶汽车的发展现状和展望[J].摩托车技术,2018(11):33-36. 被引量：1
2吴从中,陈曦,季栋,詹曙.结合深度残差学习和感知损失的图像去噪[J].中国图象图形学报,2018,23(10):1483-1491. 被引量：19
3敖焕轩,李煊鹏,张为公.高效率图片语义分割网络的研究与设计[J].测控技术,2018,37(11):40-44.
4何翔,谷晗,赵佳龙,王圣达,魏旭,田峰.铝合金轻量化客车结构开裂原因分析及改善方法[J].热处理技术与装备,2018,39(5):58-61. 被引量：6
5李学鋆.基于UTMD的汽车自动驾驶的路径规划寻优算法[J].汽车安全与节能学报,2018,9(4):449-455. 被引量：2
6秦思琪,曾子明.基于深度哈希的数字人文移动视觉搜索方法[J].情报资料工作,2018,39(6):29-36. 被引量：7
7汪贵平,盛广峰,黄鹤,王会峰,王萍.基于改进LeNet-5网络的交通标志识别方法[J].科学技术与工程,2018,18(34):78-84. 被引量：12
8王鹏飞.日本国土交通省使用车载检测器收集3维道路基础设施数据[J].城市交通,2018,16(5):108-108.
9林志龙,王长龙,胡永江,张岩.SAR图像目标识别的卷积神经网模型[J].中国图象图形学报,2018,23(11):1733-1741. 被引量：6
10王一霖,万华森,曾鹏.基于仿真平台的自动驾驶汽车转向控制方法优化研究[J].软件导刊,2018,17(12):29-33. 被引量：3

汽车安全与节能学报

2018年第4期

浏览历史

内容加载中请稍等...

用轻量化卷积神经网络图像语义分割的交通场景理解被引量：11

参考文献3

二级参考文献41

共引文献14

同被引文献97

引证文献11

二级引证文献108

相关作者

相关机构

相关主题

浏览历史

用轻量化卷积神经网络图像语义分割的交通场景理解 被引量：11

参考文献3

二级参考文献41

共引文献14

同被引文献97

引证文献11

二级引证文献108

相关作者

相关机构

相关主题

浏览历史

用轻量化卷积神经网络图像语义分割的交通场景理解被引量：11