改进的RetinaNet目标检测算法被引量：4

Improved RetinaNet Algorithm for Object Detection

下载PDF

导出

摘要针对经典一阶段目标检测算法RetinaNet难以充分提取不同阶段特征、边界框回归不够准确等问题,提出一个面向目标检测的改进型RetinaNet算法。在特征提取模块中加入多光谱通道注意力,将输入特征中的频率分量合并到注意力处理中,从而捕获特征原有的丰富信息。将多尺度特征融合模块添加到特征提取模块,多尺度特征融合模块包括1个路径聚合模块和1个特征融合操作,路径聚合模块通过搭建自底向上的路径,利用较浅特征层上精确的定位信号增强整个特征金字塔的信息流,特征融合操作通过融合来自每个阶段的特征信息优化多阶段特征的融合效果。此外,在边界框回归过程中引入完全交并比损失函数,从边界框的重叠面积、中心点距离和长宽比这3个重要的几何因素出发,提升回归过程的收敛速度与准确性。在MS COCO数据集和PASCAL VOC数据集上的实验结果表明,与RetinaNet算法相比,改进型RetinaNet算法在2个数据集上的平均精度分别提高了2.1、1.1个百分点,尤其对于MS COCO数据集中较大目标的检测,检测精度的提升效果更加显著。 Based on the problems that the classical one-stage object detection algorithm RetinaNet is difficult to fully extract and fuse different stage features,while the bounding box regression is not sufficiently accurate,an improved RetinaNet algorithm for object detection is proposed.First,the algorithm adds multispectral channel attention to the feature extraction module,which incorporates more frequency components in the input features into the attention processing to capture the original rich information of the features.Thereafter,the multiscale feature fusion module is added after the feature extraction module,and the multiscale feature fusion module includes a path aggregation module and a feature fusion operation.The pathaggregation module enhances the information flow of the entire feature pyramid by building bottom-up paths and using accurate positioning signals on shallower feature layers.The feature fusion operation further enhances the fusion effect of multistage features by fusing the feature information from each stage.Finally,the Complete Intersection over Union(CIoU)loss function is introduced in the bounding box regression process.The loss function starts from three important geometric factors,namely,the overlapping area of the bounding box,the distance between the center points,and the aspect ratio to improve the convergence speed of the regression process and accuracy.The experimental results on the MS COCO and PASCAL VOC datasets show that,compared with the RetinaNet algorithm,the average accuracy of the improved RetinaNet algorithm on the two datasets is increased by 2.1 and 1.1 percentage points,especially for the MS COCO data set.For the detection of large targets,improving the detection accuracy is more significant.

作者于敏屈丹司念文 YU Min;QU Dan;SI Nianwen(School of Software,Zhengzhou University,Zhengzhou 450000,China;School of Information Systems Engineering,Strategic Support Force Information Engineering University,Zhengzhou 450000,China)

机构地区郑州大学软件学院战略支援部队信息工程大学信息系统工程学院

出处《计算机工程》 CAS CSCD 北大核心 2022年第8期249-257,共9页 Computer Engineering

基金国家自然科学基金(62171470,61673395)。

关键词深度学习目标检测多光谱通道注意力多尺度特征融合完全交并比 deep learning object detection multi-spectral channel attention multi-scale feature fusion Complete Intersection over Union(CIoU)

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1吴华运,任德均,吕义钊,胡彬,付磊,邱吕.基于改进的RetinaNet医药空瓶表面气泡检测[J].四川大学学报（自然科学版）,2020,57(6):1090-1095. 被引量：8
2闫建伟,张乐伟,赵源,张富贵.改进RetinaNet的刺梨果实图像识别[J].中国农机化学报,2021,42(3):78-83. 被引量：5

二级参考文献6

1邵志敏,张意,张卫华,周激流.基于机器视觉的瓶装白酒杂质检测[J].四川大学学报（自然科学版）,2019,56(2):235-240. 被引量：7
2宋欢欢,惠飞,景首才,郭兰英,马峻岩.改进的RetinaNet模型的车辆目标检测[J].计算机工程与应用,2019,55(13):225-230. 被引量：29
3王璐璐,张为,孙琦龙.一种改进RetinaNet的室内人员检测算法[J].西安电子科技大学学报,2019,46(5):69-74. 被引量：5
4刘革,郑叶龙,赵美蓉.基于RetinaNet改进的车辆信息检测[J].计算机应用,2020,40(3):854-858. 被引量：15
5谢学立,李传祥,杨小冈,席建祥,陈彤.基于动态感受野的航拍图像目标检测算法[J].光学学报,2020,40(4):101-113. 被引量：10
6张物华,李锵,关欣.基于多尺度卷积神经网络的X光图像中肺炎病灶检测[J].激光与光电子学进展,2020,57(8):179-186. 被引量：9

共引文献11

1关忠榜,杨颜博,李敏超.基于改进Mask R-CNN的牛脸目标检测算法[J].电子测量技术,2023,46(24):133-138. 被引量：2
2马飞,刘祯.目标检测算法在无人驾驶领域应用的研究[J].科技创新与应用,2021,11(34):40-43. 被引量：1
3王卜,何扬.基于改进YOLOv3的交通标志检测[J].四川大学学报（自然科学版）,2022,59(1):51-61. 被引量：17
4石丽,裴莉莉,陈昊,李伟,袁博,冯笑然.改进RetinaNet的水泥路面露骨病害检测[J].计算机系统应用,2022,31(4):352-359. 被引量：6
5杨凯,李锐,罗林,谢利明.基于改进RetinaNet的列车关键部件检测研究[J].激光与光电子学进展,2022,59(12):284-291. 被引量：2
6任秋霖,任德均,李鑫,闫宗一,曹林杰,唐洪.基于卷积自编码器的医用玻璃瓶口缺陷检测方法[J].计算机与现代化,2022(8):114-120. 被引量：3
7余骥远,高尚兵,李洁,陈新,李士丛,张浩淼,袁星星,唐琪.基于MS-PLNet和高光谱图像的绿豆叶斑病病级分类[J].江苏农业科学,2023,51(6):178-186. 被引量：1
8严陈慧子,田芳明,谭峰,王思琪,石景秀.基于改进YOLOv4的水稻病害快速检测方法[J].江苏农业科学,2023,51(6):187-194. 被引量：4
9薛静,陈鹏,朱魁,孙精通.计算机图像处理和识别技术在中药研究中的应用进展[J].天津药学,2023,35(4):69-73. 被引量：1
10杨振,李林,罗文婷,倪昌双,傅幼华.改进YOLOv5的沥青路面病害检测算法[J].计算机工程与设计,2023,44(11):3360-3372. 被引量：4

同被引文献45

1王凯,姜吴昊,吕艳,倪益华,侯英岢.基于深度学习的笼养蛋鸡行为实时检测方法[J].中国农业大学学报,2019,24(11):123-133. 被引量：7
2赵亚丽,沙洲,路泽永,刘欣.基于φ-OTDR和YOLO实现PIG跟踪策略的研究[J].光电子．激光,2022,33(7):739-745. 被引量：3
3汤一平,杨昭,石兴民,钟羽云.基于计算机视觉的鹦鹉行为分析关键技术的研究[J].小型微型计算机系统,2016,37(4):841-846. 被引量：4
4劳凤丹,杜晓冬,滕光辉.基于深度图像的蛋鸡行为识别方法[J].农业机械学报,2017,48(1):155-162. 被引量：20
5汤青萍,卜柱,王志跃,穆春宇,常玲玲,付胜勇,张蕊.肉鸽生产性能名词术语的规范与建议[J].中国家禽,2017,39(11):64-67. 被引量：18
6秦卫红,达剑森.种鸽行为学观察及其对繁殖性能的影响[J].中国家禽,2018,40(13):66-68. 被引量：5
7刘翠翠.基于综合特征和多层感知器的图像分类[J].电子测量技术,2019,42(8):74-77. 被引量：8
8徐诚极,王晓峰,杨亚东.Attention-YOLO:引入注意力机制的YOLO检测算法[J].计算机工程与应用,2019,55(6):13-23. 被引量：70
9谢觉,唐俊.基于视频流和位置流混合的建筑施工人员行为识别研究[J].电子世界,2019,0(16):49-50. 被引量：2
10仝泽友,丁恩杰.矿井皮带区矿工违规行为识别方法[J].河南科技大学学报（自然科学版）,2020,41(2):40-46. 被引量：8

引证文献4

1朱强,孙晨,徐潘宇驰,闫云凤.基于FCOS的智慧工地异常行为二阶段检测算法[J].浙江电力,2023,42(4):65-71. 被引量：1
2郭建军,何国煌,徐龙琴,刘同来,冯大春,刘双印.基于改进YOLO v4的肉鸽行为检测模型研究[J].农业机械学报,2023,54(4):347-355. 被引量：5
3李苗,苗青,关力.基于Keras和视频处理技术的火焰识别算法探讨[J].信息与电脑,2023,35(24):130-133.
4姚珊珊,王静宇,郝斌,张飞,高鹭,任晓颖.基于改进YOLOv5的超分辨率和多尺度融合目标检测算法[J].光电子．激光,2024,35(8):793-802.

二级引证文献6

1刘莫尘,褚镇源,崔明诗,杨庆璐,王金星,杨化伟.基于改进YOLO v8-Pose的红熟期草莓识别和果柄检测[J].农业机械学报,2023,54(S02):244-251. 被引量：8
2付旭晨,于英利,王磊,韩义,韩元.火力发电机组节能指标统计方法研究[J].内蒙古电力技术,2023,41(4):87-93.
3王昱,易振峰,谭文超,郭金菊,周星星,赵俊宏.遮挡条件下多视角甜椒果实点云三维重构方法[J].农业机械学报,2024,55(5):218-225.
4郑文轩,杨瑛.基于频域数据增强与轻量化YOLO v7模型的成熟期香梨目标检测方法[J].农业机械学报,2024,55(5):244-253. 被引量：1
5王旺,王福顺,张伟进,刘红达,王晨,王超,何振学.基于改进YOLO v8s的羊只行为识别方法[J].农业机械学报,2024,55(7):325-335. 被引量：1
6董振华,曾学智,陈凌煜,黄东明,王敏洁.基于YOLOv5模型的肉鸽识别技术研究[J].电子制作,2024,32(18):67-70.

1韩松,马国军.改进多尺度特征融合的行人检测算法[J].电光与控制,2022,29(8):114-119. 被引量：2
2刘迪,郭继昌,汪昱东,张怡.融合注意力机制的多尺度显著性目标检测网络[J].西安电子科技大学学报,2022,49(4):118-126. 被引量：9
3张利强.变复杂为简单以不变应万变——多位数的读写训练[J].数学学习与研究,2022(16):71-73.
4张润梅,毕利君,汪方斌,袁彬,罗谷安,姜怀震.多尺度特征融合与锚框自适应的目标检测算法[J].激光与光电子学进展,2022,59(12):410-419. 被引量：2
5赫晓慧,宋定君,李盼乐,田智慧,周广胜.融合多尺度特征的遥感影像道路提取方法[J].计算机工程,2022,48(8):196-205. 被引量：8
6薛俊达,朱家佳,张静,李晓辉,窦帅,米琳,李子扬,苑馨方,李传荣.基于FFC-SSD模型的光学遥感图像目标检测[J].光学学报,2022,42(12):130-140. 被引量：15
7强海燕,解思,李万莉,孙友刚,董达善.基于滑模观测器的一阶系统时滞识别方法的仿真研究[J].实验室研究与探索,2021,40(11):106-110.
8胡雅妮,李光亚,韩晓东,简丽,张国花.基于双判别生成对抗网络的壁画图像虚拟修复[J].国外电子测量技术,2022,41(6):14-19. 被引量：6
9储开斌,叶托,张继.基于改进Faster R-CNN的头盔检测算法研究[J].国外电子测量技术,2022,41(6):86-92. 被引量：4
10石磊,彭少康,张亚萌,赵国桦,高宇飞.基于特征增强金字塔网络的阿尔茨海默症早期诊断研究[J].数据采集与处理,2022,37(4):727-735. 被引量：1

计算机工程

2022年第8期

浏览历史

内容加载中请稍等...

改进的RetinaNet目标检测算法被引量：4

参考文献2

二级参考文献6

共引文献11

同被引文献45

引证文献4

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

改进的RetinaNet目标检测算法 被引量：4

参考文献2

二级参考文献6

共引文献11

同被引文献45

引证文献4

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

改进的RetinaNet目标检测算法被引量：4