期刊文献+
共找到540篇文章
< 1 2 27 >
每页显示 20 50 100
Two-Layer Attention Feature Pyramid Network for Small Object Detection
1
作者 Sheng Xiang Junhao Ma +2 位作者 Qunli Shang Xianbao Wang Defu Chen 《Computer Modeling in Engineering & Sciences》 SCIE EI 2024年第10期713-731,共19页
Effective small object detection is crucial in various applications including urban intelligent transportation and pedestrian detection.However,small objects are difficult to detect accurately because they contain les... Effective small object detection is crucial in various applications including urban intelligent transportation and pedestrian detection.However,small objects are difficult to detect accurately because they contain less information.Many current methods,particularly those based on Feature Pyramid Network(FPN),address this challenge by leveraging multi-scale feature fusion.However,existing FPN-based methods often suffer from inadequate feature fusion due to varying resolutions across different layers,leading to suboptimal small object detection.To address this problem,we propose the Two-layerAttention Feature Pyramid Network(TA-FPN),featuring two key modules:the Two-layer Attention Module(TAM)and the Small Object Detail Enhancement Module(SODEM).TAM uses the attention module to make the network more focused on the semantic information of the object and fuse it to the lower layer,so that each layer contains similar semantic information,to alleviate the problem of small object information being submerged due to semantic gaps between different layers.At the same time,SODEM is introduced to strengthen the local features of the object,suppress background noise,enhance the information details of the small object,and fuse the enhanced features to other feature layers to ensure that each layer is rich in small object information,to improve small object detection accuracy.Our extensive experiments on challenging datasets such as Microsoft Common Objects inContext(MSCOCO)and Pattern Analysis Statistical Modelling and Computational Learning,Visual Object Classes(PASCAL VOC)demonstrate the validity of the proposedmethod.Experimental results show a significant improvement in small object detection accuracy compared to state-of-theart detectors. 展开更多
关键词 Small object detection two-layer attention module small object detail enhancement module feature pyramid network
下载PDF
An Improved Data-Driven Topology Optimization Method Using Feature Pyramid Networks with Physical Constraints 被引量:1
2
作者 Jiaxiang Luo Yu Li +3 位作者 Weien Zhou ZhiqiangGong Zeyu Zhang Wen Yao 《Computer Modeling in Engineering & Sciences》 SCIE EI 2021年第9期823-848,共26页
Deep learning for topology optimization has been extensively studied to reduce the cost of calculation in recent years.However,the loss function of the above method is mainly based on pixel-wise errors from the image ... Deep learning for topology optimization has been extensively studied to reduce the cost of calculation in recent years.However,the loss function of the above method is mainly based on pixel-wise errors from the image perspective,which cannot embed the physical knowledge of topology optimization.Therefore,this paper presents an improved deep learning model to alleviate the above difficulty effectively.The feature pyramid network(FPN),a kind of deep learning model,is trained to learn the inherent physical law of topology optimization itself,of which the loss function is composed of pixel-wise errors and physical constraints.Since the calculation of physical constraints requires finite element analysis(FEA)with high calculating costs,the strategy of adjusting the time when physical constraints are added is proposed to achieve the balance between the training cost and the training effect.Then,two classical topology optimization problems are investigated to verify the effectiveness of the proposed method.The results show that the developed model using a small number of samples can quickly obtain the optimization structure without any iteration,which has not only high pixel-wise accuracy but also good physical performance. 展开更多
关键词 Topology optimization deep learning feature pyramid networks finite element analysis physical constraints
下载PDF
基于LWKConv-DRSN-FPN的旋转机械故障诊断
3
作者 伍兴 李志伟 +1 位作者 宁文乐 郑照 《噪声与振动控制》 CSCD 北大核心 2024年第5期133-139,共7页
针对传统旋转机械故障诊断方法难以应对强噪声干扰以及诊断准确率较低的问题,提出一种Laplace小波核卷积层(Laplace Wavelet Kernel Convolutional Layer,LWKConv)、深度残差收缩网络(Deep Residual Shrinkage Networks,DRSN)和特征金... 针对传统旋转机械故障诊断方法难以应对强噪声干扰以及诊断准确率较低的问题,提出一种Laplace小波核卷积层(Laplace Wavelet Kernel Convolutional Layer,LWKConv)、深度残差收缩网络(Deep Residual Shrinkage Networks,DRSN)和特征金字塔网络(Feature Pyramid Networks,FPN)相结合的故障诊断方法。具体地,在DRSN模型结构基础上,构造LWKConv,通过更新尺度因子和平移因子,多尺度提取故障引起的突变冲击特征;引入FPN融合深层和浅层特征,提高模型对浅层细节信息的利用程度,实现对旋转机械的故障诊断。研究表明:所提的LWKConv-DRSN-FPN方法基于轴承和齿轮数据集的诊断准确率最高能达到100%,尤其在-4 dB强噪声干扰条件下的诊断准确率达到97.75%,能有效提取突变冲击特征,具有较好的通用性和抗强噪声干扰能力。 展开更多
关键词 故障诊断 旋转机械 Laplace小波核卷积层 深度残差收缩网络 特征金字塔网络
下载PDF
改进损失函数的增强型FPN水下小目标检测 被引量:1
4
作者 乔美英 史建柯 +2 位作者 李冰锋 赵岩 史有强 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2023年第4期525-537,共13页
针对水下小目标因携带特征信息少、定位不精准而导致检测精度低的问题,提出一种特征金字塔网络(FPN).首先,在FPN上采样过程中加入协同非局部注意力模块,利用卷积、横纵向池化挖掘特征图的静态和动态上下文信息;其次,在FPN通道调整过程... 针对水下小目标因携带特征信息少、定位不精准而导致检测精度低的问题,提出一种特征金字塔网络(FPN).首先,在FPN上采样过程中加入协同非局部注意力模块,利用卷积、横纵向池化挖掘特征图的静态和动态上下文信息;其次,在FPN通道调整过程中加入三叉戟特征增强模块,利用并行空洞卷积与高效通道注意力(ECANet)捕捉多尺度空间与通道特征信息;最后,在FasterR-CNN算法的回归损失函数中引入线性回归损失增益系数,增大对多尺度目标回归偏移量的惩罚,提高定位精度.实验结果表明,采用2020年全国水下目标检测大赛提供的数据集、PASCALVOC数据集和MSCOCO数据集进行实验,该算法比基线FasterR-CNN算法精度分别提升2.8%,2.2%和2.5%,结果证明了其有效性. 展开更多
关键词 水下目标检测 小目标检测 特征金字塔网络 损失函数 Faster R-CNN
下载PDF
高频增强网络与FPN融合的水下目标检测 被引量:1
5
作者 乔美英 赵岩 +1 位作者 史建柯 史有强 《电子测量技术》 北大核心 2023年第13期146-154,共9页
针对水下目标检测中目标对比度低以及水下图像多尺度问题,提出了高频增强网络与特征金字塔(FPN)融合的水下目标检测算法,以提高对水下目标边缘、轮廓信息以及目标底层信息的提取。首先引入八度卷积将卷积层的输出特征按频率分解,将主干... 针对水下目标检测中目标对比度低以及水下图像多尺度问题,提出了高频增强网络与特征金字塔(FPN)融合的水下目标检测算法,以提高对水下目标边缘、轮廓信息以及目标底层信息的提取。首先引入八度卷积将卷积层的输出特征按频率分解,将主干网络提取到的特征图进行高、低频信息分离,鉴于水下目标的轮廓信息和噪声信息均包含于高频特征中,在高频信息通道中引入通道信息具有自适应增强特点的通道注意力机制,形成了一种高频增强卷积,以达到增强有用轮廓特征信息和抑制噪声的目的;其次,将增强的高频特征分量融入FPN的浅层网络中,提高原FPN对水下多尺度目标的特征表示能力,缓解多尺度目标漏检问题。最后,将所提方法与基线算法Faster R-CNN融合,在全国水下机器人大赛提供的数据集中进行实验。结果表明:改进算法识别准确率达到78.83%,相比基线提升2.61%,与其他类型目标检测算法相比,依然具备精度和实时检测优势,证明了从特征图频域角度提升前景和背景对比度的有效性。 展开更多
关键词 深度学习 水下目标检测 小目标检测 特征金字塔 八度卷积 通道注意力
原文传递
结合Graph-FPN与稳健优化的开放世界目标检测 被引量:2
6
作者 谢斌红 张鹏举 张睿 《计算机科学与探索》 CSCD 北大核心 2023年第12期2954-2966,共13页
开放世界目标检测(OWOD)要求检测图像中所有已知和未知的目标类别,同时模型必须逐步学习新的类别以自适应更新知识。针对ORE方法存在的未知目标召回率低以及增量学习的灾难性遗忘等问题,提出一种基于图特征金字塔的稳健优化开放世界目... 开放世界目标检测(OWOD)要求检测图像中所有已知和未知的目标类别,同时模型必须逐步学习新的类别以自适应更新知识。针对ORE方法存在的未知目标召回率低以及增量学习的灾难性遗忘等问题,提出一种基于图特征金字塔的稳健优化开放世界目标检测方法(GARO-ORE)。首先,利用Graph-FPN中的超像素图像结构以及上下文层和层次层的分层设计,获取丰富的语义信息并帮助模型准确定位未知目标;之后,利用稳健优化方法对不确定性综合考量,提出了基于平坦极小值的基类学习策略,极大限度地保证模型在学习新类别的同时避免遗忘先前学习到的类别知识;最后,采用基于知识迁移的新增类别权值初始化方法提高模型对新类别的适应性。在OWOD数据集上的实验结果表明,GARO-ORE在未知类别召回率上取得较优的检测结果,在10+10、15+5、19+1三种增量目标检测(iOD)任务中,其mAP指标分别提升了1.38、1.42和1.44个百分点。可以看出,GARO-ORE能够较好地提高未知目标检测的召回率,并且在有效缓解旧任务灾难性遗忘问题的同时促进后续任务的学习。 展开更多
关键词 开放世界目标检测(OWOD) 图特征金字塔网络 平坦极小值 知识迁移
下载PDF
基于YOLOX融合自注意力机制的FSA-FPN重构方法 被引量:1
7
作者 安鹤男 管聪 +2 位作者 邓武才 杨佳洲 马超 《电子技术应用》 2023年第3期61-66,共6页
随着目前目标检测任务输入图像分辨率的不断增大,在特征提取网络的感受野不变的情况下,网络提取的特征信息会越来越局限,相邻特征点之间的信息重合度也会越来越高。提出一种FSA(Fusion Self-Attention)-FPN,设计SAU(Self-Attention Upsa... 随着目前目标检测任务输入图像分辨率的不断增大,在特征提取网络的感受野不变的情况下,网络提取的特征信息会越来越局限,相邻特征点之间的信息重合度也会越来越高。提出一种FSA(Fusion Self-Attention)-FPN,设计SAU(Self-Attention Upsample)模块,SAU内部结构通过CNN与自注意力机制(Self-Attention)进行交叉计算以进一步进行特征融合,并通过重构FCU(Feature Coupling Unit)消除二者之间的特征错位,弥补语义差距。以YOLOX-Darknet53为主干网络,在Pascal VOC2007数据集上进行了对比实验。实验结果表明,对比原网络的FPN,替换FSA-FPN后的平均精度值m AP@[.5:.95]提升了1.5%,预测框的位置也更为精准,在需要更高精度的检测场景下有更为出色的使用价值。 展开更多
关键词 FSA-fpn 特征融合 SAU 自注意力机制
下载PDF
Multi-scale object detection by top-down and bottom-up feature pyramid network 被引量:13
8
作者 ZHAO Baojun ZHAO Boya +2 位作者 TANG Linbo WANG Wenzheng WU Chen 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2019年第1期1-12,共12页
While moving ahead with the object detection technology, especially deep neural networks, many related tasks, such as medical application and industrial automation, have achieved great success. However, the detection ... While moving ahead with the object detection technology, especially deep neural networks, many related tasks, such as medical application and industrial automation, have achieved great success. However, the detection of objects with multiple aspect ratios and scales is still a key problem. This paper proposes a top-down and bottom-up feature pyramid network(TDBU-FPN),which combines multi-scale feature representation and anchor generation at multiple aspect ratios. First, in order to build the multi-scale feature map, this paper puts a number of fully convolutional layers after the backbone. Second, to link neighboring feature maps, top-down and bottom-up flows are adopted to introduce context information via top-down flow and supplement suboriginal information via bottom-up flow. The top-down flow refers to the deconvolution procedure, and the bottom-up flow refers to the pooling procedure. Third, the problem of adapting different object aspect ratios is tackled via many anchor shapes with different aspect ratios on each multi-scale feature map. The proposed method is evaluated on the pattern analysis, statistical modeling and computational learning visual object classes(PASCAL VOC)dataset and reaches an accuracy of 79%, which exhibits a 1.8% improvement with a detection speed of 23 fps. 展开更多
关键词 convolutional neural NETWORK (CNN) feature pyramid NETWORK (fpn) object detection deconvolution.
下载PDF
Bidirectional parallel multi-branch convolution feature pyramid network for target detection in aerial images of swarm UAVs 被引量:4
9
作者 Lei Fu Wen-bin Gu +3 位作者 Wei Li Liang Chen Yong-bao Ai Hua-lei Wang 《Defence Technology(防务技术)》 SCIE EI CAS CSCD 2021年第4期1531-1541,共11页
In this paper,based on a bidirectional parallel multi-branch feature pyramid network(BPMFPN),a novel one-stage object detector called BPMFPN Det is proposed for real-time detection of ground multi-scale targets by swa... In this paper,based on a bidirectional parallel multi-branch feature pyramid network(BPMFPN),a novel one-stage object detector called BPMFPN Det is proposed for real-time detection of ground multi-scale targets by swarm unmanned aerial vehicles(UAVs).First,the bidirectional parallel multi-branch convolution modules are used to construct the feature pyramid to enhance the feature expression abilities of different scale feature layers.Next,the feature pyramid is integrated into the single-stage object detection framework to ensure real-time performance.In order to validate the effectiveness of the proposed algorithm,experiments are conducted on four datasets.For the PASCAL VOC dataset,the proposed algorithm achieves the mean average precision(mAP)of 85.4 on the VOC 2007 test set.With regard to the detection in optical remote sensing(DIOR)dataset,the proposed algorithm achieves 73.9 mAP.For vehicle detection in aerial imagery(VEDAI)dataset,the detection accuracy of small land vehicle(slv)targets reaches 97.4 mAP.For unmanned aerial vehicle detection and tracking(UAVDT)dataset,the proposed BPMFPN Det achieves the mAP of 48.75.Compared with the previous state-of-the-art methods,the results obtained by the proposed algorithm are more competitive.The experimental results demonstrate that the proposed algorithm can effectively solve the problem of real-time detection of ground multi-scale targets in aerial images of swarm UAVs. 展开更多
关键词 Aerial images Object detection feature pyramid networks Multi-scale feature fusion Swarm UAVs
下载PDF
Dual Attention Based Feature Pyramid Network 被引量:4
10
作者 Huijun Xing Shuai Wang +1 位作者 Dezhi Zheng Xiaotong Zhao 《China Communications》 SCIE CSCD 2020年第8期242-252,共11页
Object detection could be recognized as an essential part of the research to scenarios such as automatic driving and pedestrian detection, etc. Among multiple types of target objects, the identification of small-scale... Object detection could be recognized as an essential part of the research to scenarios such as automatic driving and pedestrian detection, etc. Among multiple types of target objects, the identification of small-scale objects faces significant challenges. We would introduce a new feature pyramid framework called Dual Attention based Feature Pyramid Network(DAFPN), which is designed to avoid predicament about multi-scale object recognition. In DAFPN, the attention mechanism is introduced by calculating the topdown pathway and lateral pathway, where the spatial attention, as well as channel attention, would participate, respectively, such that the pyramidal feature maps can be generated with enhanced spatial and channel interdependencies, which bring more semantical information for the feature pyramid. Using the COCO data set, which consists of a considerable quantity of small-scale objects, the experiments are implemented. The analysis results verify the optimized performance of DAFPN compared with the original Feature Pyramid Network(FPN) specifically for the identification on a small scale. The proposed DAFPN is promising for object detection in an era full of intelligent machines that need to detect multi-scale objects. 展开更多
关键词 object detection convolutional neural networks feature pyramid
下载PDF
Neighborhood fusion-based hierarchical parallel feature pyramid network for object detection 被引量:3
11
作者 Mo Lingfei Hu Shuming 《Journal of Southeast University(English Edition)》 EI CAS 2020年第3期252-263,共12页
In order to improve the detection accuracy of small objects,a neighborhood fusion-based hierarchical parallel feature pyramid network(NFPN)is proposed.Unlike the layer-by-layer structure adopted in the feature pyramid... In order to improve the detection accuracy of small objects,a neighborhood fusion-based hierarchical parallel feature pyramid network(NFPN)is proposed.Unlike the layer-by-layer structure adopted in the feature pyramid network(FPN)and deconvolutional single shot detector(DSSD),where the bottom layer of the feature pyramid network relies on the top layer,NFPN builds the feature pyramid network with no connections between the upper and lower layers.That is,it only fuses shallow features on similar scales.NFPN is highly portable and can be embedded in many models to further boost performance.Extensive experiments on PASCAL VOC 2007,2012,and COCO datasets demonstrate that the NFPN-based SSD without intricate tricks can exceed the DSSD model in terms of detection accuracy and inference speed,especially for small objects,e.g.,4%to 5%higher mAP(mean average precision)than SSD,and 2%to 3%higher mAP than DSSD.On VOC 2007 test set,the NFPN-based SSD with 300×300 input reaches 79.4%mAP at 34.6 frame/s,and the mAP can raise to 82.9%after using the multi-scale testing strategy. 展开更多
关键词 computer vision deep convolutional neural network object detection hierarchical parallel feature pyramid network multi-scale feature fusion
下载PDF
基于CA-BIFPN的交通标志检测模型 被引量:5
12
作者 郎斌柯 吕斌 +1 位作者 吴建清 吴瑞年 《深圳大学学报(理工版)》 CAS CSCD 北大核心 2023年第3期335-343,共9页
正确、快速的交通标志检测可为自动驾驶领域的环境感知提供重要信息.针对目前交通标志检测识别率低及多种交通标志检测存在的误检漏检等问题,提出一种协调注意力-双向特征金字塔网络(coordinate attention-bidirectional feature pyrami... 正确、快速的交通标志检测可为自动驾驶领域的环境感知提供重要信息.针对目前交通标志检测识别率低及多种交通标志检测存在的误检漏检等问题,提出一种协调注意力-双向特征金字塔网络(coordinate attention-bidirectional feature pyramid network,CA-BIFPN)交通标志检测模型.该模型将YOLOv5(you only look once version 5)模型和协调注意力(coordinate attention,CA)机制相结合,引入双向特征金字塔网络(bidirectional feature pyramid network,BIFPN),通过跳连特征融合提高模型的多尺度语义特征利用效率,在提高小目标物体检测效率的同时,也使交通标志的检测精度得到提高.以交通标志数据集TT100K为测试对象进行实验验证,结果表明,与SSD(single shot multibox detector)模型和YOLOv5模型相比,CABIFPN交通标志检测模型的检测准确率分别提高4.5%和1.3%,验证模型有效. 展开更多
关键词 人工智能 交通标志检测 深度学习 小目标检测 协调注意力 双向特征金字塔网络
下载PDF
融合CA-BiFPN的轻量化人体姿态估计算法 被引量:1
13
作者 皮骏 牛厚兴 高志云 《图学学报》 CSCD 北大核心 2023年第5期868-878,共11页
针对现有的基于热力图的人体姿态估计网络模型复杂度高、算力需求大、不易部署至嵌入式平台和无人机移动平台等问题,提出了一种基于YOLOv5s6-Pose-ti-lite不使用热力图的轻量化人体姿态估计网络模型。通过将主干网络替换为GhostNet网络... 针对现有的基于热力图的人体姿态估计网络模型复杂度高、算力需求大、不易部署至嵌入式平台和无人机移动平台等问题,提出了一种基于YOLOv5s6-Pose-ti-lite不使用热力图的轻量化人体姿态估计网络模型。通过将主干网络替换为GhostNet网络,旨在以更少的计算资源输出更有效的特征信息,提升网络检测速度,缓解网络冗余的问题;在主干网络中结合轻量化的坐标注意力CA模块,将图片的人体关键点位置信息聚集到通道上,增强特征提取能力;引入加权双向特征金字塔网络,提升模型的特征融合能力,平衡不同尺度的特征信息;最后将CIoU损失函数替换为Wise-Io U(WIo U),进一步提升模型对人体关键点回归的性能。结果表明,在COCO2017人体关键点数据集上,优化后的网络模型参数量降低26.2%,计算量降低30.0%,平均精确度提升1.7个百分点、平均召回率提升2.7个百分点,能够满足实时性的效果,验证了所提模型的可行性和有效性。 展开更多
关键词 人体姿态估计 轻量化 坐标注意力 加权双向特征金字塔网络 损失函数
下载PDF
结合主动光源和改进YOLOv5s模型的夜间柑橘检测方法 被引量:2
14
作者 熊俊涛 霍钊威 +4 位作者 黄启寅 陈浩然 杨振刚 黄煜华 苏颖苗 《华南农业大学学报》 CAS CSCD 北大核心 2024年第1期97-107,共11页
【目的】解决夜间环境下遮挡和较小柑橘难以准确识别的问题,实现采摘机器人全天候智能化作业。【方法】提出一种结合主动光源的夜间柑橘识别方法。首先,通过分析主动光源下颜色特征不同的夜间柑橘图像,选择最佳的光源色并进行图像采集... 【目的】解决夜间环境下遮挡和较小柑橘难以准确识别的问题,实现采摘机器人全天候智能化作业。【方法】提出一种结合主动光源的夜间柑橘识别方法。首先,通过分析主动光源下颜色特征不同的夜间柑橘图像,选择最佳的光源色并进行图像采集。然后,提出一种夜间柑橘检测模型BI-YOLOv5s,该模型采用双向特征金字塔网络(Bi-FPN)进行多尺度交叉连接和加权特征融合,提高对遮挡和较小果实的识别能力;引入Coordinate attention(CA)注意力机制模块,进一步加强对目标位置信息的提取;采用融入Transformer结构的C3TR模块,在减少计算量的同时更好地提取全局信息。【结果】本文提出的BI-YOLOv5s模型在测试集上的精准率、召回率、平均准确率分别为93.4%、92.2%和97.1%,相比YOLOv5s模型分别提升了3.2、1.5和2.3个百分点。在所采用的光源色环境下,模型对夜间柑橘识别的正确率为95.3%,相比白光环境下提高了10.4个百分点。【结论】本文提出的方法对夜间环境下遮挡和小目标柑橘的识别具有较高的准确性,可为夜间果蔬智能化采摘的视觉精准识别提供技术支持。 展开更多
关键词 柑橘 夜间检测 主动光源 双向特征金字塔网络 YOLOv5s HSV颜色空间
下载PDF
基于改进YOLOv5s的轻量级绝缘子缺失检测 被引量:3
15
作者 池小波 张伟杰 +1 位作者 贾新春 续泽晋 《测试技术学报》 2024年第1期19-26,共8页
针对现有绝缘子缺失检测模型计算复杂度高和小目标难以检测等问题,提出一种基于改进的YOLOv5s轻量级检测模型。首先,移除主干网络中的C3模块来减少模型的参数量。其次,在多尺度特征融合网络中引入卷积块注意力机制来提高复杂背景下模型... 针对现有绝缘子缺失检测模型计算复杂度高和小目标难以检测等问题,提出一种基于改进的YOLOv5s轻量级检测模型。首先,移除主干网络中的C3模块来减少模型的参数量。其次,在多尺度特征融合网络中引入卷积块注意力机制来提高复杂背景下模型的特征提取能力。同时,采用加权双向特征金字塔网络结构对特征进行双向跨尺度加权融合,提升网络在遮挡物、相似目标干扰下目标的检测性能。最后,选用SIoU损失函数提升网络的收敛速度和检测精度。实验结果表明,所提模型的平均精准率为96.8%,浮点运算数为2.8 GFLOPS,而原始YOLOv5s在保证97.4%的平均精准率下的浮点运算数为16.3 GFLOPS。相较于原始模型,所提模型对小目标、遮挡目标以及模糊等场景有着较强的鲁棒性,且在保证近似检测精度的同时极大减少了计算量。 展开更多
关键词 绝缘子检测 YOLOv5s模型 卷积块注意力机制 加权双向特征金字塔网络 轻量化网络
下载PDF
基于YOLOv5s和超声图像的儿童肠套叠特征检测模型 被引量:1
16
作者 陈星 俞凯 +2 位作者 袁贞明 黄坚 李哲明 《杭州师范大学学报(自然科学版)》 CAS 2024年第1期10-19,共10页
为帮助医生快速寻找到儿童腹部超声中肠套叠的病变特征并实现肠套叠超声诊后数据的快速质检,文章将目标检测算法应用于儿童腹部超声图像检测肠套叠“同心圆”征.首先探索了基于YOLOv5s的儿童肠套叠检测模型,发现该模型检测肠套叠“同心... 为帮助医生快速寻找到儿童腹部超声中肠套叠的病变特征并实现肠套叠超声诊后数据的快速质检,文章将目标检测算法应用于儿童腹部超声图像检测肠套叠“同心圆”征.首先探索了基于YOLOv5s的儿童肠套叠检测模型,发现该模型检测肠套叠“同心圆”征的精确度、召回率、F 1分数、mAP@0.5、FPS以及参数量等方面均优于Faster RCNN.进一步,为解决肉眼难以观察的“同心圆”征的检测问题,使用双向特征金字塔网络,并将注意力机制加入YOLOv5s网络,形成基于YOLOv5s_BiFPN_SE框架的儿童肠套叠“同心圆”征检测模型.该模型检测的精确率、召回率、F 1分数、mAP@0.5分别达到了91.33%、90.73%、91.03%、88.77%,性能更优于YOLOv5s. 展开更多
关键词 目标检测 肠套叠 超声图像 “同心圆”征 双向特征金字塔网络 注意力机制
下载PDF
基于改进DBNet和SVTR算法的连铸板坯号检测与识别 被引量:1
17
作者 刘乐 张晓松 +1 位作者 黄锋 方一鸣 《电子测量与仪器学报》 CSCD 北大核心 2024年第2期67-75,共9页
针对钢铁连铸产线板坯号识别字符区域小、光照变化复杂、板坯号图像质量差等问题,提出了一种基于深度学习的连铸板坯号检测与识别两阶段算法。首先,基于采集的连铸产线板坯图像,制备用于板坯号检测与识别的数据集;其次,在板坯号检测阶段... 针对钢铁连铸产线板坯号识别字符区域小、光照变化复杂、板坯号图像质量差等问题,提出了一种基于深度学习的连铸板坯号检测与识别两阶段算法。首先,基于采集的连铸产线板坯图像,制备用于板坯号检测与识别的数据集;其次,在板坯号检测阶段,基于DBNet算法设计一种AD-PAN特征融合结构,以增强检测算法的多尺度特征融合能力和扩大感受野,提高板坯号定位精度;再次,在板坯号识别阶段,引入SPIN矫正网络和SVTR板坯号识别网络进行端到端训练,使其能够主动转换输入亮度,并改善字符间以及字符与背景间色彩失真的问题。最后,在自制的板坯号检测与识别数据集上进行了对比实验。实验结果表明,本研究提出的算法能够有效定位辊道上不同位置的板坯,并且在复杂背景下对板坯号进行鲁棒识别。其中,板坯号检测Hmean数值为97.92%,板坯号识别的准确率为97.33%,验证了本文所提算法具有较高的板坯号检测与识别精度。 展开更多
关键词 板坯号识别 DBNet 特征金字塔融合 端到端网络 SPIN矫正 SVTR
原文传递
基于跨模态注意力融合的煤炭异物检测方法 被引量:1
18
作者 曹现刚 李虎 +3 位作者 王鹏 吴旭东 向敬芳 丁文韬 《工矿自动化》 CSCD 北大核心 2024年第1期57-65,共9页
为解决原煤智能化洗选过程中煤流中夹杂的异物对比度低、相互遮挡导致异物图像检测时特征提取不充分的问题,提出了一种基于跨模态注意力融合的煤炭异物检测方法。通过引入Depth图像构建RGB图像与Depth图像的双特征金字塔网络(DFPN),采... 为解决原煤智能化洗选过程中煤流中夹杂的异物对比度低、相互遮挡导致异物图像检测时特征提取不充分的问题,提出了一种基于跨模态注意力融合的煤炭异物检测方法。通过引入Depth图像构建RGB图像与Depth图像的双特征金字塔网络(DFPN),采用浅层的特征提取策略提取Depth图像的低级特征,用深度边缘与深度纹理等基础特征辅助RGB图像深层特征,以有效获得2种特征的互补信息,从而丰富异物特征的空间与边缘信息,提高检测精度;构建了基于坐标注意力与改进空间注意力的跨模态注意力融合模块(CAFM),以协同优化并融合RGB特征与Depth特征,增强网络对特征图中被遮挡异物可见部分的关注度,提高被遮挡异物检测精度;使用区域卷积神经网络(R-CNN)输出煤炭异物的分类、回归与分割结果。实验结果表明:在检测精度方面,该方法的AP相较两阶段模型中较优的Mask transfiner高3.9%;在检测效率方面,该方法的单帧检测时间为110.5 ms,能够满足异物检测实时性需求。基于跨模态注意力融合的煤炭异物检测方法能够以空间特征辅助色彩、形状与纹理等特征,准确识别煤炭异物之间及煤炭异物与输送带之间的差异,从而有效提高对复杂特征异物的检测精度,减少误检、漏检现象,实现复杂特征下煤炭异物的精确检测与像素级分割。 展开更多
关键词 煤炭异物检测 实例分割 双特征金字塔网络 跨模态注意力融合 Depth图像 坐标注意力 改进空间注意力
下载PDF
基于YOLOv3的金属表面缺陷检测研究
19
作者 任伟建 陈明文 +3 位作者 康朝海 霍凤财 任璐 张永丰 《控制工程》 CSCD 北大核心 2024年第7期1219-1228,共10页
为了解决金属表面缺陷检测的漏检、误检等问题,提出了一种改进YOLOv3算法。首先,使用动态激活函数替换主干特征提取网络中所有残差块的激活函数,并加入了混合注意力机制,强化其对复杂缺陷目标的特征提取能力。然后,在特征金字塔网络部... 为了解决金属表面缺陷检测的漏检、误检等问题,提出了一种改进YOLOv3算法。首先,使用动态激活函数替换主干特征提取网络中所有残差块的激活函数,并加入了混合注意力机制,强化其对复杂缺陷目标的特征提取能力。然后,在特征金字塔网络部分新增一个104×104的特征层,并将浅层网络与深层网络进行逐层特征融合,增强算法对小缺陷目标检测的敏感性。最后,利用K-Means++聚类算法替换K-Means聚类算法,筛选出适用于金属表面缺陷检测的最优先验框尺寸,使目标定位更加准确。实验结果表明,改进YOLOv3算法的每秒检测帧数(frames per second,FPS)可达到32.3,平均精度均值(mean average precision,mAP)可达到78.69%,检测性能得到了明显提升。 展开更多
关键词 缺陷检测 特征提取网络 损失函数 特征金字塔网络 先验框尺寸
原文传递
基于改进YOLOv7模型的血细胞检测分类
20
作者 刘涛 李明 马金刚 《中国医疗设备》 2024年第9期6-13,共8页
目的探讨改进YOLOv7算法在血细胞图像不同类型细胞自动检测分类中的应用,以提高血细胞识别分类的准确度。方法将滑动窗口变换器模块引入YOLOv7,同时采用加权双向特征金字塔网络结构,使网络能够获取并传递更加丰富的特征信息,使用斯库拉... 目的探讨改进YOLOv7算法在血细胞图像不同类型细胞自动检测分类中的应用,以提高血细胞识别分类的准确度。方法将滑动窗口变换器模块引入YOLOv7,同时采用加权双向特征金字塔网络结构,使网络能够获取并传递更加丰富的特征信息,使用斯库拉交并比损失代替完全交并比损失,实现更加精准的目标框定位。结果通过不同算法在BCCD血细胞数据集上展开实验可得,改进的YOLOv7模型对红细胞、白细胞和血小板的识别准确度分别达到89.3%、98.5%和91.5%,平均准确度达93.1%,相比于原YOLOv7模型提升了2.6%。通过与已发表的血细胞人工智能检测算法进行对比可知,本文算法具有更高的准确度。结论改进的YOLOv7模型可以有效应用于血细胞识别分类任务,为血细胞的检测提供重要的参考价值。 展开更多
关键词 血细胞检测 YOLOv7 神经网络 加权双向特征金字塔网络 斯库拉交并比损失函数
下载PDF
上一页 1 2 27 下一页 到第
使用帮助 返回顶部