期刊文献+
共找到82篇文章
< 1 2 5 >
每页显示 20 50 100
基于Res2Net-RetinaNet的活性污泥指示性微生物目标检测
1
作者 赵立杰 鲁茜 +1 位作者 黄明忠 王国刚 《化工自动化及仪表》 CAS 2024年第5期785-795,共11页
活性污泥中原生动物、后生动物等指示性微生物是污水处理运行调控的重要指标。针对活性污泥微生物不同种类之间,小目标类微生物体型较小、微生物个体颜色背景和图像颜色背景相似的现象,提出基于Res2Net-RetinaNet的活性污泥指示性微生... 活性污泥中原生动物、后生动物等指示性微生物是污水处理运行调控的重要指标。针对活性污泥微生物不同种类之间,小目标类微生物体型较小、微生物个体颜色背景和图像颜色背景相似的现象,提出基于Res2Net-RetinaNet的活性污泥指示性微生物检测方法。Res2Net-RetinaNet模型采用精度更高的新维度残差块Res2Net模块捕获原有特征的丰富信息。在主干网络输出的第1层引入通道和空间注意力机制CBAM,进一步帮助浅层特征信息在网络中流动。最后,在特征融合模块中引入深度超参数化卷积(Do-Conv),在不增加计算量的前提下持续加快模型的收敛。将所提方法应用于某污水厂采集数据中进行实验,结果表明:所提方法与Fast R-CNN、SSD、YOLOv3、YOLOv4、FCOS、CenterNet及RetinaNet等目标检测模型相比,检测精度最高(92.8%),相对于原始RetinaNet目标检测算法精度提升4.97%。 展开更多
关键词 res2net-RetinaNet 污水处理 微生物 目标检测 res2net模块 CBAM注意力机制 深度超参数化卷积
下载PDF
基于Res2Net的人脸表情识别方法
2
作者 唐宏伟 丁祥 +3 位作者 邓嘉鑫 高方坤 罗佳强 王军权 《邵阳学院学报(自然科学版)》 2024年第2期28-35,共8页
为解决自然条件下人脸表情识别易受角度、光线、遮挡物的影响以及人脸表情数据集各类表情数量不均衡等问题,提出基于Res2Net的人脸表情识别方法。使用Res2Net50作为特征提取的主干网络,在预处理阶段对图像随机翻转、缩放、裁剪进行数据... 为解决自然条件下人脸表情识别易受角度、光线、遮挡物的影响以及人脸表情数据集各类表情数量不均衡等问题,提出基于Res2Net的人脸表情识别方法。使用Res2Net50作为特征提取的主干网络,在预处理阶段对图像随机翻转、缩放、裁剪进行数据增强,提升模型的泛化性。引入广义平均池化(generalized mean pooling, GeM)方式,关注图像中比较显著的区域,增强模型的鲁棒性;选用Focal Loss损失函数,针对表情类别不平衡和错误分类问题,提高较难识别表情的识别率。该方法在FER2013数据集上准确率达到了70.41%,相较于原Res2Net50网络提高了1.53%。结果表明,在自然条件下对人脸表情识别具有更好的准确性。 展开更多
关键词 表情识别 Focal Loss函数 广义平均池化模块 res2net50
下载PDF
基于Ghost-SE-Res2Net的多模型融合语音唤醒词检测方法 被引量:1
3
作者 虞秋辰 周若华 袁庆升 《计算机工程》 CAS CSCD 北大核心 2024年第3期52-59,共8页
语音唤醒词检测(WWD)是语音交互中的关键技术,选择合适大小的检测窗对WWD性能的影响很大。提出一种新的多模型融合方法,通过融合小检测窗和大检测窗的检测结果来提高WWD性能。多模型融合方法包含两个分类模型,分别使用小检测窗和大检测... 语音唤醒词检测(WWD)是语音交互中的关键技术,选择合适大小的检测窗对WWD性能的影响很大。提出一种新的多模型融合方法,通过融合小检测窗和大检测窗的检测结果来提高WWD性能。多模型融合方法包含两个分类模型,分别使用小检测窗和大检测窗,均基于轻量化的挤压与激励残差网络(SE-Res2Net)模块,即GhostSE-Res2Net,SE-Res2Net结构的多尺度机制可显著提升WWD的能力。在Ghost-SE-Res2Net中,首先使用Ghost卷积替换SE-Res2Net中的普通卷积以降低模型参数量,然后使用注意力池化层替换SE-Res2Net中的全局平均池化层进一步提升WWD能力。在实际检测时融合连续3个小检测窗模型的检测结果的最大值和1个大检测窗模型的检测结果,来判断唤醒词是否被触发。在训练时引入困难样本挖掘算法,选择性地学习较难检测的唤醒词信息以提高分类模型的检测性能。在包含2个唤醒词的Mobvoi数据集上评估系统性能,实验结果表明,在每小时0.5次错误唤醒的情况下,该系统在2个唤醒词上的错误拒绝率分别为0.46%和0.43%,实现了与先进基线相似的性能,并且系统参数量比基线少31%。 展开更多
关键词 唤醒词检测 Ghost模块 res2net结构 错误拒绝 多模型融合
下载PDF
Infrared and Visible Image Fusion Based on Res2Net-Transformer Automatic Encoding and Decoding 被引量:1
4
作者 Chunming Wu Wukai Liu Xin Ma 《Computers, Materials & Continua》 SCIE EI 2024年第4期1441-1461,共21页
A novel image fusion network framework with an autonomous encoder and decoder is suggested to increase thevisual impression of fused images by improving the quality of infrared and visible light picture fusion. The ne... A novel image fusion network framework with an autonomous encoder and decoder is suggested to increase thevisual impression of fused images by improving the quality of infrared and visible light picture fusion. The networkcomprises an encoder module, fusion layer, decoder module, and edge improvementmodule. The encoder moduleutilizes an enhanced Inception module for shallow feature extraction, then combines Res2Net and Transformerto achieve deep-level co-extraction of local and global features from the original picture. An edge enhancementmodule (EEM) is created to extract significant edge features. A modal maximum difference fusion strategy isintroduced to enhance the adaptive representation of information in various regions of the source image, therebyenhancing the contrast of the fused image. The encoder and the EEM module extract features, which are thencombined in the fusion layer to create a fused picture using the decoder. Three datasets were chosen to test thealgorithmproposed in this paper. The results of the experiments demonstrate that the network effectively preservesbackground and detail information in both infrared and visible images, yielding superior outcomes in subjectiveand objective evaluations. 展开更多
关键词 Image fusion res2net-Transformer infrared image visible image
下载PDF
基于Res2Net和递归门控卷积的细粒度图像分类
5
作者 王莹莹 郝潇 《计算机与现代化》 2024年第10期74-79,共6页
提取图像中具有判别性的区域在细粒度图像分类中起着至关重要的作用。现有的细粒度图像分类方法忽视图像多尺度信息以及相邻空间位置信息交互作用,难以准确提取细微特征,并且传统的CNN方法捕捉长距离语义信息不足,提取图像全局信息能力... 提取图像中具有判别性的区域在细粒度图像分类中起着至关重要的作用。现有的细粒度图像分类方法忽视图像多尺度信息以及相邻空间位置信息交互作用,难以准确提取细微特征,并且传统的CNN方法捕捉长距离语义信息不足,提取图像全局信息能力欠缺。针对这些问题设计一种基于Res2Net和递归门控卷积模块的细粒度分类算法。该网络中,使用弱监督数据增强网络(WS-DAN)进行数据扩展防止过拟合,将Res2Net作为特征提取网络,用以提取不同尺度的图像信息,增加网络层的感受野,同时在该网络中引入递归门控卷积模块,用来进一步融合信息并且实现高阶特征交互,提高网络建模能力。该方法分别在CUB-200-2011、Stanford Dogs和FGVC-Aircraft这3个公开数据集上达到了90.36%、93.1%和94.3%的准确率,能够有效地提取图像细微特征并实现分类。 展开更多
关键词 深度学习 细粒度分类 res2net 递归门控卷积
下载PDF
基于Res2net和金字塔池化的图像去雾算法 被引量:2
6
作者 王贺 韩磊 《测试技术学报》 2023年第5期455-460,共6页
在计算机视觉的高级任务中,对图像的清晰度有很高的要求,目前基于深度学习的图像去雾算法仍存在一些问题,如细节丢失、色彩失真、去雾不完全等。为解决这些问题,设计了一种基于Res2net和金字塔池化的端到端图像去雾算法。该网络中,通过... 在计算机视觉的高级任务中,对图像的清晰度有很高的要求,目前基于深度学习的图像去雾算法仍存在一些问题,如细节丢失、色彩失真、去雾不完全等。为解决这些问题,设计了一种基于Res2net和金字塔池化的端到端图像去雾算法。该网络中,通过使用Res2net模块提取上下文特征,并利用金字塔池化模块融合不同尺度的特征信息。为了得到更好的网络模型,采用RESIDE数据集对提出的模型分别进行训练和测试。结果表明:该模型在主客观评价中都取得了不错的效果,极大地改善了去雾后图片色彩失真和去雾不够彻底的问题。 展开更多
关键词 深度学习 图像去雾 res2net 金字塔池化
下载PDF
FIR-YOLACT:Fusion of ICIoU and Res2Net for YOLACT on Real-Time Vehicle Instance Segmentation 被引量:1
7
作者 Wen Dong Ziyan Liu +1 位作者 Mo Yang Ying Wu 《Computers, Materials & Continua》 SCIE EI 2023年第12期3551-3572,共22页
Autonomous driving technology has made a lot of outstanding achievements with deep learning,and the vehicle detection and classification algorithm has become one of the critical technologies of autonomous driving syst... Autonomous driving technology has made a lot of outstanding achievements with deep learning,and the vehicle detection and classification algorithm has become one of the critical technologies of autonomous driving systems.The vehicle instance segmentation can perform instance-level semantic parsing of vehicle information,which is more accurate and reliable than object detection.However,the existing instance segmentation algorithms still have the problems of poor mask prediction accuracy and low detection speed.Therefore,this paper proposes an advanced real-time instance segmentation model named FIR-YOLACT,which fuses the ICIoU(Improved Complete Intersection over Union)and Res2Net for the YOLACT algorithm.Specifically,the ICIoU function can effectively solve the degradation problem of the original CIoU loss function,and improve the training convergence speed and detection accuracy.The Res2Net module fused with the ECA(Efficient Channel Attention)Net is added to the model’s backbone network,which improves the multi-scale detection capability and mask prediction accuracy.Furthermore,the Cluster NMS(Non-Maximum Suppression)algorithm is introduced in the model’s bounding box regression to enhance the performance of detecting similarly occluded objects.The experimental results demonstrate the superiority of FIR-YOLACT to the based methods and the effectiveness of all components.The processing speed reaches 28 FPS,which meets the demands of real-time vehicle instance segmentation. 展开更多
关键词 Instance segmentation real-time vehicle detection YOLACT res2net ICIoU
下载PDF
基于Res2Net-IDCN-SCF算法的多模态医学图像融合
8
作者 程颖 方贤进 《湖北民族大学学报(自然科学版)》 CAS 2023年第4期499-505,共7页
利用多尺度特征策略进行特征提取的有效性不足是多模态医学图像融合领域存在的问题。为了增加融合结果的多尺结构信息,提出了一种基于残差多尺度网络(residual multi-scale network,Res2Net)、交错稠密网络和空间通道融合算法的多模态... 利用多尺度特征策略进行特征提取的有效性不足是多模态医学图像融合领域存在的问题。为了增加融合结果的多尺结构信息,提出了一种基于残差多尺度网络(residual multi-scale network,Res2Net)、交错稠密网络和空间通道融合算法的多模态医学图像融合算法。Res2Net的编码器在提取多尺度特征时能保留更多语义信息;交错稠密网络减少了解码器和编码器之间的语义差异,丰富了融合图像的结构和细节信息;掩码鉴别器约束了脑瘤病灶区域,进一步提高了融合图像的质量;特征图通过空间通道融合算法融合减少了多模态图像之间的信息冗余。该算法在信息熵(entropy of information,EN)、互信息(mutual information,MI)、结构相似性(structure similarity index measure,SSIM)、多尺度结构相似性(multi scale structural similarity index measure,MI_SSIM)指标上拥有较高水平的性能表现,EN提高了6%,MI提高了3%。结果显示,所提出的算法在视觉感知和指标评估上达到了较高的融合质量。 展开更多
关键词 多模态医学图像融合 res2net 交错稠密网络 空间融合 通道融合
下载PDF
Res2Net融合注意力机制的YOLOv4目标检测算法 被引量:2
9
作者 张翔 刘振凯 +1 位作者 叶娜 赵妍祯 《计算机测量与控制》 2022年第9期213-220,227,共9页
针对传统目标检测算法容易出现漏检、误检或者有遮挡物时检测困难等问题,提出一种Res2Net融合注意力机制的YOLOv4(Res2Net fusion with attention learning YOLOv4,RFAL YOLOv4)目标检测模型;首先为了获取更多特征图语义信息,通过在一... 针对传统目标检测算法容易出现漏检、误检或者有遮挡物时检测困难等问题,提出一种Res2Net融合注意力机制的YOLOv4(Res2Net fusion with attention learning YOLOv4,RFAL YOLOv4)目标检测模型;首先为了获取更多特征图语义信息,通过在一个残差块内构造层次化的类残差连接,引入Res2Net替换原YOLOv4主干网络中的ResNet残差网络结构,可以获取到更细小的特征,同时也增加了模型感受野;其次将Res2Net与注意力机制相融合,获取关键特征信息,减轻因优化主干网络带来计算量增加的负担;最后通过改进CIOU损失,降低预测框与真实框之间的误差值,有效的解决因目标过小或者有遮挡时模型出现漏检误检等问题;在公开的PASCAL VOC数据集上进行验证,结果表明:RFAL YOLOv4模型的mAP达到了79.5%,比原模型提升了5.5%,改进后的模型具有较高的鲁棒性。 展开更多
关键词 目标检测 YOLOv4 res2net 注意力机制 CIOU
下载PDF
一种利用SE-Res2Net的合成语音检测系统 被引量:3
10
作者 梁超 高勇 《无线电工程》 北大核心 2022年第9期1560-1565,共6页
传统的说话人识别(Automatic Speaker Verfication, ASV)系统难以分辨合成语音,构建一个说话人保护系统刻不容缓。针对合成语音侵扰说话人识别系统问题,从特征层面提出了一种基于经验模式分解(Empirical Mode Decomposition, EMD)的梅... 传统的说话人识别(Automatic Speaker Verfication, ASV)系统难以分辨合成语音,构建一个说话人保护系统刻不容缓。针对合成语音侵扰说话人识别系统问题,从特征层面提出了一种基于经验模式分解(Empirical Mode Decomposition, EMD)的梅尔倒谱系数(Mel Frequency Cepstral Coefficients, MFCC)+逆梅尔倒谱系数(Inverse Mel Frequency Cepstral Coefficients, IMFCC)的双通道语音特征作为合成语音检测的前端特征,在后端分类器上串联Res2Net网络和SENet网络组合成SE-Res2Net网络来提升模型的泛化能力。将不同特征与模型的打分结果融合,进一步提高实验性能。在ASVspoof2019数据集上的实验结果表明,该设计的合成语音检测系统能有效检测合成语音,与ASVspoof2019比赛的基线系统相比,融合模型的等错误概率(Equal Error Rate, EER)与串联成本检测函数(tandem Detection Cost Function, t-DCF)分别降低了49%和64%。 展开更多
关键词 合成语音检测 res2net 经验模式分解 SENet 等错误概率 串联成本检测函数
下载PDF
基于CBAM-Res2Net的人群计数算法 被引量:3
11
作者 陈江川 吴云韬 孔权 《武汉工程大学学报》 CAS 2022年第6期664-669,共6页
针对静态人群图像中背景干扰和尺度变化等问题,采用多尺度特征提取模块(Res2Net)以更细的粒度提取多尺度特征,提高对不同尺寸人头的计数性能;引入卷积注意力模块(CBAM),分别在通道域和空间域上提高人群区域的权重,有效改善了高密度和复... 针对静态人群图像中背景干扰和尺度变化等问题,采用多尺度特征提取模块(Res2Net)以更细的粒度提取多尺度特征,提高对不同尺寸人头的计数性能;引入卷积注意力模块(CBAM),分别在通道域和空间域上提高人群区域的权重,有效改善了高密度和复杂的人群场景下背景干扰等问题。在此基础上,将CBAM模块集成到Res2Net模块中,形成了新的多尺度特征提取模块CBAM-Res2Net。在后端网络中设计了一个扩张模块以提取更深层的特征并进行特征融合回归,从而生成高质量的密度图。并且分别在ShanghaiTech Part A、ShanghaiTech Part B和UCF_CC_50数据集上进行了算法对比实验,本文模型在上述数据集的平均绝对误差和均方根误差分别为61.4、7.3、255.6和98.5、10.8、310.2,综合性能均优于其他算法,验证了模型的准确性和鲁棒性。 展开更多
关键词 人群计数 多尺度特征提取模块 卷积注意力模块 CBAM-res2net 密度图
下载PDF
基于CA-Res2Net和可变形卷积的图像去模糊方法
12
作者 李武斌 李春国 杨绿溪 《无线电通信技术》 2022年第5期945-950,共6页
针对动态场景下的非均匀运动模糊问题,提出了一种基于细粒度多尺度注意力残差模块(CA-Res2Net)和可变形卷积(Deformable Convolution)的图像去模糊方法CADNet。CADNet以可变形卷积自编码结构为基础架构,进而可以更好地对抗模糊形变;同时... 针对动态场景下的非均匀运动模糊问题,提出了一种基于细粒度多尺度注意力残差模块(CA-Res2Net)和可变形卷积(Deformable Convolution)的图像去模糊方法CADNet。CADNet以可变形卷积自编码结构为基础架构,进而可以更好地对抗模糊形变;同时CADNet嵌入了细粒度多尺度的残差模块,可以在更细粒度的层次上表示图片的多尺度特征信息,从而可以获得更强的特征表示能力。实验结果表明,CADNet是一种高效的去模糊算法,在获得更高去模糊性能的同时,压制住了计算开销。 展开更多
关键词 图像去模糊 非均匀模糊 可变形卷积 通道注意力 res2net
下载PDF
基于SE-Res2Net网络的宫颈癌超声肿瘤特征提取技术
13
作者 张海艳 李洁 +2 位作者 张博学 刘静 唐雪蕊 《信息技术》 2022年第5期177-182,共6页
为了有效提高宫颈癌的诊断准确率,提出一种基于SE-Res2Net网络的宫颈癌超声肿瘤特征提取技术。在YOLOv3算法模型的基础上,将SE模块嵌入Res2Net网络中,创建一种能够替换原特征提取网络的SE-Res2Net网络,使模型的特征提取能力得到提升。... 为了有效提高宫颈癌的诊断准确率,提出一种基于SE-Res2Net网络的宫颈癌超声肿瘤特征提取技术。在YOLOv3算法模型的基础上,将SE模块嵌入Res2Net网络中,创建一种能够替换原特征提取网络的SE-Res2Net网络,使模型的特征提取能力得到提升。利用重新构建的下采样模块,保证了下采样操作后信息的完整性。将密集连接网络与残差连接网络相结合,组建Res-DenseNet网络以改进YOLOv3模型的原有残差连接方式。实验结果表明,该方法的性能明显优于传统YOLOv3算法,适于在临床诊断中普及应用。 展开更多
关键词 SE-res2net网络 宫颈癌超声图像 采样 特征提取 识别性能
下载PDF
融合注意力机制的Res2Net-LSTM声纹识别方法
14
作者 李坤明 《网络安全技术与应用》 2024年第5期58-61,共4页
针对现有的声纹识别技术模型具有提取特征单一、泛化能力不强等局限性,提出了一种融合注意力机制的Res2Net-LSTM声纹识别方法。通过采用Res2Net和LSTM分别提取空间特征和时序特征,增强模型收敛速度与精度,并融合注意力机制,对特征权重... 针对现有的声纹识别技术模型具有提取特征单一、泛化能力不强等局限性,提出了一种融合注意力机制的Res2Net-LSTM声纹识别方法。通过采用Res2Net和LSTM分别提取空间特征和时序特征,增强模型收敛速度与精度,并融合注意力机制,对特征权重进行调整,通过关注重点区域,提高分类性能。在公开的Voxceleb1数据集上进行验证,实验结果表明,相较于ResNetLSTM、Res2Net-LSTM准确率分别提升了10.4%,10.5%,验证了该方法具有更好的性能。 展开更多
关键词 声纹识别 注意力机制 res2net LSTM
原文传递
基于YOLOv7的木材缺陷检测模型Wood-Net的研究 被引量:2
15
作者 王正 江莺 +3 位作者 严飞 孙佑鹏 张园 张柳磊 《林业工程学报》 CSCD 北大核心 2024年第1期132-140,共9页
为改善利用人工方式识别木材缺陷存在的效率低、人工成本高的问题,同时实现在木材加工过程中使用新兴方式对不同的缺陷进行快速准确检测以提高木材利用率,针对现有的目标检测网络在木材缺陷检测方面存在诸如检测精度低、报错率高以及识... 为改善利用人工方式识别木材缺陷存在的效率低、人工成本高的问题,同时实现在木材加工过程中使用新兴方式对不同的缺陷进行快速准确检测以提高木材利用率,针对现有的目标检测网络在木材缺陷检测方面存在诸如检测精度低、报错率高以及识别种类少等局限,设计了用于木材缺陷检测的深度学习网络Wood-Net。Wood-Net将注意力机制ECA(efficient channel attention module)引入YOLOv7的主干网络,以便更好地区分木材缺陷之间的细微差别;将ECA与Res2Net结合后形成ECA-Res2Net模块,ECA-Res2Net模块克服了单纯的Res2Net跨通道交流能力不足的问题,增强了网络对更细粒度特征的提取能力;将ECA-Res2Net模块与SPPCSPC(spatial pyramid pooling and channel spatial pyramid convolution)并联形成ResSPPCSPC模块,增加了描述图像本身特征数量的能力,由此构成新方法Wood-Net。本研究将准确度、召回值、mAP@0.5以及mAP@0.5∶mAP@0.95 4个数值作为系统性能的评价指标。利用自建数据集训练Wood-Net,得到试验数据。试验结果表明:Wood-Net模型比基准模型YOLOv7在木材优选上精确率提高了4.52%,mAP@0.5∶mAP@0.95提高了6.62%;比基准模型YOLOv5s在木材优选上精确率提高了6.79%,mAP@0.5∶mAP@0.95提高了5.67%。ECA注意力机制能够有效提升E-ELAN的通道间信息交互能力;Res2Net模块具有很强的细粒度特征提取能力,在网络中引入Res2Net模块后,网络各项性能指标收敛速度快,在Res2Net中加入ECA后能够使单纯的Res2Net考虑多通道特征之间的关系,完成信息融合,提高检测性能。 展开更多
关键词 Wood-Net 木材优选 ECA-res2net ECA res2net
下载PDF
基于改进YOLOv5的行人检测方法研究
16
作者 薛继伟 薛鹏杰 胡馨元 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第7期101-109,共9页
针对行人检测中出现的目标遮挡和小尺度目标漏检等现象,提出一种基于YOLOv5改进的行人检测模型DROE-YOLO。在YOLOv5的C3模块中引入了Res2Net的残差结构以增强网络对行人目标的表征能力。采用Dynamic Head作为YOLOv5的检测头,提高检测的... 针对行人检测中出现的目标遮挡和小尺度目标漏检等现象,提出一种基于YOLOv5改进的行人检测模型DROE-YOLO。在YOLOv5的C3模块中引入了Res2Net的残差结构以增强网络对行人目标的表征能力。采用Dynamic Head作为YOLOv5的检测头,提高检测的准确性和鲁棒性。在标签分配策略方面采用了Simplified OTA方法,可以更准确地匹配真实框与预测框。最后,使用soft-NMS+EIOU的方法,进一步提高行人目标的检测准确率。在CrowdHuman数据集上的实验结果表明,DROE-YOLO在行人检测任务上取得了较好的效果。与基准模型相比,在增加少量参数的情况下,DROE-YOLO模型的检测精度提升了3.3%,召回率提升了6.5%,相比原模型更适用于实际的行人检测任务。 展开更多
关键词 行人检测 res2net Dynamic-Head Simplified-OTA Soft-NMS
下载PDF
基于改进YOLOv5模型的安全帽佩戴检测方法研究
17
作者 郑凯东 马莉娜 《智能计算机与应用》 2024年第7期140-144,共5页
建筑施工现场环境复杂,现有的安全帽检测算法很难在这种复杂环境下保持准确性和实时性。针对此问题,本文提出了一种基于改进YOLOv5s的安全帽佩戴检测模型(YOLOv5s-REG)。首先,基于Res2Net网络提出了C3_Res2Block模块,替代骨干网络中的C... 建筑施工现场环境复杂,现有的安全帽检测算法很难在这种复杂环境下保持准确性和实时性。针对此问题,本文提出了一种基于改进YOLOv5s的安全帽佩戴检测模型(YOLOv5s-REG)。首先,基于Res2Net网络提出了C3_Res2Block模块,替代骨干网络中的C3模块,捕捉更丰富的特征信息;其次,在骨干网络中引入ECA注意力机制模块,增强模型对通道特征的关注度;最后,引入GSConv模块替换颈部网络的Conv模块,减少模型的参数量。实验结果表明,改进后的模型平均精度均值达到94.2%,同时浮点运算次数减少至14.4 G,本文模型在满足检测精度需求的同时成功地降低了模型的复杂度,适用于施工现场算力有限的边缘设备。 展开更多
关键词 施工现场 安全帽 YOLOv5s res2net ECA GSConv
下载PDF
基于上下文特征提取的边缘生成三阶段图像修复算法 被引量:1
18
作者 芮志超 郭艳艳 《测试技术学报》 2024年第1期34-40,共7页
对于具有较大不规则缺失区域的图像修复问题,现有的基于深度学习的图像修复方法通常会生成具有模糊纹理和扭曲结构的内容。针对这个问题,将修复问题分解为基于上下文特征的结构预测和图像补全三阶段模型。第一阶段,通过空洞卷积编-解码... 对于具有较大不规则缺失区域的图像修复问题,现有的基于深度学习的图像修复方法通常会生成具有模糊纹理和扭曲结构的内容。针对这个问题,将修复问题分解为基于上下文特征的结构预测和图像补全三阶段模型。第一阶段,通过空洞卷积编-解码网络,利用周围图像特征来对缺失部分进行初步修复;第二阶段,将第一阶段粗修复结果进行边缘提取后,输入到一个自注意力机制编-解码网络来预测缺失区域的纹理结构;第三阶段,将前两个阶段的输出一起输入到一个改进的U-net精修复网络中,得到结构清晰、纹理细节丰富的图像。在公开数据集上将所提算法与现有经典算法进行对比,实验表明,所提方法在主观视觉和客观评价方面优于现有方法。 展开更多
关键词 深度学习 图像修复 自注意力机制 res2net 生成式对抗网络
下载PDF
国标麻将的多尺度骨干神经网络模型
19
作者 代君学 李霞丽 +1 位作者 刘博 王昭琦 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第5期137-144,共8页
在有多轮次、状态空间巨大、81种不同类别的番种、胡牌方式复杂的国标麻将中,普通的神经网络难以对复杂的数据进行表达和拟合。首次将多尺度骨干的深度神经网络用于实现麻将AI,以更好地捕获国标麻将的局部以及全局特征,适用于处理复杂数... 在有多轮次、状态空间巨大、81种不同类别的番种、胡牌方式复杂的国标麻将中,普通的神经网络难以对复杂的数据进行表达和拟合。首次将多尺度骨干的深度神经网络用于实现麻将AI,以更好地捕获国标麻将的局部以及全局特征,适用于处理复杂数据,做出更准确的游戏策略。基于IJCAI 2020 Champion的对局数据,对训练数据进行数据增强。采用增强后的数据,在NVIDAI GeForce RTX3090 LapTop GPU上进行了5天的监督学习训练,训练出的模型有52 M参数,动作准确率达到93.47%,弃牌准确率达到83.93%,鸣牌准确率达到97.56%。将提出的模型部署到北京大学开发的Botzone平台上,进入天梯榜前1%。 展开更多
关键词 深度学习 麻将 卷积神经网络 res2net50 多尺度骨干架构
下载PDF
基于多尺度差异聚合机制的遥感影像道路提取
20
作者 许明 周春晖 姜彦吉 《计算机系统应用》 2024年第9期95-104,共10页
针对高分辨率遥感图像中地物背景复杂多样,成像过程中道路区域易受树木、建筑物遮挡影响,从中提取道路时易出现局部断连和细节缺失问题,设计并实现了一种基于多尺度差异聚合机制的道路提取网络模型(MSDANet).网络模型整体采用编码-解码... 针对高分辨率遥感图像中地物背景复杂多样,成像过程中道路区域易受树木、建筑物遮挡影响,从中提取道路时易出现局部断连和细节缺失问题,设计并实现了一种基于多尺度差异聚合机制的道路提取网络模型(MSDANet).网络模型整体采用编码-解码器结构,使用Res2Net模块作为编码器骨干网络获取细粒度多尺度特征信息,增大特征提取感受野;同时结合道路形态特征提出一种门控轴向引导模块,用于突出道路特征的表达,改善道路提取长距离断裂现象;此外,设计了一种应用于编解码器之间的多尺度差异聚合模块,用以提取浅层与深层特征间的差异信息并将其聚合,并通过特征融合模块将聚合特征与解码特征融合,促进解码器准确还原道路特征;在高分辨率遥感数据集DeepGlobe和CHN6-CUG上进行模型实验评估,所提方法的F1值分别为80.37%、78.17%,IoU分别为67.18%、64.17%,均优于对比模型. 展开更多
关键词 道路提取 遥感影像 多尺度差异聚合机制 门控轴向引导 res2net
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部