期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于注意力机制的多尺度手部分割方法
1
作者 周雯晴 代素敏 +1 位作者 王阳萍 王文润 《液晶与显示》 CAS CSCD 北大核心 2024年第11期1506-1518,共13页
针对手部边缘细节信息分割不精确及小面积手部的错检、漏检问题,提出一种基于注意力机制的多尺度手部分割方法。首先,对Transformer模块重新进行设计优化,提出窗口自注意力结构和双分支前馈神经网络(Dual-branch FeedForward Networks,D... 针对手部边缘细节信息分割不精确及小面积手部的错检、漏检问题,提出一种基于注意力机制的多尺度手部分割方法。首先,对Transformer模块重新进行设计优化,提出窗口自注意力结构和双分支前馈神经网络(Dual-branch FeedForward Networks,D-FFN)机制,通过窗口自注意力机制整合全局和局部的依赖信息,D-FFN抑制背景信息的干扰;然后,提出一种结合条形池化和级联网络的多尺度特征提取模块增大感受野,提高手部分割模型的准确性和鲁棒性;最后,提出基于Triplet Attention机制的上采样解码器模块,通过调节通道维度与空间维度的注意力权重将目标特征和背景的冗余特征区分开。将所提算法在公开数据集GTEA(Georgia Tech Egocentric Activity)和EYTH(EgoYouTubeHands)上测试,实验结果表明,该算法在两个数据集上的平均交并比(MIoU)值分别达到了95.8%和90.2%,相较于TransUnet算法分别提升了2.5%和2.1%,满足手部图像分割的稳定可靠、精度高、抗干扰能力强等要求。 展开更多
关键词 手部分割 深度学习 TransUnet 前馈神经网络 空洞空间金字塔池化模块 Triplet Attention
下载PDF
改进Mask R-CNN的无人机影像建筑物提取
2
作者 方超 廖运茂 +2 位作者 刘飞 王坚 赵小平 《北京测绘》 2024年第1期97-101,共5页
从无人机影像中自动提取建筑物对城乡规划和管理至关重要,然而,在复杂背景干扰和建筑物外观变化很大的情况下给实例提取带来挑战。因此,提出一种改进的Mask区域卷积神经网络(R-CNN)方法用于无人机影像的建筑物自动实例提取。改进方法以R... 从无人机影像中自动提取建筑物对城乡规划和管理至关重要,然而,在复杂背景干扰和建筑物外观变化很大的情况下给实例提取带来挑战。因此,提出一种改进的Mask区域卷积神经网络(R-CNN)方法用于无人机影像的建筑物自动实例提取。改进方法以ResNet-101作为特征提取网络,在特征融合网络方面,通过添加自底向上的路径增强整个特征层次的定位能力,同时在特征融合中加入空洞空间金字塔池化模块(ASPP)来提高多尺度能力与改善模型性能。在自制建筑物数据集上的综合实验结果表明,与原始的Mask R-CNN方法相比,改进方法的mAP值提高了2.6%,能够很好地实现无人机影像建筑物实例提取。 展开更多
关键词 建筑物提取 Mask R-CNN 路径融合 空洞空间金字塔池化模块
下载PDF
融合轻量化ASPP和U-Net的遥感影像烤烟种植区域提取
3
作者 郝戍峰 高宇 +5 位作者 刘萍 李宇昂 张华栋 任鸿杰 田帅杰 寇文韬 《航天返回与遥感》 CSCD 北大核心 2024年第4期139-149,共11页
针对目前遥感影像中烤烟边缘识别效率低且识别精度低等问题,文章提出一种融合轻量化ASPP和U-Net框架的遥感影像烤烟种植区域提取模型。首先,该模型在U-Net编码层和解码层连接处加入轻量化空洞空间金字塔池化模块;其次,该模型将线性整流... 针对目前遥感影像中烤烟边缘识别效率低且识别精度低等问题,文章提出一种融合轻量化ASPP和U-Net框架的遥感影像烤烟种植区域提取模型。首先,该模型在U-Net编码层和解码层连接处加入轻量化空洞空间金字塔池化模块;其次,该模型将线性整流函数(Rectified Linear Unit,ReLU)替换为ReLU6激活函数,能够在低精度计算时压缩动态范围,从而使算法更具鲁棒性;最后,该模型通过采用形态学孔洞填充构建标签图后处理算法,实现分割结果优化。为验证该模型框架的有效性和适用性,文章采用无人机遥感影像作为实验数据集,构建与传统语义分割模型的对比实验以及消融实验等。实验结果表明,通过与FCN、U-Net、SegNet和DeepLabV3+等传统语义分割算法相比较,文章提出的模型获得了较好的分割效果,其像素准确率和平均交并比分别为93.7%和84.1%。此外,该模型在保证模型精度的情况下,还能够提高模型的计算速度。 展开更多
关键词 烤烟种植区域提取 轻量化空洞空间金字塔池化模块 U型网络 后处理
下载PDF
基于改进YOLO算法的多目标铁谱磨粒智能识别 被引量:7
4
作者 张子杨 魏海军 +1 位作者 刘竑 贾风光 《润滑与密封》 CAS CSCD 北大核心 2021年第5期27-33,共7页
为提高铁谱磨粒中相似磨粒的识别率,降低小颗粒磨粒的漏检率,并确保检测速度的实时性,基于YOLO算法,提出了大尺度yolo层检测(yolov3mod)和全尺度yolo层检测(yolov35l)两种改进模型。该改进模型通过添加空间金字塔池化模块、拓展yolo层尺... 为提高铁谱磨粒中相似磨粒的识别率,降低小颗粒磨粒的漏检率,并确保检测速度的实时性,基于YOLO算法,提出了大尺度yolo层检测(yolov3mod)和全尺度yolo层检测(yolov35l)两种改进模型。该改进模型通过添加空间金字塔池化模块、拓展yolo层尺度,来改善网络结构,提高了相似磨粒的识别率,降低了小颗粒磨粒的漏检率;通过融合卷积层与批量归一化(BN)层,减少了模型计算量,提高了模型检测速度。实验结果表明:与原始模型相比,yolov3mod模型对相似磨粒的识别率提高了8%,总平均准确率提高了5%,yolov35l模型对相似磨粒的识别率提高了14%,总平均准确率提高了10%;2种改进模型的推理速度相比原始模型提高了8%,且磨粒的定位更加精确,基本实现了复杂背景下多目标磨粒的识别;yolov3mod拥有较快的检测速度,yolov35l则有着更高的检测精度,可根据实际工况需求进行取舍。 展开更多
关键词 铁谱磨粒 空间金字塔池化模块 卷积层 批量归一化层
下载PDF
增强语义分割的网络模型PS-UNet 被引量:1
5
作者 范憧憧 齐苏敏 +2 位作者 孟静 李志琦 王妍 《曲阜师范大学学报(自然科学版)》 CAS 2023年第1期56-63,共8页
文章提出了一种提升上下文依赖关系的增强语义分割网络模型PS-UNet实现医学图像分割.PS-UNet将残差块、PCA模块和SPP模块融合到U-Net网络模型中,可获取更多的特征信息,从而提升分割效果.该模型既可以对器官轮廓粗分割又可以对视网膜血... 文章提出了一种提升上下文依赖关系的增强语义分割网络模型PS-UNet实现医学图像分割.PS-UNet将残差块、PCA模块和SPP模块融合到U-Net网络模型中,可获取更多的特征信息,从而提升分割效果.该模型既可以对器官轮廓粗分割又可以对视网膜血管和细胞精细分割.在公开的数据集上分别对肺部、视网膜血管和细胞分割进行了测试.实验结果表明,与当前先进网络模型相比,PS-UNet在所有实验中,性能均有所提升,其中肺部分割中准确率和灵敏度相对于U-Net网络模型分别提高了2.03%和2.24%,Dice相似系数达到了97.16%. 展开更多
关键词 医学图像分割 U-Net 位置通道注意力模块 空间金字塔池化模块 增强语义分割
下载PDF
基于改进DeeplabV3+模型的云检测 被引量:2
6
作者 钟旭辉 谭海 +2 位作者 梁雪莹 潘明 石一剑 《遥感信息》 CSCD 北大核心 2023年第3期106-113,共8页
国产卫星影像数量的快速增长对国产影像的质量控制的精度和效率提出更高的要求,而云检测是遥感影像质量检测的首要问题。针对现有云检测的深度学习模型存在误判、漏判和训练需要花费大量时间的问题,研制一套云检测算法具有重要意义。文... 国产卫星影像数量的快速增长对国产影像的质量控制的精度和效率提出更高的要求,而云检测是遥感影像质量检测的首要问题。针对现有云检测的深度学习模型存在误判、漏判和训练需要花费大量时间的问题,研制一套云检测算法具有重要意义。文章提出了一种基于改进DeeplabV3+模型的云检测方法,通过对Xception网络和空间金字塔池化模块(atrous spatial pyramid pooling,ASPP)进行改进,并加入迁移学习,进而提高模型的精度和效率。分析结果表明,该改进的云检测模型与传统的DeeplabV3+模型相比,准确率提高了3.34%,精确率提高了3.78%,召回率提高了4.47%,平均交并比提高了5.39%,且训练时长和预测时长也有明显的减少。 展开更多
关键词 云检测 DeeplabV3+ Xception网络 空间金字塔池化模块 迁移学习
下载PDF
基于沙漏结构的实时语义分割算法
7
作者 张政 禹素萍 +1 位作者 许武军 范红 《现代计算机》 2022年第9期22-28,共7页
针对实时语义分割网络存在的误分割和目标分割不完整现象,构建了基于沙漏结构的实时语义分割算法(DSGNet)。首先,利用带有空洞卷积的沙漏结构构造骨干网络;其次,使用深度可分离卷积改进空洞空间金字塔模块,并将各分支输出的特征图进行... 针对实时语义分割网络存在的误分割和目标分割不完整现象,构建了基于沙漏结构的实时语义分割算法(DSGNet)。首先,利用带有空洞卷积的沙漏结构构造骨干网络;其次,使用深度可分离卷积改进空洞空间金字塔模块,并将各分支输出的特征图进行有效堆叠,优化分割效果;最后,设计特征融合模块,高效融合不同维度特征。算法在CamVid数据集进行验证,平均交并比为57.33%,FPS达到了147.3。 展开更多
关键词 沙漏结构 注意力模型 特征融合模块 空洞空间金字塔池化模块
下载PDF
基于ASPP的高分辨率卷积神经网络2D人体姿态估计研究 被引量:2
8
作者 申小凤 王春佳 《现代计算机》 2020年第13期61-65,共5页
人体姿态估计是计算机视觉研究中的基础任务,可应用在活动识别、智能监控、人机交互等领域,研究人体姿态具有重要意义。近年来,随着深度学习技术的快速发展,人体姿态估计效果不断提升,已经开始广泛应用于计算机视觉的各个领域。提出基... 人体姿态估计是计算机视觉研究中的基础任务,可应用在活动识别、智能监控、人机交互等领域,研究人体姿态具有重要意义。近年来,随着深度学习技术的快速发展,人体姿态估计效果不断提升,已经开始广泛应用于计算机视觉的各个领域。提出基于空洞空间金字塔池化模块的高分辨率人体姿态估计(ASPP-HRNet),进行多尺度特征的提取和信息的融合,提升2D人体姿态估计精确度。 展开更多
关键词 人体姿态估计 空洞空间金字塔池化模块 信息融合
下载PDF
基于深度卷积神经网络的地震相识别
9
作者 韩红 硕良勋 +1 位作者 柴变芳 朱乾菲 《新一代信息技术》 2021年第14期8-13,共6页
近年来,随着深度学习技术的快速发展,尤其在计算机视觉等领域取得了重大进展。地震相解释为分析地质环境和预测油气藏提供了重要基础。大多现有方法对地震数据解释效率低,严重依赖地震资料解释人员通过检查地震反射、相位、频率、连续... 近年来,随着深度学习技术的快速发展,尤其在计算机视觉等领域取得了重大进展。地震相解释为分析地质环境和预测油气藏提供了重要基础。大多现有方法对地震数据解释效率低,严重依赖地震资料解释人员通过检查地震反射、相位、频率、连续性和方向的空间变化来识别地震相的人工操作。本论文采用深度学习中先进算法来实现地震相的自动解释,大幅度减轻解释人员对地震数据的解释经验和专业知识。通过改进VGG16网络模型,在全连接层前端添加混合空洞卷积和空洞空间金字塔池化模块,获取地震剖面的全局信息。 展开更多
关键词 深度学习 地震相 VGG16 混合空洞卷积 空洞空间金字塔池化模块
下载PDF
基于改进DeblurGAN-v2的运动模糊农作物害虫图像复原方法
10
作者 赵辉 黄镖 +1 位作者 王红君 岳有军 《光电子.激光》 北大核心 2025年第1期46-52,共7页
为对巡检机器人在巡检过程中产生的运动模糊图像进行高效精准识别,提出了一种基于改进DeblurGAN-v2的运动模糊农作物害虫图像复原方法。为有效提取图像重要特征,该方法将通道注意力(channel attention,CA)机制集成到DeblurGAN-v2主干网... 为对巡检机器人在巡检过程中产生的运动模糊图像进行高效精准识别,提出了一种基于改进DeblurGAN-v2的运动模糊农作物害虫图像复原方法。为有效提取图像重要特征,该方法将通道注意力(channel attention,CA)机制集成到DeblurGAN-v2主干网格中,使模型更加关注细节特征,提高对运动模糊图像的复原能力;此外,在原模型特征提取网络顶层引入空间金字塔池化(spatial pryamid pooling,SPP)缓解图像多尺度变化造成对图像复原的负面影响,提高模型对图像复原的性能。基于实际农田环境建立的数据集所做的实验结果表明,改进后算法的PSNR、SSIM指标分别为26.2818 dB、0.9473,较原模型提升了8、7.2个百分点。与其他主流模型的对比实验结果表明,本文方法对模糊图像的实际复原效果更优,对解决运动模糊农作物害虫的图像复原问题具有实际应用价值。 展开更多
关键词 运动模糊 深度学习 图像复原 DeblurGAN-v2 通道注意力(CA)机制 空间金字塔池化(SPP)模块
原文传递
基于改进DeepLabv3+网络的图像语义分割方法 被引量:23
11
作者 徐聪 王丽 《激光与光电子学进展》 CSCD 北大核心 2021年第16期217-224,共8页
针对DeepLab网络不能充分利用多尺度特征信息,忽略了高分辨率浅层特征以及直接上采样倍数过大导致的重要像素信息丢失问题,提出了一种基于改进DeepLabv3+网络的图像语义分割方法。首先,充分利用了网络产生的多尺度特征信息,并采用特征... 针对DeepLab网络不能充分利用多尺度特征信息,忽略了高分辨率浅层特征以及直接上采样倍数过大导致的重要像素信息丢失问题,提出了一种基于改进DeepLabv3+网络的图像语义分割方法。首先,充分利用了网络产生的多尺度特征信息,并采用特征金字塔网络有效融合了高分辨率的浅层特征;然后,使用逐层上采样增强图像中像素信息的连续性;最后,将空洞空间金字塔池化模块中的标准卷积替换为深度可分离卷积,提高了网络模型的训练效率。在语义分割标准数据集PASCAL VOC2012验证集上的实验结果表明,本方法的平均交并比可达到79.97%。相比DeepLab网络,可预测出更精细的语义分割结果。 展开更多
关键词 图像处理 改进的DeepLabv3+网络 特征金字塔网络 空洞空间金字塔池化模块
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部