期刊文献+
共找到45篇文章
< 1 2 3 >
每页显示 20 50 100
基于非局部注意力机制的在线多目标跟踪算法
1
作者 郑龙澍 林野 +1 位作者 翟鹏 张立华 《计算机应用与软件》 北大核心 2024年第2期178-187,共10页
针对多目标跟踪任务在人群拥挤场景存在目标漏检、遮挡等问题,在CenterTrack框架基础上引入非局部注意力机制以捕捉多个目标之间、目标与场景之间的非局部依赖关系,提出基于空间非局部注意力残差块的跟踪模型;并进一步扩展到时空域,建... 针对多目标跟踪任务在人群拥挤场景存在目标漏检、遮挡等问题,在CenterTrack框架基础上引入非局部注意力机制以捕捉多个目标之间、目标与场景之间的非局部依赖关系,提出基于空间非局部注意力残差块的跟踪模型;并进一步扩展到时空域,建立基于时空关系非局部注意力模块的跟踪模型,同时实现检测和跟踪任务。在MOT17、MOT16、2D MOT15三个数据集的实验结果表明,提出的两种在线跟踪模型较CenterTrack算法有明显提升,且在MOT17中MOTA(Multiple Object Tracking Accuracy)指标达到了目前较为先进的水平,为62.4%和62.5%,验证了该算法的有效性。 展开更多
关键词 多目标跟踪 计算机视觉 局部注意力机制 深度学习
下载PDF
基于稀疏编码非局部注意力对偶网络的病理图像超分辨率重建 被引量:1
2
作者 梁美彦 张宇 +3 位作者 梁建安 陈庆辉 王茹 王琳 《计算机科学》 CSCD 北大核心 2023年第S01期295-302,共8页
高分辨率的病理学图像是疾病高精度诊断的客观依据,在精准医学领域具有重要意义。然而,受硬件设备分辨率和扫描时长的限制,实时获取高分辨率病理图像存在困难。经典的图像超分辨率重建算法由于模型的参数较难估计,导致重建后图像细节模... 高分辨率的病理学图像是疾病高精度诊断的客观依据,在精准医学领域具有重要意义。然而,受硬件设备分辨率和扫描时长的限制,实时获取高分辨率病理图像存在困难。经典的图像超分辨率重建算法由于模型的参数较难估计,导致重建后图像细节模糊且不够真实,不适用于病理学图像。为此,文中提出稀疏编码非局部注意力对偶网络,通过上采样和降采样对偶分支中的稀疏编码非局部注意力机制、高斯约束以及参数共享策略来实现病理学图像的超分辨率重建。重建后的病理图像峰值信噪比和结构相似性分别达到了30.84 dB和0.914。研究结果表明,所提方法不但能够实现病理学图像中高频细节的精确重建,轻量化的稀疏编码非局部注意力机制也有效地提高了建模的效率,是病理学图像超分辨率重建的一种有效方法。 展开更多
关键词 稀疏编码 局部注意力 对偶网络 病理图像 超分辨率
下载PDF
基于混合尺度非局部注意力的纹理图像超分辨率
3
作者 姚鹏飞 魏育坤 +1 位作者 路昊 王素琴 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2023年第10期1479-1488,共10页
相较于一般图像,纹理图像细节特征尺度小、密度大,导致低分辨率下会丢失更多高频信息,影响超分辨率重建的效果.基于此,提出一种利用混合尺度非局部注意力的纹理图像超分辨率方法.首先,在跨尺度非局部注意力的基础上提出等尺度非局部注意... 相较于一般图像,纹理图像细节特征尺度小、密度大,导致低分辨率下会丢失更多高频信息,影响超分辨率重建的效果.基于此,提出一种利用混合尺度非局部注意力的纹理图像超分辨率方法.首先,在跨尺度非局部注意力的基础上提出等尺度非局部注意力,用于在整幅图像中挖掘等尺度相似特征块的高频信息,为解决2种注意力并行部署带来的计算操作与参数量较多的问题,设计参数共享的方法,将2种注意力合并为混合尺度非局部注意力(MSNLA);其次,通过通道投影的方式将MSNLA生成的不同尺度的相似特征与输入特征图融合;最后,利用非局部特征融合重建的方法将MSNLA提取到的特征组合后进行超分辨率重建.实验结果表明,在DTD数据集上,该方法相较于CSNLN算法的PSNR提高了0.16 dB,模型参数量减少了约10.3%,并且重建图像取得了更好的视觉效果. 展开更多
关键词 单图像超分辨率 纹理图像 注意力机制 局部注意力
下载PDF
基于局部注意力Seq2Seq的中医文本多标签分类研究
4
作者 刘勇 杜建强 +3 位作者 罗计根 李清 于梦波 郑奇民 《现代信息科技》 2023年第17期96-101,共6页
针对传统多标签分类模型未充分考虑文本中临近标签之间存在的复杂关联性问题,提出一种基于局部注意力Seq2Seq的中医文本多标签分类模型。首先利用ALBERT模型提取文本的动态语义向量;然后多层Bi-LSTM构成的编码层用于提取文本间的语义关... 针对传统多标签分类模型未充分考虑文本中临近标签之间存在的复杂关联性问题,提出一种基于局部注意力Seq2Seq的中医文本多标签分类模型。首先利用ALBERT模型提取文本的动态语义向量;然后多层Bi-LSTM构成的编码层用于提取文本间的语义关系;最后解码层中使用多层LSTM的局部注意力,突出文本序列中临近标签之间的相互影响力,以预测多标签序列。在中医数据集上验证方法的有效性,实验结果表明,所提出的算法能够有效捕获标签之间的相关性,适用于中医文本的分类预测。 展开更多
关键词 多标签分类 中医文本 局部注意力 ALBERT Bi-LSTM LSTM
下载PDF
融合人体姿态估计与非局部注意力机制的遮挡行人重识别
5
作者 陈岸明 林群雄 +2 位作者 孙全忠 洪小龙 温峻峰 《电子技术与软件工程》 2023年第6期169-175,共7页
本文提出一种基于姿态估计模型与非局部注意力机制的遮挡行人重识别方法,利用姿态估计器获得图像中的非遮挡局部人体,并引入非局部注意力机制解决特征的长距离依赖问题,使得网络的关注度集中在非遮挡部分,实现遮挡场景下的精确行人重识... 本文提出一种基于姿态估计模型与非局部注意力机制的遮挡行人重识别方法,利用姿态估计器获得图像中的非遮挡局部人体,并引入非局部注意力机制解决特征的长距离依赖问题,使得网络的关注度集中在非遮挡部分,实现遮挡场景下的精确行人重识别任务。通过实验验证了本文所提出方法在遮挡数据集上取得了先进的表现。 展开更多
关键词 行人重识别 姿态估计模型 局部注意力 人体图像
下载PDF
基于多样化局部注意力网络的行人重识别 被引量:5
6
作者 徐胜军 刘求缘 +3 位作者 史亚 孟月波 刘光辉 韩九强 《电子与信息学报》 EI CSCD 北大核心 2022年第1期211-220,共10页
针对现实场景中行人图像被遮挡以及行人姿态或视角变化造成的未对齐问题,该文提出一种基于多样化局部注意力网络(DLAN)的行人重识别(Re-ID)方法。首先,在骨干网络后分别设计了全局网络和多分支局部注意力网络,一方面学习全局的人体空间... 针对现实场景中行人图像被遮挡以及行人姿态或视角变化造成的未对齐问题,该文提出一种基于多样化局部注意力网络(DLAN)的行人重识别(Re-ID)方法。首先,在骨干网络后分别设计了全局网络和多分支局部注意力网络,一方面学习全局的人体空间结构特征,另一方面自适应地获取人体不同部位的显著性局部特征;然后,构造了一致性激活惩罚函数引导各局部分支学习不同身体区域的互补特征,从而获取行人的多样化特征表示;最后,将全局特征与局部特征集成到分类识别网络中,通过联合学习形成更全面的行人描述。在Market1501,DukeMTMC-reID和CUHK03行人重识别数据集上,DLAN模型的mAP值分别达到了88.4%,79.5%和74.3%,Rank-1值分别达到了95.1%,88.7%和76.3%,明显优于大多数现有方法,实验结果充分验证了所提方法的鲁棒性和判别能力。 展开更多
关键词 行人重识别 多分支局部注意力 一致性激活惩罚 多样化
下载PDF
基于局部注意力机制的中文短文本实体链接 被引量:3
7
作者 张晟旗 王元龙 +3 位作者 李茹 王笑月 王晓晖 闫智超 《计算机工程》 CAS CSCD 北大核心 2021年第11期77-83,92,共8页
实体链接是加强语义理解和连接知识信息与文本的有效方法,但目前多数模型对上下文语境的精准理解受限于文本长度,面向短文本的实体链接任务存在实体边界识别错误和实体语义理解错误的问题。针对中文短文本的实体链接任务,构建基于局部... 实体链接是加强语义理解和连接知识信息与文本的有效方法,但目前多数模型对上下文语境的精准理解受限于文本长度,面向短文本的实体链接任务存在实体边界识别错误和实体语义理解错误的问题。针对中文短文本的实体链接任务,构建基于局部注意力机制的实体链接模型。在实体消歧的过程中,通过对待消歧文本与实体的知识描述文本进行拼接,将短文本转换为长文本,同时引入局部注意力机制,缓解长距离依赖问题并强化局部的上下文信息。实验结果表明,相比于传统加入BIO标注方法的模型,该模型在CCKS2019和CCKS2020数据集上的F1值分别提升了4.41%和1.52%。 展开更多
关键词 实体链接 上下文 语义理解 中文短文本 局部注意力机制
下载PDF
基于非局部注意力生成对抗网络的视频异常事件检测方法 被引量:3
8
作者 孙奇 吉根林 张杰 《计算机科学》 CSCD 北大核心 2022年第8期172-177,共6页
针对异常事件的不确定性,文中选择使用未来帧预测的方式对视频进行异常事件检测。通过正常样本对预测模型进行训练,使模型能够准确预测不包含异常事件的未来帧,但对于包含未知事件的视频帧,模型无法进行预测,利用生成对抗网络以及表观... 针对异常事件的不确定性,文中选择使用未来帧预测的方式对视频进行异常事件检测。通过正常样本对预测模型进行训练,使模型能够准确预测不包含异常事件的未来帧,但对于包含未知事件的视频帧,模型无法进行预测,利用生成对抗网络以及表观约束和运动约束对用于预测的生成器模型进行训练。为了减少相关目标特征丢失,提出了非局部注意力U型网络生成器(Nonlocal Attention Unet Generator,NA-UnetG)模型,提升了生成器的预测精度,同时提升了视频异常事件检测的准确度。通过公开数据集CUHK Avenue和UCSD Ped2对所提方法进行实验验证,实验结果表明,所提方法的AUC指标优于其他方法,AUC分别达到了83.4%和96.3%。 展开更多
关键词 视频异常事件检测 生成对抗网络 视频预测 局部注意力机制 深度学习
下载PDF
具有选择性局部注意力和前序信息解码器的代码生成模型 被引量:3
9
作者 梁婉莹 朱佳 +4 位作者 吴志杰 颜志文 汤庸 黄晋 余伟浩 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2021年第1期45-52,共8页
提出一种基于语法的代码生成模型,该模型具有选择性局部注意力和包含前序信息的长短期记忆(LSTM)神经网络解码器,通过更改上下文向量的计算范围,并在解码过程中融合更多的前序信息,增强单词之间的相关性。在Hearthstone和Django两个数... 提出一种基于语法的代码生成模型,该模型具有选择性局部注意力和包含前序信息的长短期记忆(LSTM)神经网络解码器,通过更改上下文向量的计算范围,并在解码过程中融合更多的前序信息,增强单词之间的相关性。在Hearthstone和Django两个数据集上进行的代码生成实验证实了所提模型的有效性,与最新的模型相比,所提模型不仅表现出更出色的准确率和双语评估学习成绩,还可以使计算工作量最小化。 展开更多
关键词 代码生成 抽象语法树 包含前序信息的长短期记忆神经网络(LSTM) 选择性局部注意力
下载PDF
多尺度非局部注意力网络的小目标检测算法 被引量:17
10
作者 梁延禹 李金宝 《计算机科学与探索》 CSCD 北大核心 2020年第10期1744-1753,共10页
现有的小目标检测方法通常采用多尺度特征图或利用多尺度融合特征进行检测,这些方法主要利用了特征图的空间信息而忽略了通道间的相互依赖关系。提出一种新的小目标检测网络,该网络在浅层利用非局部通道注意力模块整合特征的全局空间信... 现有的小目标检测方法通常采用多尺度特征图或利用多尺度融合特征进行检测,这些方法主要利用了特征图的空间信息而忽略了通道间的相互依赖关系。提出一种新的小目标检测网络,该网络在浅层利用非局部通道注意力模块整合特征的全局空间信息,进而对通道间的信息进行校准。从空间域及通道域获取特征的远距离依赖关系,增强浅层特征中小目标的上下文语义信息。同时,通过密集连接结构增强深层部分的特征提取能力,获取丰富的目标信息,提高目标检测任务的准确率和实时性。实验结果表明,该算法在PASCAL VOC、MS COCO数据集中得到了较好的检测结果,并且在保证检测速度的前提下,能有效提高小目标的检测准确率。 展开更多
关键词 目标检测 卷积神经网络(CNN) 局部注意力 密集连接
下载PDF
基于非局部注意力和局部特征的车辆重识别算法
11
作者 万冬厚 张德贤 邓淼磊 《计算机与现代化》 2022年第3期23-29,共7页
车辆重识别是指从不同的摄像机来重新识别出同一辆车。车辆重识别非常容易受到车辆角度以及光照等其他因素的影响,是一项非常有挑战性的任务。许多车辆重识别方法都过分关注车辆全局特征,而忽略了车辆图像的局部有分辨力的特征,造成了... 车辆重识别是指从不同的摄像机来重新识别出同一辆车。车辆重识别非常容易受到车辆角度以及光照等其他因素的影响,是一项非常有挑战性的任务。许多车辆重识别方法都过分关注车辆全局特征,而忽略了车辆图像的局部有分辨力的特征,造成了车辆重识别精度不高的问题。针对这一问题,本文提出一种整合非局部注意力的和多尺度特征的车辆重识别方法,使用注意力机制获取车辆显著特征,并融合多尺度特征从而提高车辆重识别的检索精度。首先,使用骨干特征提取网络与注意力模块获取车辆的显著性细粒度特征。然后,将特征分为多个分支进行度量学习,分别学习车辆的局部与全局特征,将全局特征与细粒度的局部特征融合,构建车辆重识别的特征。最后,利用该方法提取不同车辆的特征,计算不同车辆的相似度,从而判断是否具有相同的身份。实验结果表明本文提出的车辆重识别算法具有更高的精度。 展开更多
关键词 局部注意力 局部特征 车辆重识别 神经网络
下载PDF
基于局部注意力机制的弱监督长文档分类 被引量:1
12
作者 马雯琦 何跃 《计算机系统应用》 2021年第11期54-62,共9页
自然语言处理中的文档分类任务需要模型从低层级词向量中抽取高层级特征.通常,深度神经网络的特征抽取会利用文档中所有词语,这种做法不能很好适应内容较长的文档.此外,训练深度神经网络需要大量标记数据,在弱监督情况下往往不能取得良... 自然语言处理中的文档分类任务需要模型从低层级词向量中抽取高层级特征.通常,深度神经网络的特征抽取会利用文档中所有词语,这种做法不能很好适应内容较长的文档.此外,训练深度神经网络需要大量标记数据,在弱监督情况下往往不能取得良好效果.为迎接这些挑战,本研究提出应对弱监督长文档分类的方法.一方面,利用少量种子信息生成伪文档以增强训练数据,应对缺乏标记数据造成的精度难以提升的局面.另一方面,使用循环局部注意力学习,仅基于若干文档片段抽取出摘要特征,就足以支撑后续类别预测,提高模型的速度和精度.实验表明,本研究提出的伪文档生成模型确实能够增强训练数据,对预测精度的提升在弱监督情况下尤为显著;同时,基于局部注意力机制的长文档分类模型在预测精度上显著高于基准模型,处理速度也表现优异,具有实际应用价值. 展开更多
关键词 文档分类 深度学习 弱监督学习 伪文档 局部注意力机制
下载PDF
FCLA:特征融合和局部注意力机制的文本摘要模型
13
作者 冯延君 《信息系统工程》 2021年第4期38-40,共3页
序列到序列模型是文本摘要研究领域应用最广泛的方法。但在此方法中,文本语言特征没有得到充分利用,摘要句存在词语丢失和词语重复问题,影响文本摘要的准确性和可读性。为此,论文提出基于特征融合和局部注意力相结合的摘要生成方法FCLA(... 序列到序列模型是文本摘要研究领域应用最广泛的方法。但在此方法中,文本语言特征没有得到充分利用,摘要句存在词语丢失和词语重复问题,影响文本摘要的准确性和可读性。为此,论文提出基于特征融合和局部注意力相结合的摘要生成方法FCLA(Feature Combination and Local Attention)模型。利用评论文本的语言特征,提取多个文本特征加以改善输入的特征,建立领域专有词典,利用斯坦福glove词向量作为词嵌入,改进序列到序列模型,在输入层及隐藏层注入位置权重的局部注意力机制,改善生成摘要句效果。论文采用公开的亚马逊商品评论数据集进行实验,结果表明所提出的模型能够有效地提高生成摘要的准确率,可应用于文本摘要任务。 展开更多
关键词 特征融合 序列到序列模型 局部注意力机制 glove词嵌入 评论文本
下载PDF
基于非局部和门控轴向注意力的行人重识别
14
作者 陈禹 刘慧 +1 位作者 梁东升 张雷 《微处理机》 2024年第2期41-46,共6页
为进一步改善行人重识别技术在实际应用中的表现,通过引入自注意力机制,提出一种结合非局部模块和门控轴向注意力模块的行人重识别方法。该方法将自注意力模块插入到重识别网络卷积层中,通过非局部模块同时捕捉全局和局部上下文信息,并... 为进一步改善行人重识别技术在实际应用中的表现,通过引入自注意力机制,提出一种结合非局部模块和门控轴向注意力模块的行人重识别方法。该方法将自注意力模块插入到重识别网络卷积层中,通过非局部模块同时捕捉全局和局部上下文信息,并引入门控机制的轴向注意力模块提高行人重识别的准确性。在Market1501数据集上进行消融实验,验证同时使用非局部模块和门控轴向注意力模块对模型性能的显著提升效果。实验结果验证了设计的可行性与先进性,对相关领域研究具有一定的参考意义。 展开更多
关键词 行人重识别 注意力 局部注意力 门控轴向注意力 BOT模型
下载PDF
从全局到局部:双注意力融合去雾网络 被引量:1
15
作者 杨瑷玮 王华珂 侯兴松 《西安交通大学学报》 EI CAS CSCD 北大核心 2023年第7期191-200,共10页
为了处理现有的基于卷积神经网络去雾方法只使用单一的注意力、很难生成细节生动的清晰图像,且容易导致色彩失真的问题,提出了一个全局与局部注意力融合的图像去雾方法,以获得正常清晰度和无色彩失真的去雾图像。首先利用通道注意力将... 为了处理现有的基于卷积神经网络去雾方法只使用单一的注意力、很难生成细节生动的清晰图像,且容易导致色彩失真的问题,提出了一个全局与局部注意力融合的图像去雾方法,以获得正常清晰度和无色彩失真的去雾图像。首先利用通道注意力将输入的有雾图像在通道维度切分为两部分,一部分送入通道像素注意力通道抽取局部特征,另一部分送入Transformer通道学习全局特征,然后利用像素注意力对两个通道学习的特征进行融合,将上述模块作为基本单元组合为一个多级U型去雾网络,增加残差连接缓解上下采样导致的细节信息丢失,最后在网络底层加入一个Transformer模块学习全局信息。在多个公开可用的去雾图像数据集RESIDE SOTS Indoor、RESIDE SOTS Outdoor上测试所提方法的有效性,结果表明:对比经典的去雾方法,所提网络生成的图像细节更丰富并且色彩失真最少;在RESIDE SOTS Outdoor数据集上,相比经典的FFA-Net,峰值信噪比提高1.16 dB,相比GridDehazeNet,峰值信噪比提高3.68 dB。提出的全局与局部注意力融合方法能有效地去除雾霾,提升图像的对比度与清晰度,设计的多级U型去雾网络和残差连接结构能够缓解细节丢失,提升去雾效果,获得清晰的图像。 展开更多
关键词 图像去雾 全局与局部注意力融合 通道像素注意力 Transformer模块
下载PDF
融合注意力机制的TransGLnet脉络膜自动分割
16
作者 黄文博 屈超凡 燕杨 《光学精密工程》 EI CAS CSCD 北大核心 2023年第23期3482-3489,共8页
针对脉络膜与巩膜间对比度低,脉络膜分割存在脉络膜下边界模糊,难以界定等问题,提出了融合注意力机制的TransGLnet脉络膜自动分割网络,在卷积层引入全局注意力模块(Global Attention Module,GAM),在特征之间应用矩阵乘法,在整体空间位... 针对脉络膜与巩膜间对比度低,脉络膜分割存在脉络膜下边界模糊,难以界定等问题,提出了融合注意力机制的TransGLnet脉络膜自动分割网络,在卷积层引入全局注意力模块(Global Attention Module,GAM),在特征之间应用矩阵乘法,在整体空间位置的多个特征之间建立非线性交互,在不使用大量参数的情况下提取全局特征;在卷积层和Transformer编码器之间引入局部注意力模块(Local Attention Module,LAM),以1/4特征图为基本单元探索局部特征,特征图元素位置移动规则为保持行位置的元素不变,将列位置的元素由大到小重新排列。两模块融合可令网络有效兼顾全局与局部特征。实验结果表明,TransGLnet网络的Dice值为0.91,准确率为0.98,平均交并比为0.89,F1值为0.90,豪斯多夫距离为6.56。与现有脉络膜自动分割方法相比,本文方法的各项性能指标均有提高。TransGLnet脉络自动分割网络具有较好的稳定性,可供临床借鉴。 展开更多
关键词 医学图像处理 脉络膜自动分割 TransUnet 全局注意力 局部注意力
下载PDF
非局部注意力双分支网络的跨模态赤足足迹检索 被引量:1
17
作者 鲍文霞 茅丽丽 +3 位作者 王年 唐俊 杨先军 张艳 《中国图象图形学报》 CSCD 北大核心 2022年第7期2199-2213,共15页
目的针对目前足迹检索中存在的采集设备种类多样化、有效的足迹特征难以提取等问题,本文以赤足足迹图像为研究对象,提出一种基于非局部(non-local)注意力双分支网络的跨模态赤足足迹检索算法。方法该网络由特征提取、特征嵌入以及双约... 目的针对目前足迹检索中存在的采集设备种类多样化、有效的足迹特征难以提取等问题,本文以赤足足迹图像为研究对象,提出一种基于非局部(non-local)注意力双分支网络的跨模态赤足足迹检索算法。方法该网络由特征提取、特征嵌入以及双约束损失模块构成,其中特征提取模块采用双分支结构,各分支均以Res Net50作为基础网络分别提取光学和压力赤足图像的有效特征;同时在特征嵌入模块中通过参数共享学习一个多模态的共享空间,并引入非局部注意力机制快速捕获长范围依赖,获得更大感受野,专注足迹图像整体压力分布,在增强每个模态有用特征的同时突出了跨模态之间的共性特征;为了增大赤足足迹图像类间特征差异和减小类内特征差异,利用交叉熵损失LCE(cross-entropy loss)和三元组损失LTRI(triplet loss)对整个网络进行约束,以更好地学习跨模态共享特征,减小模态间的差异。结果本文将采集的138人的光学赤足图像和压力赤足图像作为实验数据集,并将本文算法与细粒度跨模态检索方法FGC(fine-grained cross-model)和跨模态行人重识别方法HC(hetero-center)进行了对比实验,本文算法在光学到压力检索模式下的m AP(mean average precision)值和rank1值分别为83.63%和98.29%,在压力到光学检索模式下的m AP值和rank1值分别为84.27%和94.71%,两种检索模式下的m AP均值和rank1均值分别为83.95%和96.5%,相较于FGC分别提高了40.01%和36.50%,相较于HC分别提高了26.07%和19.32%。同时本文算法在non-local注意力机制、损失函数、特征嵌入模块后采用的池化方式等方面进行了对比分析,其结果证实了本文算法的有效性。结论本文提出的跨模态赤足足迹检索算法取得了较高的精度,为现场足迹比对、鉴定等应用提供了研究基础。 展开更多
关键词 图像检索 跨模态足迹检索 局部注意力机制 双分支网络 赤足足迹图像
原文传递
位置感知注意力及其在行人重识别中的应用
18
作者 陈江萍 张索非 +2 位作者 宋越 吴晓富 林嘉 《计算机技术与发展》 2023年第1期150-156,共7页
行人重识别领域的众多工作都表明,采用多分支神经网络搭配注意力模块是一种实现高性能特征嵌入的有效方式。传统方案主要关注于多分支网络结构的设计,而在注意力机制的设计上存在明显不足,如当前注意力机制缺乏对特征位置信息的有效挖... 行人重识别领域的众多工作都表明,采用多分支神经网络搭配注意力模块是一种实现高性能特征嵌入的有效方式。传统方案主要关注于多分支网络结构的设计,而在注意力机制的设计上存在明显不足,如当前注意力机制缺乏对特征位置信息的有效挖掘和利用。为此,该文在多尺度特征金字塔分支(Feature Pyramid Branch, FPB)网络的框架下,分析了不同注意力模块的引入对系统性能的影响;在此基础上,讨论了两种在注意力机制中融入位置信息的方法,提出了一种新的位置感知注意力模块,该模块具有即插即用的优点,便于融入各种主干网络。在多个流行行人重识别标准数据集上的实验表明,融入位置感知注意力模块的FPB网络相比于原FPB网络,仅需增加0.29 M参数就可以显著提升最终的模型识别准确率:rank-1在Market1501上提高0.7百分点,在DukeMTMC上提高1.5百分点,在CUHK03-Labeled上提高2.4百分点,在CUHK03-Detected上提高3.8百分点。 展开更多
关键词 位置编码 局部注意力模块 位置感知注意力模块 特征金字塔分支 行人重识别
下载PDF
GCM^(+)-LANet:遥感图像语义分割的全局卷积模块与局部注意力网络模型 被引量:1
19
作者 翁梦倩 胡蕾 +2 位作者 张永梅 凌杰 李云洪 《遥感技术与应用》 CSCD 北大核心 2022年第4期820-828,共9页
遥感图像地物种类丰富、尺寸多变、分布不均衡、背景复杂,导致经典图像语义分割网络难以在遥感图像上取得理想分割效果。局部注意力网络模型(LANet)在遥感图像语义分割上取得了较好的实验效果,但大尺寸、小尺寸和细长的地物目标分割效... 遥感图像地物种类丰富、尺寸多变、分布不均衡、背景复杂,导致经典图像语义分割网络难以在遥感图像上取得理想分割效果。局部注意力网络模型(LANet)在遥感图像语义分割上取得了较好的实验效果,但大尺寸、小尺寸和细长的地物目标分割效果不佳。提出了一种改进LANet网络的高分辨率遥感图像语义分割网络模型,首先,针对全局特征提取设计了全局卷积模块(GCM^(+)),以组合卷积的形式扩大感受野,提升大尺寸地物目标的分割性能;其次,利用针对计算机视觉提出的激活函数Funnel ReLU(FReLU)来解决细小目标漏分的问题。实验结果表明:该网络模型在Potsdam数据集上平均交并比达到了75.83%,像素准确率达到了94.95%,比基础网络LANet有较大提升。 展开更多
关键词 遥感图像 语义分割 全局卷积模块 局部注意力网络模型 激活函数
原文传递
基于重组性高斯自注意力的视觉Transformer 被引量:1
20
作者 赵亮 周继开 《自动化学报》 EI CAS CSCD 北大核心 2023年第9期1976-1988,共13页
在目前视觉Transformer的局部自注意力中,现有的策略无法建立所有窗口之间的信息流动,导致上下文语境建模能力不足.针对这个问题,基于混合高斯权重重组(Gaussian weight recombination,GWR)的策略,提出一种新的局部自注意力机制SGW-MSA(... 在目前视觉Transformer的局部自注意力中,现有的策略无法建立所有窗口之间的信息流动,导致上下文语境建模能力不足.针对这个问题,基于混合高斯权重重组(Gaussian weight recombination,GWR)的策略,提出一种新的局部自注意力机制SGW-MSA(Shuffled and Gaussian window-multi-head self-attention),它融合了3种不同的局部自注意力,并通过GWR策略对特征图进行重建,在重建的特征图上提取图像特征,建立了所有窗口的交互以捕获更加丰富的上下文信息.基于SGW-MSA设计了SGWin Transformer整体架构.实验结果表明,该算法在mini-imagenet图像分类数据集上的准确率比Swin Transformer提升了5.1%,在CIFAR10图像分类实验中的准确率比Swin Transformer提升了5.2%,在MS COCO数据集上分别使用Mask R-CNN和Cascade R-CNN目标检测框架的mAP比Swin Transformer分别提升了5.5%和5.1%,相比于其他基于局部自注意力的模型在参数量相似的情况下具有较强的竞争力. 展开更多
关键词 TRANSFORMER 局部注意力 混合高斯权重重组 图像分类 目标检测
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部