期刊文献+
共找到111篇文章
< 1 2 6 >
每页显示 20 50 100
一种融合多尺度混合注意力的建筑物变化检测模型
1
作者 于海洋 滑志华 +2 位作者 宋草原 谢赛飞 景鹏 《测绘工程》 2024年第1期47-56,共10页
针对高分辨率遥感图像非真实变化所引起的错误检测问题,提出一种新颖的轻量化孪生神经网络建筑物变化检测模型。其中轻量化的特征提取模块可以获取不同尺度的局部上下文信息,使其充分学习局部和全局特征。由通道和空间注意力组成的混合... 针对高分辨率遥感图像非真实变化所引起的错误检测问题,提出一种新颖的轻量化孪生神经网络建筑物变化检测模型。其中轻量化的特征提取模块可以获取不同尺度的局部上下文信息,使其充分学习局部和全局特征。由通道和空间注意力组成的混合注意力模块可以充分利用周围丰富的时空语义信息,以实现变化建筑物的准确提取。针对变化建筑物尺度跨度较大,容易导致建筑物边缘细节提取粗糙、小尺度建筑物漏检等问题,引入多尺度概念,将提取到的特征图划分为多个子区域,并分别引入混合注意力模块,最终将不同尺度的输出特征进行加权融合,以加强边缘细节提取能力。模型在WHU-CD、LEVIR-CD公开数据集进行实验,并分别取得87.8%和88.1%的F 1值,相较于6种对比模型具有更高的变化检测精度。 展开更多
关键词 建筑物变化检测 混合注意力机制 多尺度分割 轻量化孪生神经网络 高分辨率遥感图像
下载PDF
基于监督对比学习和混合注意力残差网络的隔膜泵单向阀故障诊断
2
作者 任洪兵 彭宇明 黄海波 《机电工程》 CAS 北大核心 2024年第4期594-603,共10页
由于工业生产环境中的强噪声和其他环境激励,隔膜泵单向阀不同故障的特征呈现一定的相似性,导致传统深度学习方法对单向阀的故障状态难以准确识别。为解决这一问题,提出了一种结合监督对比学习和混合注意力残差神经网络(HA-ResNet)的隔... 由于工业生产环境中的强噪声和其他环境激励,隔膜泵单向阀不同故障的特征呈现一定的相似性,导致传统深度学习方法对单向阀的故障状态难以准确识别。为解决这一问题,提出了一种结合监督对比学习和混合注意力残差神经网络(HA-ResNet)的隔膜泵单向阀故障诊断方法。首先,将注意力机制引入了残差神经网络以提升网络的学习能力,自适应调节了重要但微弱特征权重,并以恒等变换减少了有效信息被抑制现象;其次,提出了加权“监督对比损失(SCL)+交叉熵(CE)损失”,调节单向阀不同故障状态数据之间的距离,明确了单向阀不同故障状态的分类边界与降低噪声或环境激励的干扰;最后,通过工程实测数据,对监督对比学习和HA-ResNet融合方法的有效性和稳定性进行了验证。研究结果表明:监督对比学习和HA-ResNet融合方法在隔膜泵单向阀验证集上的平均准确率达到了99.3%;与其他故障诊断方法相比,其在诊断精度和稳定性上都具有一定的优势,验证了该方法在噪声干扰条件下故障诊断的可靠性。 展开更多
关键词 隔膜泵 单向阀 故障诊断 监督对比损失 混合注意力残差神经网络 特征相似性 深度学习方法
下载PDF
结合混合注意力的双判别生成对抗网络
3
作者 王磊 杨军 +1 位作者 张驰宇 代在燕 《计算机工程与应用》 CSCD 北大核心 2024年第7期212-221,共10页
图像生成任务中,如何提升生成图片的质量是一个关键问题。当前,生成对抗网络采用的多层卷积结构存在局部性归纳偏置的问题,无法准确聚焦关键信息,导致图像特征丢失严重,生成图像效果较差。为此,提出了结合混合注意力的双判别生成对抗网... 图像生成任务中,如何提升生成图片的质量是一个关键问题。当前,生成对抗网络采用的多层卷积结构存在局部性归纳偏置的问题,无法准确聚焦关键信息,导致图像特征丢失严重,生成图像效果较差。为此,提出了结合混合注意力的双判别生成对抗网络(DDMA-GAN)。设计了一种混合注意力机制,利用通道注意力和空间注意力模块,从两个维度充分捕获图像特征信息;为解决单判别器存在判别误差的问题,提出一种双判别器结构,使用融合系数将判定结果融合,使回传参数更具客观性,并嵌入数据增强模块,进一步提升模型鲁棒性;采用铰链损失作为模型损失函数,最大化真假样本间的距离,明确决策边界。模型在公开数据集LSUN和CelebA上进行验证,实验结果表明,DDMA-GAN生成的图像更加真实,纹理细节更加丰富,其FID和MMD值均显著降低且优于其他常见模型,证明了模型的有效性。 展开更多
关键词 图像生成 卷积神经网络 混合注意力 双判别器 数据增强 生成对抗网络
下载PDF
融合混合注意力的自编码器视频异常检测
4
作者 郑重 杨晓文 +3 位作者 谢剑斌 欧阳楠楠 忽欣谕 王晋涛 《计算机工程与设计》 北大核心 2024年第2期516-523,共8页
为提高视频异常检测的准确率,提出一种融合混合注意力的自编码器视频异常检测算法。针对自编码器网络强大的“泛化”能力可能重构异常行为问题,提出一种混合注意力模块(CSCFAM)并将其融合至编码器和解码器之间的跳跃连接层以限制异常行... 为提高视频异常检测的准确率,提出一种融合混合注意力的自编码器视频异常检测算法。针对自编码器网络强大的“泛化”能力可能重构异常行为问题,提出一种混合注意力模块(CSCFAM)并将其融合至编码器和解码器之间的跳跃连接层以限制异常行为的生成。为考虑正常样本的多样性,在编码器和解码器之间的瓶颈处引入存储记忆模块(Memory),记录正常样本潜在特征的原型模式。实验结果表明,该算法在UCSD Ped2、CUHK Avenue数据集上帧级AUC分别达到97.3%、87.0%,与当前先进的视频异常检测算法相比,异常检测能力得到有效提升。 展开更多
关键词 视频异常检测 自编码器 跳跃连接 混合注意力模块 存储记忆模块 异常行为 原型模式
下载PDF
基于多尺度边缘分割与混合注意力机制的脊柱CT图像分割
5
作者 刘晶 徐皓 +2 位作者 崔欣欣 田振宇 杨建兰 《中国医学物理学杂志》 CSCD 2024年第4期463-471,共9页
脊柱疾病的前期主要通过计算机断层扫描技术进行筛查与初步判断。为解决脊柱CT图像目前存在的椎骨结构复杂、分割精度不足等问题,提出一种基于3D U-Net框架的脊柱CT图像改进分割网络,通过融合SE残差单元、椎骨边缘分割模型与改进混合通... 脊柱疾病的前期主要通过计算机断层扫描技术进行筛查与初步判断。为解决脊柱CT图像目前存在的椎骨结构复杂、分割精度不足等问题,提出一种基于3D U-Net框架的脊柱CT图像改进分割网络,通过融合SE残差单元、椎骨边缘分割模型与改进混合通道-空间注意力机制,在VerSe 19、VerSe 20与CTSpine1K脊柱数据集上进行分割训练与测试。多次测试实验结果表明,本文模型在保证分割精度和分割效率有效提高的同时具有较好的泛化性与鲁棒性,在Dice相似系数、豪斯多夫距离与平均表面距离上相较于其他先进网络分割精度更高。本文模型在现有脊柱分割的网络中具有更强的分割性能,可为放射科医生提供有效临床信息。 展开更多
关键词 脊柱分割 3D U-Net 椎骨边缘分割 混合注意力机制
下载PDF
基于深度混合注意力网络的窃电检测
6
作者 彭军 李琪林 +3 位作者 周尧 袁钟 彭德中 刘益志 《四川电力技术》 2024年第2期99-106,共8页
窃电检测旨在识别和检测非法或未经授权的电力使用行为。在智能电网技术高速发展的背景下,如何实现准确的窃电行为检测,是学术界和工业界广泛关注的一个重要问题。针对已有方法依赖人工特征设计以及低层特征提取能力不足的问题,提出了... 窃电检测旨在识别和检测非法或未经授权的电力使用行为。在智能电网技术高速发展的背景下,如何实现准确的窃电行为检测,是学术界和工业界广泛关注的一个重要问题。针对已有方法依赖人工特征设计以及低层特征提取能力不足的问题,提出了一种基于深度混合注意力网络的窃电检测方法,将通道注意力和自相关注意力机制相结合,在不同层次和空间范围内捕捉数据中的时间依赖性和周期性等复杂特征。所提模型在低层使用通道注意力网络来增强低层特征的表达能力,在中间层使用自相关注意力来捕捉全局上下文信息,并利用自监督方法来学习注意力参数,从而提取出更具表达力和判别力的特征表示。在中国国家电网数据集上进行实验所获得的结果表明,所提出的方法在AUC以及F1等性能指标上取得了更好的效果。 展开更多
关键词 窃电检测 智能电网 混合注意力网络 自监督学习
下载PDF
一种并行混合注意力的渐进融合图像增强方法 被引量:1
7
作者 刘光辉 杨琦 +2 位作者 孟月波 赵敏华 杨华 《光电工程》 CAS CSCD 北大核心 2023年第4期47-59,共13页
针对低照度图像增强过程中出现的色彩失真、噪声放大和细节信息丢失等问题,提出一种并行混合注意力的渐进融合图像增强方法 (progressive fusion of parallel hybrid attention,PFA)。首先,设计多尺度加权聚合网络(multiscale weighted ... 针对低照度图像增强过程中出现的色彩失真、噪声放大和细节信息丢失等问题,提出一种并行混合注意力的渐进融合图像增强方法 (progressive fusion of parallel hybrid attention,PFA)。首先,设计多尺度加权聚合网络(multiscale weighted aggregation,MWA),通过聚合不同感受野下学习到的多尺度特征,促进局部特征的全域化表征,加强原始图像细节信息的保留;其次,提出并行混合注意力结构(parallel hybrid attention module,PHA),利用像素注意力和通道注意力并联组合排列,缓解不同分支注意力分布滞后造成的颜色差异,通过相邻注意力间的信息相互补充有效提高图像的色彩表现力并弱化噪声;最后,设计渐进特征融合模块(progressive feature fusion module,PFM),在三个阶段由粗及细对前阶段输入特征进行再处理,补充因网络深度增加造成的浅层特征流失,避免因单阶段特征堆叠导致的信息冗余。LOL、DICM、MEF和LIME数据集上的实验结果表明,本文方法在多个评价指标上的表现均优于对比方法。 展开更多
关键词 图像增强 多尺度加权聚合 并行混合注意力 渐进融合 信息冗余
下载PDF
多尺度混合注意力网络的图像超分辨率重建 被引量:1
8
作者 李云红 马登飞 +3 位作者 于惠康 苏雪平 李嘉鹏 史含驰 《西安工程大学学报》 CAS 2023年第3期92-100,共9页
针对现有超分辨率(super-resolution)重建算法重建出的图像存在高频细节丢失、结构化失真的问题,结合多尺度混合注意力网络,给出一种新的重建算法。首先,设计了一种多尺度残差模块(multi-scale residual module,MRM),提取不同尺度信息... 针对现有超分辨率(super-resolution)重建算法重建出的图像存在高频细节丢失、结构化失真的问题,结合多尺度混合注意力网络,给出一种新的重建算法。首先,设计了一种多尺度残差模块(multi-scale residual module,MRM),提取不同尺度信息的特征并进行融合来获取包含更多信息的浅层特征;其次,采用残差混合注意力模块(residual hybrid attention module,RHAM),依次沿着通道和空间2个不同的维度增强网络特征提取能力,进行自适应的特征优化,提高高频特征的复用;最后,通过重建模块对提取的特征进行增强,获取相应的高分辨率图像。在基准数据集上进行测试,实验结果表明:文中提出的算法相较主流图像SR算法,在放大尺度为2、3、4倍时峰值信噪比(peak signal to noise ratio,PSNR)平均提高了0.104、0.224、0.146 dB,结构相似性(structural similarity index measure,SSIM)平均提高了0.0349、0.0276、0.0181。该算法能更有效地利用原始图像信息,重建出的图像在边缘和纹理细节等方面有一定的提高。 展开更多
关键词 超分辨率重建 多尺度残差 混合注意力网络 深度学习 特征融合
下载PDF
基于多尺度特征融合和残差混合注意力的点云配准算法
9
作者 梁正友 姚强 +1 位作者 孙宇 李轩昂 《计算机工程与设计》 北大核心 2023年第9期2650-2656,共7页
为提高点云配准的精度、鲁棒性和迁移性,提出一种基于多尺度特征融合和残差混合注意力的点云配准算法。计算点云中不同尺度的k邻近图,分别进行不同深度的边卷积提取特征并融合为新特征,使用具有残差结构的混合注意力模块增强有效特征,通... 为提高点云配准的精度、鲁棒性和迁移性,提出一种基于多尺度特征融合和残差混合注意力的点云配准算法。计算点云中不同尺度的k邻近图,分别进行不同深度的边卷积提取特征并融合为新特征,使用具有残差结构的混合注意力模块增强有效特征,通过Transformer和软指针预测变换后的点云,用可微的奇异值分解求解刚性变换。在ModelNet40数据集进行实验,其结果表明,所提算法在干净、有噪声、未见过的点云数据上的配准结果精度更高,噪声鲁棒性更强,迁移性更好,优于对比点云配准算法。 展开更多
关键词 点云配准 多尺度 特征融合 混合注意力 残差结构 奇异值分解 深度学习
下载PDF
基于卷积神经网络和混合注意力机制的书标检测算法
10
作者 张岩 赵蒙蒙 +1 位作者 孙英伟 常艳康 《山东科技大学学报(自然科学版)》 CAS 北大核心 2023年第3期94-102,共9页
为实现图书馆中机器人智能排架,提出一种基于卷积神经网络和混合注意力机制的书标检测模型。将DenseNet121引入YOLOv4以提高特征和梯度之间的传递效率,利用SPDC模块实现局部和全局特征融合,进而通过通道和空间混合注意力提高模型的特征... 为实现图书馆中机器人智能排架,提出一种基于卷积神经网络和混合注意力机制的书标检测模型。将DenseNet121引入YOLOv4以提高特征和梯度之间的传递效率,利用SPDC模块实现局部和全局特征融合,进而通过通道和空间混合注意力提高模型的特征表征能力。实验结果表明,模型的平均准确率、整体性能、参数量和模型大小均优于对比方法,且易于部署到嵌入式设备中实现在线检测,从而提高图书乱架治理的智能化水平。 展开更多
关键词 卷积神经网络 混合注意力机制 书标 目标检测 智慧图书馆
下载PDF
融合多尺度信息和混合注意力的遥感图像重建
11
作者 曹春萍 李昂 《软件工程》 2023年第11期5-10,共6页
针对使用单一尺寸的卷积核重建遥感图像效果较差的问题,提出了融合多尺度信息和混合注意力的遥感图像重建模型。模型使用两种不同的多尺度特征提取块,能有效提取不同感受野下的特征图中的高频和低频特征,并通过混合注意力机制自适应地... 针对使用单一尺寸的卷积核重建遥感图像效果较差的问题,提出了融合多尺度信息和混合注意力的遥感图像重建模型。模型使用两种不同的多尺度特征提取块,能有效提取不同感受野下的特征图中的高频和低频特征,并通过混合注意力机制自适应地调整多尺度特征的权重,利用重建模块重建高清遥感图像。在放大因子为2时,在NWPU-RESISC45和UCMerced-LandUse两个测试集上得到的PSNR(峰值信噪比)和SSIM(结构相似性)分别为37.7204 dB、37.9996 dB和0.9621、0.9654,均优于DSSR、IRN和MPSR等先进的遥感图像超分辨率重建的模型,证明了所设计模型的有效性和鲁棒性。 展开更多
关键词 超分辨率重建 深度学习 多尺度特征 混合注意力机制
下载PDF
基于混合注意力机制和深度学习的大坝变形预测模型 被引量:3
12
作者 向镇洋 包腾飞 +2 位作者 白妍丽 宋宝钢 王瑞婕 《水利水电科技进展》 CSCD 北大核心 2023年第2期96-101,共6页
为深度挖掘时序数据中前后信息的动态相关性,探究大坝变形的内在影响机理,有效提高模型预测精度,构建了一种基于混合注意力机制与鲸鱼优化算法(WOA)的双向门控循环网络(BiGRU)预测模型。模型利用WOA对BiGRU进行超参数寻优以有效挖掘变... 为深度挖掘时序数据中前后信息的动态相关性,探究大坝变形的内在影响机理,有效提高模型预测精度,构建了一种基于混合注意力机制与鲸鱼优化算法(WOA)的双向门控循环网络(BiGRU)预测模型。模型利用WOA对BiGRU进行超参数寻优以有效挖掘变形数据在时间维度的深层信息,并引入融合特征注意力(FATT)和时间注意力(TATT)的混合注意力机制计算各影响因子的贡献率,使模型可视化并提高模型捕捉环境因素动态变化的能力。以某高拱坝为例,将该模型预测结果与多种常用模型预测结果进行对比分析,结果表明该模型预测精度显著提升,贡献率计算符合大坝变形研究成果,验证了模型在大坝变形预测中的优越性与合理性。 展开更多
关键词 大坝变形预测 深度学习 混合注意力机制 鲸鱼优化算法
下载PDF
基于多分支混合注意力的小目标检测算法 被引量:1
13
作者 秦强强 廖俊国 周弋荀 《计算机应用》 CSCD 北大核心 2023年第11期3579-3586,共8页
针对图像中的小目标特征信息少、占比低、易受环境影响等特点,提出一种基于多分支混合注意力的小目标检测算法SMAM-YOLO。首先,将通道注意力(CA)和空间注意力(SA)相结合,重新组合连接结构,提出一种混合注意力模块(MAM),增强模型对小目... 针对图像中的小目标特征信息少、占比低、易受环境影响等特点,提出一种基于多分支混合注意力的小目标检测算法SMAM-YOLO。首先,将通道注意力(CA)和空间注意力(SA)相结合,重新组合连接结构,提出一种混合注意力模块(MAM),增强模型对小目标特征在空间维度上的表达能力。其次,根据不同大小的感受野对目标影响的不同,基于混合注意力提出一种多分支混合注意力模块(SMAM);根据输入特征图的尺度自适应调整感受野大小,同时使用混合注意力增强不同分支下对小目标特征信息的捕获能力。最后,使用SMAM改进YOLOv5中的核心残差模块,提出一种基于CSPNet(Cross Stage Partial Network)和SMAM的特征提取模块CSMAM,而且CSMAM的额外计算开销可以忽略不计。在TinyPerson数据集上的实验结果表明,与基线算法YOLOv5s相比,当交并比(IoU)阈值为0.5时,SMAM-YOLO算法的平均检测精度(mAP50)提升了4.15个百分点,且检测速度达到74 frame/s;此外,与现有的一些主流小目标检测模型相比,SMAM-YOLO算法在mAP50上平均提升了1.46~6.84个百分点,且能满足实时性检测的需求。 展开更多
关键词 小目标检测 多分支网络 混合注意力 特征融合 实时检测
下载PDF
基于4D卷积和混合注意力的驾驶行为检测方法 被引量:1
14
作者 高军 易建钢 《计算机工程与设计》 北大核心 2023年第5期1427-1433,共7页
交通状况的复杂性和不确定性往往会影响驾驶行为模型的检测性能,为准确从前方道路视频中检测出本车的驾驶行为,提出一种基于混合注意力的4D卷积神经网络(MA4DN)模型。结合4D残差卷积块,MA4DN模型具备同时建模短程和长程时空表征的能力;... 交通状况的复杂性和不确定性往往会影响驾驶行为模型的检测性能,为准确从前方道路视频中检测出本车的驾驶行为,提出一种基于混合注意力的4D卷积神经网络(MA4DN)模型。结合4D残差卷积块,MA4DN模型具备同时建模短程和长程时空表征的能力;为MA4DN设计一种混合注意力模块(MAM),联合学习时空感知特征、通道依赖特征和运动上下文特征等多类型信息;设计一种融合focal loss的损失函数,增强MA4DN模型对难样本的学习能力。在一个自然驾驶数据集上的实验结果表明,MA4DN的检测精度和泛化能力明显优于其它先进的3D卷积神经网络模型。 展开更多
关键词 驾驶行为检测 深度学习 4D卷积网络 混合注意力 高级驾驶辅助系统 计算机视觉 时空感知
下载PDF
利用多语言线索进行事件检测的混合注意力网络
15
作者 黄培馨 赵翔 +3 位作者 方阳 冉旭东 谭真 肖卫东 《小型微型计算机系统》 CSCD 北大核心 2023年第6期1128-1133,共6页
事件检测是一项复杂的信息获取任务,在纯文本事件抽取中起着至关重要的作用.实际情况下,由于数据稀疏和自然语言的歧义性,事件检测任务面领着巨大的挑战.针对这些挑战,从先前工作利用一种额外的语言信息作为数据增强之中获得启发,本研... 事件检测是一项复杂的信息获取任务,在纯文本事件抽取中起着至关重要的作用.实际情况下,由于数据稀疏和自然语言的歧义性,事件检测任务面领着巨大的挑战.针对这些挑战,从先前工作利用一种额外的语言信息作为数据增强之中获得启发,本研究提出从多种自动翻译得到的多语言文本中挖掘互补信息,从而在一定程度上缓解数据稀疏和自然语言歧义的问题.为此,本研究设计实现了一种混合注意力神经网络模型HAN(hybrid attention network),其中的混合注意力模块通过一个上下文注意力机制和一个多语言注意力机制来实现从多种语言的信息中挖掘互补线索.实验在两个基准数据集上进行,结果证明了HAN模型在事件检测任务上的性能明显优于其他现有的模型. 展开更多
关键词 事件检测 多语言线索 混合注意力网络
下载PDF
基于稠密连接卷积神经网络与混合注意力的烟叶图像分级方法 被引量:1
16
作者 江浩 罗瑞林 +2 位作者 金雪松 陈载清 云利军 《软件导刊》 2023年第5期184-189,共6页
针对烟叶实际收购过程中受环境与个人状态影响而导致分级准确率下降的问题,提出一种结合稠密连接卷积神经网络与混合注意力机制的深度学习模型。该模型通过改进残差注意力网络,在原网络注意力模块的主分支残差模块与网络输出阶段的多个... 针对烟叶实际收购过程中受环境与个人状态影响而导致分级准确率下降的问题,提出一种结合稠密连接卷积神经网络与混合注意力机制的深度学习模型。该模型通过改进残差注意力网络,在原网络注意力模块的主分支残差模块与网络输出阶段的多个残差模块上,使用稠密连接卷积模块进行替换,以增强分支特征学习性能并降低参数量,缓解梯度消失问题。同时,使用两个残差注意力网络的注意力机制模块,并添加空间注意力模块加权提取烟叶特征图在空间、通道维度的信息,以获取更全面的特征信息。通过10个等级共5 000张烟叶图像的实验表明,该网络在降低网络深度的同时,提升了检测速度与识别精度,分级正确率相较于原网络与VGGNet19分别提升8.19%、7.72%,网络参数量相较于ResNet34减少45%,训练速度提升38.11%,可证明该方法对不同等级烟叶均具有较好的识别效果和较快的识别速度,能较好地对生产中的烟叶进行分级。 展开更多
关键词 烟叶分级 图像分类 混合注意力 稠密连接卷积神经网络 深度学习
下载PDF
结构化混合注意力网络的图像超分辨率重建
17
作者 喻九阳 张德安 +2 位作者 戴耀南 胡天豪 夏文凤 《计算机科学》 CSCD 北大核心 2023年第S01期352-356,共5页
针对现有图像超分辨模型存在特征提取能力弱、模型参数量较复杂等问题,提出了一种结构化混合注意力网络的图像超分辨率重建模型,该模型在提高图像超分辨率重建效果的同时降低了模型的参数量。首先,对编码器进行结构化处理,通过通道数量... 针对现有图像超分辨模型存在特征提取能力弱、模型参数量较复杂等问题,提出了一种结构化混合注意力网络的图像超分辨率重建模型,该模型在提高图像超分辨率重建效果的同时降低了模型的参数量。首先,对编码器进行结构化处理,通过通道数量的不同来提取更多的图像特征。其次,对编码器的输出特性进行注意力网络混合重组,从而加强图像的特征特性。最后,采用残差方式将输入的浅层图像特征直接与强化特征相混合,降低网络的参数量。实验结果表明,在公共数据集及不同放大倍率的前提下,文中构建模型的PSNR值和SSIM值基本是最优的,且网络结构的参数量较低,较好地平衡了图像超分辨率重建过程中性能和参数复杂度间的关系。 展开更多
关键词 图像处理 超分辨率 结构化残差 混合注意力 低模型参数
下载PDF
基于多尺度混合注意力机制的视频摘要算法
18
作者 张喻恩 李泽平 《计算机工程与设计》 北大核心 2023年第11期3305-3311,共7页
针对现有的视频摘要任务中视频帧的多层次上下文依赖信息提取不足的问题,提出一种基于多尺度混合注意力机制的视频摘要(MHAVS)算法。MHAVS采用编码器-解码器架构,编码器部分采用金字塔空洞卷积模块提取视频帧的不同尺度特征信息,解码器... 针对现有的视频摘要任务中视频帧的多层次上下文依赖信息提取不足的问题,提出一种基于多尺度混合注意力机制的视频摘要(MHAVS)算法。MHAVS采用编码器-解码器架构,编码器部分采用金字塔空洞卷积模块提取视频帧的不同尺度特征信息,解码器部分嵌入混合注意力机制建模视频帧的通道维度和空间维度的深度相互依赖性,增强特征的表达,利用指针网络帮助模型生成优势的视频摘要。提出算法在两个公共数据集SumMe和TvSum上进行多次实验,综合结果表明,MHAVS算法取得了不错的结果。 展开更多
关键词 视频摘要 上下文特征 多尺度特征 混合注意力机制 指针网络 编码器 解码器
下载PDF
非受控环境下基于混合注意力机制的面部表情识别
19
作者 张宁 穆静 +2 位作者 钱智哲 张洁 郭岱朋 《西安工业大学学报》 CAS 2023年第5期495-502,共8页
针对非受控环境下的面部表情识别过程中特征提取不充分的问题,构建了一个加强特征提取的网络结构——3_M_S_MobileNetV2模型,该结构以MobileNetV2为基础网络,结合自主设计的混合注意力模块3_M_CBAM,并且将ReLU6激活函数更换为SiLU激活... 针对非受控环境下的面部表情识别过程中特征提取不充分的问题,构建了一个加强特征提取的网络结构——3_M_S_MobileNetV2模型,该结构以MobileNetV2为基础网络,结合自主设计的混合注意力模块3_M_CBAM,并且将ReLU6激活函数更换为SiLU激活函数设计而成。在两个非受控环境下所采集的数据集RAF_DB和Fer2013上对设计的模型进行实验,识别准确率分别达到81.88%和65.65%,并且与现有的基于神经网络的识别方法相比,在RAF_DB数据集和Fer2013数据集上的面部表情识别准确率分别提高了1%~9%、0.5%~4%,证明了文中网络结构的有效性。 展开更多
关键词 人脸表情识别 非受控环境 混合注意力机制 特征提取
下载PDF
基于多通道特征和混合注意力的环境声音分类
20
作者 周帅 李理 +1 位作者 彭章君 黄鹏程 《计算机技术与发展》 2023年第8期43-50,共8页
环境声音分类(ESC)已成为非常重要的研究方向,但由于环境声音种类繁多,无法进行统一表征,加之易受噪声的干扰,使得ESC任务变得复杂。为了提高ESC任务的识别精度,提出了基于多通道特征和混合注意力模型的分类方法。首先,将ESC信号进行时... 环境声音分类(ESC)已成为非常重要的研究方向,但由于环境声音种类繁多,无法进行统一表征,加之易受噪声的干扰,使得ESC任务变得复杂。为了提高ESC任务的识别精度,提出了基于多通道特征和混合注意力模型的分类方法。首先,将ESC信号进行时频转换并使用多种滤波器提取频谱特征,将其重构为三通道特征图。多通道特征可以利用特征之间的互补性,弥补单一特征信息表征不足的缺点;其次,引入了一种由通道和时频注意力模块组成的混合分类模型,通道注意力模块计算特征图并对不同通道分配权重,含有更多有效信息且对该类声音分辨较好的通道特征则会被分配更多的权重,时频注意力模块会重点关注时域和频域中更有效的信息。该方法可较好地抑制背景噪声,消除冗余,提高收敛速度和分类精度。对比实验表明,在ESC-10,ESC-50数据集上的识别精度分别达到了96.25%和89.56%,在Urbansound8k的数据集上达到98.40%。 展开更多
关键词 环境声音分类 多通道特征 通道注意力 时频注意力 混合注意力模型 深度模型
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部