期刊文献+
共找到818篇文章
< 1 2 41 >
每页显示 20 50 100
The Transformation of Economic Globalization and China’s Role in It Under Profound Changes Unseen in a Century
1
作者 Chen Jianqi 《Contemporary World》 2024年第3期8-13,共6页
The world economy prospers when it is open,but declines when it is closed.Since the end of the cold war,economic globalization has developed rapidly,forming a new global development pattern that features intertwined i... The world economy prospers when it is open,but declines when it is closed.Since the end of the cold war,economic globalization has developed rapidly,forming a new global development pattern that features intertwined interests of countries all over the world.The report to the 20th National Congress of CPC pointed out that at present,changes in the world,times and history are unfolding in a way unseen in the past. 展开更多
关键词 transformATION globalIZATION pattern
下载PDF
基于Transformer的多尺度遥感语义分割网络 被引量:1
2
作者 邵凯 王明政 王光宇 《智能系统学报》 CSCD 北大核心 2024年第4期920-929,共10页
为了提升遥感图像语义分割效果,本文针对分割目标类间方差小、类内方差大的特点,从全局上下文信息和多尺度语义特征2个关键点提出一种基于Transformer的多尺度遥感语义分割网络(muliti-scale Transformer network,MSTNet)。其由编码器... 为了提升遥感图像语义分割效果,本文针对分割目标类间方差小、类内方差大的特点,从全局上下文信息和多尺度语义特征2个关键点提出一种基于Transformer的多尺度遥感语义分割网络(muliti-scale Transformer network,MSTNet)。其由编码器和解码器2个部分组成,编码器包含基于Transformer改进的视觉注意网络(visual attention network,VAN)主干和基于空洞空间金字塔池化(atrous spatial pyramid pooling, ASPP)结构改进的多尺度语义特征提取模块(multi-scale semantic feature extraction module, MSFEM)。解码器采用轻量级多层感知器(multi-layer perception,MLP)配合编码器设计,充分分析所提取的包含全局上下文信息和多尺度表示的语义特征。MSTNet在2个高分辨率遥感语义分割数据集ISPRS Potsdam和LoveDA上进行验证,平均交并比(mIoU)分别达到79.50%和54.12%,平均F1-score(m F1)分别达到87.46%和69.34%,实验结果验证了本文所提方法有效提升了遥感图像语义分割的效果。 展开更多
关键词 遥感图像 语义分割 卷积神经网络 transformER 全局上下文信息 多尺度感受野 编码器 解码器
下载PDF
GFENet:基于Transformer的高效医学图像分割网络
3
作者 孙红 朱江明 +3 位作者 吴一凡 徐广辉 任丽博 杨晨 《小型微型计算机系统》 CSCD 北大核心 2024年第7期1728-1733,共6页
医学图像分割技术在疾病诊断中发挥着重要作用,针对传统网络分割模型中存在参数量大、网络计算效率低等问题,本文提出名为GFENet的高性能低复杂度分割网络,GFENet以金字塔结构的视觉Transformer作为网络主干提取图像特征,分别采用线性... 医学图像分割技术在疾病诊断中发挥着重要作用,针对传统网络分割模型中存在参数量大、网络计算效率低等问题,本文提出名为GFENet的高性能低复杂度分割网络,GFENet以金字塔结构的视觉Transformer作为网络主干提取图像特征,分别采用线性预测模块和渐进式局域解码器对提取出来的低级特征和高级特征进行局部增强处理,最后采用GFE模块中的全局注意力机制将位置信息嵌入高级特征.在Kvasir和CVC-ClinicDB数据集上进行实验验证,GFENet的mDice分别为94.1%和94.6%;其在CVC-ColonDB和ETIS数据集上的泛化性能优于其他对比模型.为验证模型低复杂度的同时保持高分割准确率,本文将GFENet与现有的高性能模型和轻量化模型进行对比,GFENet在CVC-ColonDB数据集上以81.5%的mDice高于其它对比模型,以23.1M的参数量优于其他高性能分割模型. 展开更多
关键词 图像分割 transformER GFENet 全局注意力机制 息肉分割
下载PDF
结合CSWin-Transformer和门卷积的壁画图像修复方法
4
作者 徐志刚 杨欣宇 《计算机工程与应用》 CSCD 北大核心 2024年第21期215-224,共10页
敦煌壁画是珍贵的文化遗产,但现存壁画存在着大量破损现象。针对现有图像修复方法在处理敦煌壁画时面临着计算复杂度高、纹理模糊和特征提取不足等问题,提出了一种结合CSWin-Transformer(cross stripe window-Transformer)和门卷积的壁... 敦煌壁画是珍贵的文化遗产,但现存壁画存在着大量破损现象。针对现有图像修复方法在处理敦煌壁画时面临着计算复杂度高、纹理模糊和特征提取不足等问题,提出了一种结合CSWin-Transformer(cross stripe window-Transformer)和门卷积的壁画图像修复方法。构建由全局层网络和局部层门卷积残差密集网络组成的并行网络,利用条纹窗口增强图像特征提取能力,并通过门卷积残差块提升结构纹理修复的准确性。设计全局-局部特征融合模块来融合全局层和局部层输出的特征图像,以保持修复结果整体的一致性。通过建立共享注意力机制实现全局层和局部层之间的信息交互,同时为了完成破损壁画的修复,采用谱归一化马尔科夫判别模型进行对抗训练。通过对真实破损壁画的修复实验,结果表明,所提方法在主客观指标上均优于所对比的方法。 展开更多
关键词 深度学习 壁画修复 门卷积 CSWin-transformer 全局-局部特征融合
下载PDF
宽卷积局部特征扩展的Transformer网络故障诊断模型
5
作者 张新良 李占 周益天 《国外电子测量技术》 2024年第2期139-149,共11页
视觉Transformer网络的高精度诊断性能依赖于充分的训练数据,利用卷积网络在提取局部特征上的优势,构造能同时描述故障局部和全局特征的提取层,提高诊断模型的抗噪声干扰能力。首先,引入卷积网络模块将原始振动信号转换为Transformer网... 视觉Transformer网络的高精度诊断性能依赖于充分的训练数据,利用卷积网络在提取局部特征上的优势,构造能同时描述故障局部和全局特征的提取层,提高诊断模型的抗噪声干扰能力。首先,引入卷积网络模块将原始振动信号转换为Transformer网络可以直接接收的特征向量,提取故障局部特征,并通过增加卷积网络的感受野。然后,结合Transformer网络多头自注意力机制生成的全局信息,构建能同时描述故障局部和全局特征的特征向量。最后,在Transformer网络的预测层,利用高效通道注意力机制对特征向量的贡献度进行自动筛选。在西储大学(CWRU)轴承数据集上的故障诊断结果表明,在信噪比-4 dB的噪声干扰下,改进后的Transformer网络轴承故障诊断模型的准确率达90.21%,与原始Transformer模型相比,准确率提高了13.2%,在噪声环境下表现出优异的诊断性能。 展开更多
关键词 轴承故障诊断 视觉transformer 宽卷积核 自注意力机制 局部-全局特征 高效通道注意力
原文传递
基于Local-Global-VIT细粒度分类算法的蝴蝶识别
6
作者 李建祥 李小林 +4 位作者 王荣 张元孜 陈淑武 张飞萍 黄世国 《昆虫学报》 CAS CSCD 北大核心 2024年第9期1251-1261,共11页
【目的】准确鉴别蝴蝶种类,动态观测蝴蝶群落多样性变化对生境质量评估、生态环境恢复等方面具有重要意义。针对现有蝴蝶识别方法仅依靠整体特征,忽略了局部特征导致识别生态图像能力不足的问题,本研究旨在开发一种Local-Global-VIT细... 【目的】准确鉴别蝴蝶种类,动态观测蝴蝶群落多样性变化对生境质量评估、生态环境恢复等方面具有重要意义。针对现有蝴蝶识别方法仅依靠整体特征,忽略了局部特征导致识别生态图像能力不足的问题,本研究旨在开发一种Local-Global-VIT细粒度分类算法的蝴蝶识别方法。【方法】本研究以5科200种共计25 279张蝴蝶图像为识别对象,采用多种数据增强方法扩充图像数据;通过视觉Transformer(vision transformer, VIT)层级结构及自注意力机制逐层选择局部令牌并保留至最后一层学习蝴蝶局部判别部位信息;聚合高层全局令牌消除复杂背景干扰;通过对比损失拉大类间距提高区分度。除此之外,使用合理的学习率调整策略和迁移学习方法,优化了模型收敛过程,在不增加参数量的情况下提高了性能。【结果】Local-Global-VIT算法在大规模细粒度公开数据集Butterfly-200上识别准确率达91.20%,较改进前提升了1.15%,比最优的一般害虫识别算法EfficientNet_b0和细粒度分类算法TransFG准确率分别高了1.83%和0.64%,F1分值分别提高了1.89%和0.88%。【结论】Local-Global-VIT算法以细粒度识别方式有效解决了蝴蝶类内差异大、类间差异小的分类难题,能准确地识别蝴蝶种类,有助于高效评估生境质量。 展开更多
关键词 蝴蝶 图像识别 细粒度分类 vision transformer 局部令牌选择 全局令牌聚合
下载PDF
基于自监督视觉Transformer的图像美学质量评价方法
7
作者 黄荣 宋俊杰 +1 位作者 周树波 刘浩 《计算机应用》 CSCD 北大核心 2024年第4期1269-1276,共8页
现有的图像美学质量评价方法普遍使用卷积神经网络(CNN)提取图像特征,但受局部感受野机制的限制,CNN较难提取图像的全局特征,导致全局构图关系、全局色彩搭配等美学属性缺失。为解决该问题,提出基于自监督视觉Transformer(SSViT)模型的... 现有的图像美学质量评价方法普遍使用卷积神经网络(CNN)提取图像特征,但受局部感受野机制的限制,CNN较难提取图像的全局特征,导致全局构图关系、全局色彩搭配等美学属性缺失。为解决该问题,提出基于自监督视觉Transformer(SSViT)模型的图像美学质量评价方法。利用自注意力机制建立图像局部块之间的长距离依赖关系,自适应地学习图像不同局部块之间的相关性,提取图像的全局特征,从而刻画图像的美学属性;同时,设计图像降质分类、图像美学质量排序和图像语义重构这3项美学质量感知任务,利用无标注的图像数据对视觉Transformer(ViT)进行自监督预训练,增强全局特征的表达能力。在AVA(Aesthetic Visual Assessment)数据集上的实验结果显示,SSViT模型在美学质量分类准确率、皮尔森线性相关系数(PLCC)和斯皮尔曼等级相关系数(SRCC)指标上分别达到83.28%、0.7634和0.7462。以上实验结果表明,SSViT模型具有较高的图像美学质量评价准确性。 展开更多
关键词 图像美学质量评价 视觉transformer 自监督学习 全局特征 自注意力机制
下载PDF
基于全局依赖Transformer的图像超分辨率网络
8
作者 刘子涵 周登文 刘玉铠 《计算机应用》 CSCD 北大核心 2024年第5期1588-1596,共9页
目前,基于深度学习的图像超分辨网络主要由卷积实现。相较于传统的卷积神经网络(CNN),Transformer在图像超分辨率任务中的主要优势是它的长距离依赖建模能力;然而大多数基于Transformer的图像超分辨率模型在参数量小、网络层数少的情况... 目前,基于深度学习的图像超分辨网络主要由卷积实现。相较于传统的卷积神经网络(CNN),Transformer在图像超分辨率任务中的主要优势是它的长距离依赖建模能力;然而大多数基于Transformer的图像超分辨率模型在参数量小、网络层数少的情况下无法建立全局依赖,限制了模型的性能。为了在超分辨率网络中建立全局依赖,提出了基于全局依赖Transformer的图像超分辨率网络(GDTSR),主要组成部分为残差方形轴向窗口块(RSAWB),它的内部轴向窗口Transformer残差层利用轴向窗口和自注意力,可以使每个像素与整个特征图建立起全局依赖。此外,目前大多数图像超分辨率模型的超分辨率图像重建模块都由卷积组成,为了动态整合提取到的特征信息,结合Transformer与卷积,共同重建超分辨率图像。实验结果表明,GDTSR在5个标准测试集Set5、Set14、B100、Urban100和Manga109上的测试结果中,3个倍数(×2,×3,×4)的峰值信噪比(PSNR)和结构相似性(SSIM)均达到了最优,特别是在大尺寸图像的Urban100和Manga109数据集上模型性能的提升尤为明显。 展开更多
关键词 图像超分辨率 transformER 自注意力 全局依赖 轴向窗口
下载PDF
面向全局特征Transformer架构的单目深度估计
9
作者 吴冰源 王永雄 《控制工程》 CSCD 北大核心 2024年第9期1619-1625,共7页
针对卷积神经网络(convolutional neural networks,CNN)全局特征提取不足导致深度估计错误的问题,提出了一种面向全局特征的深度学习网络用于单目深度估计。该网络采用编码器-解码器的端到端架构,其中,编码器为具有多阶段输出的Transfor... 针对卷积神经网络(convolutional neural networks,CNN)全局特征提取不足导致深度估计错误的问题,提出了一种面向全局特征的深度学习网络用于单目深度估计。该网络采用编码器-解码器的端到端架构,其中,编码器为具有多阶段输出的Transformer网络,可提取多尺度的全局特征;解码器由CNN构成。此外,为抑制深度无关的细节信息影响,解码器末端采用了大卷积核注意力(large kernel attention,LKA)模块提升全局特征的提取能力。在室外场景数据集KITTI和室内场景数据集NYU Depth v2上的实验结果表明,面向全局特征的网络有助于生成高精度的、细节特征完整的深度图。与近期提出的同样基于CNN-Transformer的方法 AdaBins相比,所提出网络的参数量减少了42.31%,均方根误差减小了约2%。 展开更多
关键词 单目深度估计 transformER 大卷积核注意力 全局特征
原文传递
基于全局自适应宽度注意力改进的Transformer
10
作者 曾庆威 张建 +2 位作者 张鸿昌 谭雨阳 沈文枫 《计算机应用与软件》 北大核心 2024年第7期145-149,共5页
Transformer在自然语言处理中运用广泛,但存在文本长度过长带来的输入信息被切割、显存占用太大的问题,已有的解决方法是让模型动态决定每层注意力宽度,可以在控制计算量和显存开销的前提下关联最优序列长度,但存在每层最优的注意力宽... Transformer在自然语言处理中运用广泛,但存在文本长度过长带来的输入信息被切割、显存占用太大的问题,已有的解决方法是让模型动态决定每层注意力宽度,可以在控制计算量和显存开销的前提下关联最优序列长度,但存在每层最优的注意力宽度并不能达到模型最优注意力宽度的缺点。为此,提出一种全层自适应宽度注意力模型(GAA)。让每层的注意力范围和全局关联,实现模型全局注意力范围最优,还将模型的前馈层修改为带门控单元的前馈层(FFN_(GLU))。在数据集enwiki8和text-8上的验证表明,该方法仅使用25%的训练计算成本,即可达到比基线更好的性能。 展开更多
关键词 transformER 全局自适应宽度注意力 FFN_(GLU)
下载PDF
基于全局滤波池化多关系Transformer网络的行人重识别
11
作者 焦传扬 丁学明 《控制工程》 CSCD 北大核心 2024年第5期912-919,共8页
行人重识别(Re-identification,ReID)的关键挑战之一是提取关键且鲁棒的特征,近年来,Transformer网络不断展现其在该问题上具有强大的特征提取和表达能力。针对传统Transformer网络局部信息获取不如卷积神经网络的问题,提出一个基于ReI... 行人重识别(Re-identification,ReID)的关键挑战之一是提取关键且鲁棒的特征,近年来,Transformer网络不断展现其在该问题上具有强大的特征提取和表达能力。针对传统Transformer网络局部信息获取不如卷积神经网络的问题,提出一个基于ReID的全局滤波池化多关系Transformer(Trans-global filter pooling multi relationship-ReID,TFMR)网络新型框架,解决了Transformer网络局部关系建模不够丰富的问题。多关系(multi relation,MR)网络考虑身体多个部位间的关系,使特征包含局部信息之间的联系,增强特征中行人生理结构的关联。同时设计了全局滤波池化(global filter pooling,GFP)模块,将其嵌入到Transformer网络中,降低图片中噪点的干扰并减少视图变化造成的特征偏差,从而获取人物图像中更清晰的全局特征,提升识别准确率。实验表明,模型在区分行人信息问题上具有高效性,在Market-1501、DukeMTMC-ReID和MSMT17数据集中优于其他模型。 展开更多
关键词 行人重识别 transformER 全局滤波池化 多关系网络
原文传递
基于ViT-CNN混合网络的合成孔径雷达图像船舶分类
12
作者 邵然 毕晓君 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2024年第8期1616-1623,共8页
为了解决视觉转换器模型缺乏多尺度与局部特征捕获能力,难以适应合成孔径雷达图像船舶分类任务的问题,本文提出一种混合网络模型用于合成孔径雷达图像船舶分类。利用分阶段下采样网络结构,解决了ViT无法捕获多尺度特征的问题。通过在Vi... 为了解决视觉转换器模型缺乏多尺度与局部特征捕获能力,难以适应合成孔径雷达图像船舶分类任务的问题,本文提出一种混合网络模型用于合成孔径雷达图像船舶分类。利用分阶段下采样网络结构,解决了ViT无法捕获多尺度特征的问题。通过在ViT模型的3个核心模块中融入卷积结构,设计了卷积标记嵌入、卷积参数共享注意力和局部前馈网络3个模块,使得网络能够同时捕获船舶图像的全局和局部特征,进一步增强了网络归纳偏置和特征提取能力。研究表明:本文所提模型在OpenSARShip和FUSAR-Ship2个通用合成孔径雷达船舶图像数据集上,分类准确率较最优方法分别提高了2.96%和4.18%,有效地提升了合成孔径雷达图像船舶分类性能。 展开更多
关键词 视觉转换器 卷积神经网络 SAR图像 深度学习 参数共享 局部特征 全局特征 船舶图像
下载PDF
一种基于Transformer模型的特征增强算法及其应用研究
13
作者 李俊华 段志奎 于昕梅 《佛山科学技术学院学报(自然科学版)》 CAS 2024年第3期27-34,共8页
Transformer模型在自动语音识别(ASR)任务中展现出优秀的性能,但在特征提取方面存在两个问题:一是模型集中于全局特征交互信息提取,忽略了其他有用的特征信息,如局部特征交互信息;二是模型对低层特征交互信息的利用不够充分。为了解决... Transformer模型在自动语音识别(ASR)任务中展现出优秀的性能,但在特征提取方面存在两个问题:一是模型集中于全局特征交互信息提取,忽略了其他有用的特征信息,如局部特征交互信息;二是模型对低层特征交互信息的利用不够充分。为了解决这两个问题,提出了卷积线性映射(CMLP)模块以强化局部特征交互,并设计低层特征融合(LF)模块来融合高低层特征。通过整合这些模块,构建了CLformer模型。在两个中文普通话数据集(Aishell-1和HKUST)上进行实验,结果表明,CLformer显著提升了模型性能,在Aishell-1上较基线提高0.3%,在HKUST上提高0.5%。 展开更多
关键词 transformer模型 自动语音识别 特征增强 局部特征 特征融合
下载PDF
基于Swin Transformer和图形推理的结直肠息肉分割方法
14
作者 梁礼明 何安军 +1 位作者 阳渊 吴健 《工程科学学报》 EI CSCD 北大核心 2024年第5期897-907,共11页
针对结直肠息肉图像分割中病灶区域尺度变化大、边缘模糊以及息肉与正常组织对比度低等问题,导致病变区域分割精度低和分割边界存在伪影,提出一种基于Swin Transformer和图形推理的自适应网络.该网络一是利用Swin Transformer编码器逐... 针对结直肠息肉图像分割中病灶区域尺度变化大、边缘模糊以及息肉与正常组织对比度低等问题,导致病变区域分割精度低和分割边界存在伪影,提出一种基于Swin Transformer和图形推理的自适应网络.该网络一是利用Swin Transformer编码器逐层提取输入图像的全局上下文信息,弱化背景信息干扰,多尺度分析病变区域的显著性特点.二是提出全局与局部特征交互模块增强网络对复杂病灶的空间感知能力,突出待分割目标的关键位置信息,精准定位目标.三是通过区域引导图推理模块以图循环递推的方式挖掘先验信息之间的高阶显性关系,促进图间信息传递.四是设计面向边缘细节的边缘约束图推理模块,整合边缘细节,改善分割效果,提高分割精度.在CVC-ClinicDB、Kvasir、CVC-ColonDB和ETIS数据集上进行实验,其Dice系数分别为0.939,0.926,0.810和0.788,平均交并比分别为0.889,0.879,0.731和0.710,分割性能优于现有方法.仿真实验结果表明,对于形态结构复杂、对比度低和边缘模糊的结直肠息肉图像均有较高的分割精度. 展开更多
关键词 结直肠息肉 Swin transformer 全局与局部特征交互 区域引导图推理 边缘约束图推理
下载PDF
基于卷积神经网络和Transformer的视频行人再识别
15
作者 赵彦如 牛东杰 +1 位作者 孙东红 杨蕙萌 《河南理工大学学报(自然科学版)》 CAS 北大核心 2023年第6期149-156,共8页
为了解决视频行人再识别领域仅使用卷积神经网络进行行人特征提取效果不佳的问题,提出一种基于卷积神经网络和Transformer的ResTNet(ResNet and Transformer network)网络模型。ResTNet利用ResNet50网络得到局部特征,令中间层输出作为Tr... 为了解决视频行人再识别领域仅使用卷积神经网络进行行人特征提取效果不佳的问题,提出一种基于卷积神经网络和Transformer的ResTNet(ResNet and Transformer network)网络模型。ResTNet利用ResNet50网络得到局部特征,令中间层输出作为Transformer的先验知识输入。在Transformer分支中不断缩小特征图尺寸,扩大感受野,充分挖掘局部特征之间的关系,生成行人的全局特征,同时利用移位窗口方法减少模型计算量。在大规模MARS数据集上,Rank-1和mAP分别达到86.8%和80.3%,比基准分别增加了3.8%和3.3%,在2个小规模数据集上也取得了良好效果。在几大数据集上的大量实验表明,本文方法能增强行人识别的鲁棒性,有效提高行人再识别的准确率。 展开更多
关键词 视频行人再识别 卷积神经网络 transformER 局部特征 全局特征
下载PDF
基于十字注意力机制改进U-Transformer的新冠肺炎影像分割
16
作者 史爱武 高睿杨 +2 位作者 黄晋 盛鐾 马淑然 《软件导刊》 2023年第12期209-214,共6页
针对新冠肺炎CT片病灶部分分割检测困难、背景干扰多以及小病灶点易被忽略的问题,提出一种基于注意力机制改进U-Transformer的分割方法。利用注意力机制提升分割精度,修改U-Transformer网络卷积层中间的注意力模块,并提出十字注意力机制... 针对新冠肺炎CT片病灶部分分割检测困难、背景干扰多以及小病灶点易被忽略的问题,提出一种基于注意力机制改进U-Transformer的分割方法。利用注意力机制提升分割精度,修改U-Transformer网络卷积层中间的注意力模块,并提出十字注意力机制,使网络对病灶边缘的分割更为精确。在网络结构中添加全局-局部分割策略,使得对小病灶点的提取更加准确。实验结果表明,改进方法较U-Transformer的精度提高了5.96%,召回率提高了7.11%,样本相似度提高了6.49%,说明改进方法对小病灶点提取具有较好效果。拓展深度学习方法到医疗影像诊断中,有助于放射科医生更快捷、有效地进行病情诊断。 展开更多
关键词 新冠肺炎 影像分割 U-transformer 注意力机制 全局-局部策略
下载PDF
基于弱监督的改进Transformer在人群定位中的应用 被引量:1
17
作者 高辉 邓淼磊 +2 位作者 赵文君 陈法权 张德贤 《计算机工程与应用》 CSCD 北大核心 2023年第19期92-98,共7页
针对现有人群定位方法采用伪边界框或预先设计的定位图,需要复杂的预处理和后处理来获得头部位置的问题,提出一种基于弱监督的端到端人群定位网络LocalFormer。在特征提取阶段,将纯Transformer作为骨干网络,并对每个阶段的特征执行全局... 针对现有人群定位方法采用伪边界框或预先设计的定位图,需要复杂的预处理和后处理来获得头部位置的问题,提出一种基于弱监督的端到端人群定位网络LocalFormer。在特征提取阶段,将纯Transformer作为骨干网络,并对每个阶段的特征执行全局最大池化操作,提取更加丰富的人头细节信息。在编码器-解码器阶段,将聚合特征嵌入位置信息作为编码器的输入,且每个解码器层采用一组可训练嵌入作为查询,并将编码器最后一层的视觉特征作为键和值,解码后的特征用于预测置信度得分。通过二值化模块自适应优化阈值学习器,从而精确地二值化置信度图。在不同数据环境下对三个数据集进行实验,结果表明该方法实现了最佳定位性能。 展开更多
关键词 人群定位 弱监督 卷积神经网络 全局最大池化 视觉transformer
下载PDF
Global motion estimation with Gabor wavelet transform
18
作者 王朋 刘重庆 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2005年第3期645-650,共6页
A novel algorithm of global motion estimation is proposed. First, through Gabor wavelet transform (GWT), a kind of energy distribution of image is obtained and checkpoints are selected according to a probability dec... A novel algorithm of global motion estimation is proposed. First, through Gabor wavelet transform (GWT), a kind of energy distribution of image is obtained and checkpoints are selected according to a probability decision approach proposed. Then, the initialized motion vectors are obtained via a hierarcbal block-matching based on these checkpoints. Finally, by employing a 3-parameter motion model, precise parameters of global motion are found. From the experiment, the algorithm is reliable and robust. 展开更多
关键词 global motion estimation Gabor wavelet transform probability decision block-matching.
下载PDF
基于交叉注意力Transformer的人体姿态估计方法 被引量:1
19
作者 王款 宣士斌 +2 位作者 何雪东 李紫薇 李嘉祥 《计算机工程》 CAS CSCD 北大核心 2023年第7期223-231,共9页
现有用于人体姿态估计的深度卷积网络方法大多采用堆叠Transformer编码器技术,未充分考虑低分辨率全局语义信息,存在模型学习困难、推理成本高等问题。提出基于交叉注意力的Transformer多尺度表征学习方法。利用深度卷积网络获取不同分... 现有用于人体姿态估计的深度卷积网络方法大多采用堆叠Transformer编码器技术,未充分考虑低分辨率全局语义信息,存在模型学习困难、推理成本高等问题。提出基于交叉注意力的Transformer多尺度表征学习方法。利用深度卷积网络获取不同分辨率特征图,将特征图转变为多尺度视觉标记,并且预估关键点在标记空间中的分布提高模型的收敛速度。为增强低分辨率全局语义的可识别性,提出多尺度交叉注意力模块,该模块通过对不同分辨率特征标记之间的多次交互,以及对关键点标记采取移动关键点策略,实现减少关键点标记冗余和交叉融合操作次数,交叉注意力融合模块从特征标记中抽取的不同尺度特征信息形成关键点标记,有助于降低上采样融合的不准确性。在多项基准数据集上的实验结果表明,与当前最先进的TokenPose方法相比,该方法能有效促进Transformer编码器对关键点之间关联关系的学习,在不降低性能的前提下计算代价下降11.8%。 展开更多
关键词 全局语义 多尺度交叉注意力 人体姿态估计 表征学习 交叉注意力融合 transformer编码器
下载PDF
Gershgorin and Rayleigh Bounds on the Eigenvalues of the Finite-Element Global Matrices via Optimal Similarity Transformations
20
作者 Isaac Fried Roberto Riganti Chen Yu 《Applied Mathematics》 2020年第9期922-941,共20页
The large finite element global stiffness matrix is an algebraic, discreet, even-order, differential operator of zero row sums. Direct application of the, practically convenient, readily applied, Gershgorin’s eigenva... The large finite element global stiffness matrix is an algebraic, discreet, even-order, differential operator of zero row sums. Direct application of the, practically convenient, readily applied, Gershgorin’s eigenvalue bounding theorem to this matrix inherently fails to foresee its positive definiteness, predictably, and routinely failing to produce a nontrivial lower bound on the least eigenvalue of this, theoretically assured to be positive definite, matrix. Considered here are practical methods for producing an optimal similarity transformation for the finite-elements global stiffness matrix, following which non trivial, realistic, lower bounds on the least eigenvalue can be located, then further improved. The technique is restricted here to the common case of a global stiffness matrix having only non-positive off-diagonal entries. For such a matrix application of the Gershgorin bounding method may be carried out by a mere matrix vector multiplication. 展开更多
关键词 Finite Elements global Stiffness Matrix Gershgorin and Rayleigh Computed Upper and Lower Bounds on the Extremal Eigenvalues Similarity transformations
下载PDF
上一页 1 2 41 下一页 到第
使用帮助 返回顶部