期刊文献+
共找到3,336篇文章
< 1 2 167 >
每页显示 20 50 100
基于Depth-wise卷积和视觉Transformer的图像分类模型
1
作者 张峰 黄仕鑫 +1 位作者 花强 董春茹 《计算机科学》 CSCD 北大核心 2024年第2期196-204,共9页
图像分类作为一种常见的视觉识别任务,有着广阔的应用场景。在处理图像分类问题时,传统的方法通常使用卷积神经网络,然而,卷积网络的感受野有限,难以建模图像的全局关系表示,导致分类精度低,难以处理复杂多样的图像数据。为了对全局关... 图像分类作为一种常见的视觉识别任务,有着广阔的应用场景。在处理图像分类问题时,传统的方法通常使用卷积神经网络,然而,卷积网络的感受野有限,难以建模图像的全局关系表示,导致分类精度低,难以处理复杂多样的图像数据。为了对全局关系进行建模,一些研究者将Transformer应用于图像分类任务,但为了满足Transformer的序列化和并行化要求,需要将图像分割成大小相等、互不重叠的图像块,破坏了相邻图像数据块之间的局部信息。此外,由于Transformer具有较少的先验知识,模型往往需要在大规模数据集上进行预训练,因此计算复杂度较高。为了同时建模图像相邻块之间的局部信息并充分利用图像的全局信息,提出了一种基于Depth-wise卷积的视觉Transformer(Efficient Pyramid Vision Transformer,EPVT)模型。EPVT模型可以实现以较低的计算成本提取相邻图像块之间的局部和全局信息。EPVT模型主要包含3个关键组件:局部感知模块(Local Perceptron Module,LPM)、空间信息融合模块(Spatial Information Fusion,SIF)和“+卷积前馈神经网络(Convolution Feed-forward Network,CFFN)。LPM模块用于捕获图像的局部相关性;SIF模块用于融合相邻图像块之间的局部信息,并利用不同图像块之间的远距离依赖关系,提升模型的特征表达能力,使模型学习到输出特征在不同维度下的语义信息;CFFN模块用于编码位置信息和重塑张量。在图像分类数据集ImageNet-1K上,所提模型优于现有的同等规模的视觉Transformer分类模型,取得了82.6%的分类准确度,证明了该模型在大规模数据集上具有竞争力。 展开更多
关键词 深度学习 图像分类 Depth-wise卷积 视觉Transformer 注意力机制
下载PDF
多区域注意力的细粒度图像分类网络
2
作者 白尚旺 王梦瑶 +1 位作者 胡静 陈志泊 《计算机工程》 CSCD 北大核心 2024年第1期271-278,共8页
目前细粒度图像分类的难点在于如何精准定位图像中高度可辨的局部区域以及其他辅助判别特征。提出一种多区域注意力的细粒度图像分类网络来解决这个问题。首先使用Inception-V3对图像特征进行提取,通过重复使用注意力擦除的方法使模型... 目前细粒度图像分类的难点在于如何精准定位图像中高度可辨的局部区域以及其他辅助判别特征。提出一种多区域注意力的细粒度图像分类网络来解决这个问题。首先使用Inception-V3对图像特征进行提取,通过重复使用注意力擦除的方法使模型关注次要特征;然后通过背景去除以及上采样的方法获取图像更精准的局部图像,对提取到的局部特征进行位置统计,并以矩形框的方式获取图像整体,减少细节信息丢失;最后对局部与整体图像进行更加细致的学习。此外,设计联合损失函数,通过动态平衡难易样本和缩小类内差距的方法改善模型的识别效果。实验结果表明,该方法在公开的细粒度图像数据集CUB-200-2011、Stanford-Cars和FGVC-Aircraft上的准确率分别达到89.2%、94.8%、94.0%,相较于对比方法性能更优。 展开更多
关键词 多区域注意力 细粒度图像分类 擦除策略 联合损失 深度学习 卷积神经网络
下载PDF
基于任务感知关系网络的少样本图像分类
3
作者 郭礼华 王广飞 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第3期977-985,共9页
针对关系网络(RN)模型缺乏对分类任务整体相关信息的感知能力的问题,该文提出基于任务感知关系网络(TARN)的小样本学习(FSL)算法。引入模糊C均值(FCM)聚类生成基于任务全局分布的类别原型,同时设计任务相关注意力机制(TCA),改进RN中的1... 针对关系网络(RN)模型缺乏对分类任务整体相关信息的感知能力的问题,该文提出基于任务感知关系网络(TARN)的小样本学习(FSL)算法。引入模糊C均值(FCM)聚类生成基于任务全局分布的类别原型,同时设计任务相关注意力机制(TCA),改进RN中的1对1度量方式,使得在与类别原型对比时,局部特征聚合了任务全局信息。和RN比,在数据集Mini-ImageNet上,5-way 1-shot和5-way 5-shot设置中的分类准确率分别提高了8.15%和7.0%,在数据集Tiered-ImageNet上,5-way 1-shot和5-way 5-shot设置中的分类准确率分别提高了7.81%和6.7%。与位置感知的关系网络模型比,在数据集Mini-ImageNet上,5-way 1-shot设置中分类准确率也提高了1.24%。与其他小样本图像分类算法性能比较,TARN模型在两个数据集上都获得了最佳的识别精度。该方法将任务相关信息和度量网络模型进行结合可以有效提高小样本图像分类准确率。 展开更多
关键词 小样本学习 图像分类 度量学习 任务感知 关系网络
下载PDF
基于多尺度非对称密集网络的高光谱图像分类
4
作者 蔡轶珩 谭美伶 +1 位作者 潘建军 何楷祺 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第4期1448-1457,共10页
近年来,基于有限标记样本的高光谱图像(HSI)分类方法取得了重大进展。然而,由于高光谱图像的特殊性,冗余的信息和有限的标记样本给提取强判别特征带来了巨大挑战。此外,由于各类别像素分布不均,如何强化中心像素的作用,减弱不同类别的... 近年来,基于有限标记样本的高光谱图像(HSI)分类方法取得了重大进展。然而,由于高光谱图像的特殊性,冗余的信息和有限的标记样本给提取强判别特征带来了巨大挑战。此外,由于各类别像素分布不均,如何强化中心像素的作用,减弱不同类别的周围像素的负面影响也是提高分类性能的关键。为了克服上述局限性,该文提出一种基于多尺度非对称密集网络(MS-ADNet)的高光谱图像分类方法。首先,提出一个多尺度样本构建模块,通过在每个像素周围提取多个尺度的图像块,并进行反卷积和拼接以构建输入样本,使其既包含详细的结构区域,又包含较大的同质区域;然后,提出一个非对称密集连接结构,在空间和光谱特征联合提取中实现核骨架增强,即增强了方形卷积核的中心十字区域部分提取的特征,有效地促进了特征重用。此外,为了提高光谱特征的鉴别性,提出一种精简的元素光谱注意力机制,并将其置于密集连接网络的前端和后端。在每类仅采用5个样本进行网络训练的情况下,该方法在Indiana Pines, Pavia University和Salinas数据集上的总体准确率分别达到了77.66%, 84.54%和92.39%,取得了极具竞争力的分类结果。 展开更多
关键词 高光谱图像分类 多尺度 非对称卷积 光谱注意力机制
下载PDF
采用特征图增强原型的小样本图像分类方法
5
作者 许华杰 梁书伟 《计算机科学与探索》 CSCD 北大核心 2024年第4期990-1000,共11页
在基于度量学习的小样本图像分类方法中,由于标注样本的稀缺,仅用支持集样本得到的类原型往往难以代表整个类别的真实分布;同时,同类样本间也可能在多个方面存在较大差异,较大的类内差异可能使样本特征偏离类别中心。针对上述可能严重... 在基于度量学习的小样本图像分类方法中,由于标注样本的稀缺,仅用支持集样本得到的类原型往往难以代表整个类别的真实分布;同时,同类样本间也可能在多个方面存在较大差异,较大的类内差异可能使样本特征偏离类别中心。针对上述可能严重影响图像分类性能的问题,提出一种采用特征图增强原型的小样本图像分类方法(FMEP)。首先,用余弦相似度从查询集样本特征图中选择部分相似特征加入类原型中,得到更具代表性的特征图增强原型;其次,对相似的查询集样本特征进行聚合,缓解类内差异大导致的问题,使同类样本的特征分布更接近;最后,用在特征空间中与真实类别分布都更接近的特征图增强原型和聚合查询特征进行相似度比较得到更优的分类结果。所提方法在MiniImageNet、TieredImageNet、CUB-200和CIFAR-FS等常用的小样本图像分类数据集上进行了实验,结果表明所提方法获得了比基线模型更优的分类性能,同时也优于同类型的小样本图像分类方法。 展开更多
关键词 小样本学习 图像分类 度量学习 特征图增强原型 余弦相似度
下载PDF
面向图像分类的视觉Transformer研究进展 被引量:1
6
作者 彭斌 白静 +2 位作者 李文静 郑虎 马向宇 《计算机科学与探索》 CSCD 北大核心 2024年第2期320-344,共25页
Transformer是一种基于自注意力机制的深度学习模型,在计算机视觉中展现出巨大的潜力。而在图像分类任务中,关键的挑战是高效而准确地捕捉输入图片的局部和全局特征。传统方法使用卷积神经网络的底层提取其局部特征,并通过卷积层堆叠扩... Transformer是一种基于自注意力机制的深度学习模型,在计算机视觉中展现出巨大的潜力。而在图像分类任务中,关键的挑战是高效而准确地捕捉输入图片的局部和全局特征。传统方法使用卷积神经网络的底层提取其局部特征,并通过卷积层堆叠扩大感受野以获取图像的全局特征。但这种策略在相对短的距离内聚合信息,难以建立长期依赖关系。相比之下,Transformer的自注意力机制通过直接比较特征在所有空间位置上的相关性,捕捉了局部和全局的长距离依赖关系,具备更强的全局建模能力。因此,深入探讨Transformer在图像分类任务中的问题是非常有必要的。首先以Vision Transformer为例,详细介绍了Transformer的核心原理和架构。然后以图像分类任务为切入点,围绕与视觉Transformer研究中的性能提升、计算成本和训练优化相关的三个重要方面,总结了视觉Transformer研究中的关键问题和最新进展。此外,总结了Transformer在医学图像、遥感图像和农业图像等多个特定领域的应用情况。这些领域中的应用展示了Transformer的多功能性和通用性。最后,通过综合分析视觉Transformer在图像分类方面的研究进展,对视觉Transformer的未来发展方向进行了展望。 展开更多
关键词 深度学习 视觉Transformer 网络架构 图像分类 自注意力机制
下载PDF
LNG-Transformer:基于多尺度信息交互的图像分类网络
7
作者 王文杰 杨燕 +2 位作者 敬丽丽 王杰 刘言 《计算机科学》 CSCD 北大核心 2024年第2期189-195,共7页
鉴于Transformer的Self-Attention机制具有优秀的表征能力,许多研究者提出了基于Self-Attention机制的图像处理模型,并取得了巨大成功。然而,基于Self-Attention的传统图像分类网络无法兼顾全局信息和计算复杂度,限制了Self-Attention... 鉴于Transformer的Self-Attention机制具有优秀的表征能力,许多研究者提出了基于Self-Attention机制的图像处理模型,并取得了巨大成功。然而,基于Self-Attention的传统图像分类网络无法兼顾全局信息和计算复杂度,限制了Self-Attention的广泛应用。文中提出了一种有效的、可扩展的注意力模块Local Neighbor Global Self-Attention(LNG-SA),该模块在任意时期都能进行局部信息、邻居信息和全局信息的交互。通过重复级联LNG-SA模块,设计了一个全新的网络,称为LNG-Transformer。该网络整体采用层次化结构,具有优秀的灵活性,其计算复杂度与图像分辨率呈线性关系。LNG-SA模块的特性使得LNG-Transformer即使在早期的高分辨率阶段,也可以进行局部信息、邻居信息和全局信息的交互,从而带来更高的效率、更强的学习能力。实验结果表明,LNG-Transformer在图像分类任务中具有良好的性能。 展开更多
关键词 图像分类 自注意力机制 多尺度 TRANSFORMER
下载PDF
整合卷积与高效自注意力机制的图像分类模型
8
作者 田鑫驰 王亚刚 +1 位作者 尹钟 陈浩 《小型微型计算机系统》 CSCD 北大核心 2024年第3期684-691,共8页
对于传统的图像分类网络而言,卷积神经网络受限于较小且固定的感受野使其忽略了感受野之外的图像特征信息.基于Transformer模型灵活的多头自注意力机制使得其必须依赖于巨大的数据量以减少过拟合的风险,导致模型参数与计算复杂度过于庞... 对于传统的图像分类网络而言,卷积神经网络受限于较小且固定的感受野使其忽略了感受野之外的图像特征信息.基于Transformer模型灵活的多头自注意力机制使得其必须依赖于巨大的数据量以减少过拟合的风险,导致模型参数与计算复杂度过于庞大.针对上述问题本文提出了一种名为CSNet的多阶段图像分类模型.在模型浅层阶段利用大核卷积分解的思想扩大卷积层感受野以学习较大范围的特征信息.在深层阶段利用一种高效的自注意力机制,将卷积运算的特性加入自注意力机制中,有效减少了原始自注意力机制局部计算冗余和过分依赖数据的问题.CSNet在CIFAR-10和ImageNet-1K数据集上的分类准确率分别达到98.9%和82.6%,实验表明CSNet的模型性能优于ResNet和Vision Transformer. 展开更多
关键词 卷积神经网络 TRANSFORMER 自注意力机制 卷积分解 图像分类 CSNet
下载PDF
双分支多维注意特征融合的高光谱图像分类
9
作者 马亚美 王双亭 都伟冰 《计算机工程与应用》 CSCD 北大核心 2024年第7期192-203,共12页
为改善高光谱图像小样本类别的分类性能,提高模型特征表达的稳健性,提出了双分支多维注意力特征融合的神经网络分类模型(DBMD)。DBMD采用两个分支分别进行光谱特征提取和混合特征提取。光谱分支通过密集连接的扩张卷积逐级提取特征,然... 为改善高光谱图像小样本类别的分类性能,提高模型特征表达的稳健性,提出了双分支多维注意力特征融合的神经网络分类模型(DBMD)。DBMD采用两个分支分别进行光谱特征提取和混合特征提取。光谱分支通过密集连接的扩张卷积逐级提取特征,然后融合低、中、高级语义信息作为特征输出。混合分支采用3D-2D网络架构,并通过改进的Inception块提取空间尺度特征。此外,注意力机制分别应用于光谱、空间和空谱特征,进行特征细化,增强重要区域的特征响应。最后,将不同维度的细化特征联合输入至分类器进行分类。在Indian Pines和Salinas Valley数据集上利用5%和1%的样本进行实验,分别取得了98.40%和99.78%的总体精度,与其他六种网络架构相比,该模型在准确性和稳定性上都具有更优的表现。 展开更多
关键词 混合特征提取 注意力机制 多维特征融合 图像分类
下载PDF
基于多注意力机制与编译图神经网络的高光谱图像分类
10
作者 孙杰 杨静 +2 位作者 丁书杰 李少波 胡建军 《农业机械学报》 EI CAS CSCD 北大核心 2024年第3期183-192,212,共11页
针对高光谱图像(Hyperspectral image,HSI)分类研究中小样本学习时,无法达到理想分类效果的问题,以多注意力机制融合、编译图神经网络与卷积神经网络有机结合提出了一种新的高光谱图像分类方法。设计了一种基于混合注意力机制的网络(Mul... 针对高光谱图像(Hyperspectral image,HSI)分类研究中小样本学习时,无法达到理想分类效果的问题,以多注意力机制融合、编译图神经网络与卷积神经网络有机结合提出了一种新的高光谱图像分类方法。设计了一种基于混合注意力机制的网络(Multiple mixed attention convolutional neural network,MCNN)与编译图神经网络(Compiled graph neural network,CGNN),在学习样本有限的情况下,其能有效保留HSI的光谱与空间信息。引入的图编码器与图解码器可以有效地映射不规则的HSI地物类别特征信息。设计的多注意力机制可以重点关注一些重要的空间像素特征。研究了不同训练样本下对不同算法学习示例分类的影响,在公共数据集Botswana(BS)的实验表明,本文方法比CEGCN(CNN-enhanced graph convolutional network)、WFCG(Weighted feature fusion of convolutional neural network)算法总体分类精度(Overall classification accuracy,OA)分别高2.72、3.86个百分点。同样在IndianPines(IP)数据集上仅用3%训练样本数据的实验结果显示,本研究方法比CEGCN与WFCG算法的OA分别高0.44、1.42个百分点。说明本研究提出的方法不仅对HSI具有良好的空间与光谱信息感知能力,而且在微小学习数据下仍然表现出强有力的分类准确性。 展开更多
关键词 高光谱图像分类 图神经网络 注意力机制 超像素分割
下载PDF
基于改进DPGN的少样本图像分类算法研究
11
作者 王玲 孙莹 +1 位作者 王鹏 白燕娥 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第2期161-169,共9页
DPGN(distribution propagation graph network)是基于深度学习的少样本图像分类算法,在数据稀疏的条件下可以顺利完成图像分类,但其分类的准确率仍需进一步提升。以DPGN算法为研究对象,提出SFOD_DPGN(SinAM_FRN_layer_ODConv_DM&EM... DPGN(distribution propagation graph network)是基于深度学习的少样本图像分类算法,在数据稀疏的条件下可以顺利完成图像分类,但其分类的准确率仍需进一步提升。以DPGN算法为研究对象,提出SFOD_DPGN(SinAM_FRN_layer_ODConv_DM&EMD_distribution propagation graph network)算法。在骨干神经网络Resnet12的残差块中融入注意力机制;将Resnet12网络中批量归一化与ReLu激活函数搭配使用的方式改为滤波器响应归一化与阈值线性单元激活函数搭配使用的方式;在分类器模块中选用全维动态卷积替换普通卷积;使用马氏距离和推土机距离替换L2距离度量函数。在CUB-200-2011数据集上的实验表明,在5way-1shot和5way-5shot分类任务下,SFOD_DPGN算法比DPGN算法的准确率提升约7.97%和2.66%。 展开更多
关键词 深度学习 少样本图像分类 注意力机制 全维动态卷积 马氏距离 推土机距离
下载PDF
基于ZYNQ平台的图像分类加速器设计与实现
12
作者 周扬维 尹震宇 +3 位作者 王军 张飞青 徐光远 徐福龙 《小型微型计算机系统》 CSCD 北大核心 2024年第1期224-229,共6页
随着信息技术的不断发展,机器视觉技术已被广泛应用于智能产线.智能制造生产过程中工件种类多、外观相似性高,而传统分拣方式速度慢、准确率低,已无法满足智能化生产的要求.采用机器视觉技术来解决智能产线中的工件分类问题已成为当前... 随着信息技术的不断发展,机器视觉技术已被广泛应用于智能产线.智能制造生产过程中工件种类多、外观相似性高,而传统分拣方式速度慢、准确率低,已无法满足智能化生产的要求.采用机器视觉技术来解决智能产线中的工件分类问题已成为当前智能制造领域的热点.为提高智能产线中工件分类的效率,本文设计并实现了一种基于ZYNQ平台的图像分类加速器.针对现有的卷积神经网络模型参数量大、难以部署到资源有限的嵌入式平台的问题,提出一种参数量较少、易于在嵌入式平台部署的图像分类网络SortNet;针对卷积神经网络在嵌入式平台速度慢的问题,设计了一种卷积与激活函数同构化的处理单元(CAFI-PE)以及一种基于流水线的数据调用方法(PDCM),提高了卷积计算的速度.实验结果表明,本文提出的图像分类加速器对224×224大小的灰度图像处理速度可达40.98fps,而功耗仅为2.305W,能够满足智能产线对工件分类速度和功耗的要求. 展开更多
关键词 机器视觉 图像分类 卷积神经网络 CAFI-PE PDCM
下载PDF
基于图像分类网络的非侵入式负荷辨识算法的运算成本优化
13
作者 杨舒惠 黎静华 韦善阳 《电力自动化设备》 EI CSCD 北大核心 2024年第1期141-146,共6页
目前基于图像分类网络的非侵入式负荷辨识算法可达到较高的辨识准确率,但存在较严重的参数冗余,引发了不必要的运算成本。对此类算法的运算成本进行优化,提出一种基于灰色编码的设备特征组合方法,以减少算法中设备特征的参数冗余;然后... 目前基于图像分类网络的非侵入式负荷辨识算法可达到较高的辨识准确率,但存在较严重的参数冗余,引发了不必要的运算成本。对此类算法的运算成本进行优化,提出一种基于灰色编码的设备特征组合方法,以减少算法中设备特征的参数冗余;然后使用轻量级图像分类网络ZFNet构建设备辨识模型,并引入Inception模块来减少模型中卷积层输出的参数冗余,同时基于仿真实验结果对模型中全连接层的结构和参数进行适应性调整,以减少模型的参数冗余,最后使用PLAID数据集进行算例分析。结果表明:相比于同类算法,所提算法在设备特征的参数量上减少了66.7%~67.5%,在模型的参数量上减少了90%~97.1%,在整体运算量上的变动为-91.7%~6.1%。 展开更多
关键词 非侵入式负荷监测 图像分类网络 灰度图 特征组合 设备辨识
下载PDF
针对图像分类的鲁棒物理域对抗伪装
14
作者 段晔鑫 贺正芸 +5 位作者 张颂 詹达之 王田丰 林庚右 张锦 潘志松 《电子学报》 EI CAS CSCD 北大核心 2024年第3期863-871,共9页
深度学习模型对对抗样本表现出脆弱性.作为一种对现实世界深度系统更具威胁性的攻击形式,物理域对抗样本近年来受到了广泛的研究关注.现有方法大多利用局部对抗贴片噪声在物理域实现对图像分类模型的攻击,然而二维贴片在三维空间的攻击... 深度学习模型对对抗样本表现出脆弱性.作为一种对现实世界深度系统更具威胁性的攻击形式,物理域对抗样本近年来受到了广泛的研究关注.现有方法大多利用局部对抗贴片噪声在物理域实现对图像分类模型的攻击,然而二维贴片在三维空间的攻击效果将由于视角变化而不可避免地下降.为了解决这一问题,所提Adv-Camou方法利用空间组合变换来实时生成任意视角及变换背景的训练样本,并最小化预测类与目标类交叉熵损失,使模型输出指定错误类别.此外,所建立的仿真三维场景能公平且可重复地评估不同的攻击.实验结果表明,Adv-Camou生成的一体式对抗伪装可在全视角欺骗智能图像分类器,在三维仿真场景比多贴片拼接纹理平均有目标攻击成功率高出25%以上,对Clarifai商用分类系统黑盒有目标攻击成功率达42%,此外3D打印模型实验在现实世界平均攻击成功率约为66%,展现出先进的攻击性能. 展开更多
关键词 对抗样本 对抗伪装 对抗攻击 图像分类 深度神经网络
下载PDF
基于层一致性平均教师模型的半监督岩石薄片图像分类
15
作者 严子杰 王杨 +1 位作者 陈雁 张翀 《应用科学学报》 CAS CSCD 北大核心 2024年第1期27-38,共12页
传统的岩石薄片图像分类依赖于大量人工标记的图像样本,这种方式受制于标记人员的经验和能力,且无法通过不断增加的未标记岩石薄片图像样本实现分类能力的可扩展式增强。该文提出的在平均教师(mean teacher, MT)模型的基础上,通过在无... 传统的岩石薄片图像分类依赖于大量人工标记的图像样本,这种方式受制于标记人员的经验和能力,且无法通过不断增加的未标记岩石薄片图像样本实现分类能力的可扩展式增强。该文提出的在平均教师(mean teacher, MT)模型的基础上,通过在无监督损失中添加层一致性正则化项的方式约束师生模型的层次结构,实现对未标记数据信息的有效利用。消融实验和层一致性平均教师(hierarchy consistency mean teacher, HCMT)模型对比实验结果表明,层一致性正则化方法利用了未标记数据的有效信息,提升了MT模型的分类效果,使得HCMT模型可以在半标记数据集中获得如全标记数据集相似的分类能力。该实验表明,半监督学习模型利用大量未标记岩石薄片图像数据可以提升模型分类的能力。 展开更多
关键词 半监督学习 平均教师模型 岩石薄片图像分类 层一致性方法
下载PDF
基于局部正交特征融合的小样本图像分类
16
作者 涂泽良 程良伦 黄国恒 《广东工业大学学报》 CAS 2024年第2期73-83,共11页
针对目前基于度量学习的小样本图像分类方法中难以充分提取重要特征问题,提出一种基于局部正交特征融合的小样本图像分类方法。首先,利用特征提取网络同时提取局部细节丰富的浅层特征和语义化强的深层特征;然后,通过一个通道注意力模块... 针对目前基于度量学习的小样本图像分类方法中难以充分提取重要特征问题,提出一种基于局部正交特征融合的小样本图像分类方法。首先,利用特征提取网络同时提取局部细节丰富的浅层特征和语义化强的深层特征;然后,通过一个通道注意力模块和一个多尺度特征自适应融合模块分别在浅层特征的通道维度和空间尺度上进行特征增强,以生成更显著且包含更多尺度信息的局部特征。最后,通过一个局部正交特征融合模块对得到的多尺度局部特征和初始深层语义特征进行局部正交特征提取和注意力融合,以充分利用图像的局部和全局特征信息,生成更能代表目标类别的特征表示。在miniImageNet、tieredImageNet和CUB-200-2011三个公开数据集上的实验结果表明:提出的方法可以获得更好的分类效果,在5way-5shot任务上的准确率分别达到81.69%、85.36%和89.78%,与baseline模型相比,分类准确率分别提升5.23%、3.19%和5.99%。 展开更多
关键词 图像分类 小样本学习 多尺度特征 注意力机制 特征融合
下载PDF
基于对比学习MocoV2的COVID-19图像分类
17
作者 许跃雯 李明 李莉 《计算机与现代化》 2024年第2期81-87,126,共8页
肺炎是一种常见多发感染性疾病,老年人和免疫力较弱者容易感染,尽早发现有助于后期治疗。肺部病变的位置、密度和清晰度等因素会影响肺炎图像分类的准确性。随着深度学习的发展,卷积神经网络被广泛应用于医学图像分类任务中,然而网络的... 肺炎是一种常见多发感染性疾病,老年人和免疫力较弱者容易感染,尽早发现有助于后期治疗。肺部病变的位置、密度和清晰度等因素会影响肺炎图像分类的准确性。随着深度学习的发展,卷积神经网络被广泛应用于医学图像分类任务中,然而网络的学习能力依赖训练样本的数量和标签。针对电子计算机断层扫描(Computed Tomography,CT)的肺炎图像分类研究,提出一种基于自监督对比学习的网络模型(MCLSE),可以从无标记的数据中学习特征,提高网络模型的准确率。本文模型(MCLSE)首先设计辅助任务,从无标记的图像中挖掘表征完成预训练,提高模型在向量空间中学习数据映射关系的能力。其次,使用卷积神经网络提取特征,为了有效捕获更高层次的特征信息选择SENet网络改进分类模型,建模特征通道的相关性。最后,用训练好的权重加载改进后的分类模型中,下游任务中使用标记数据再次训练网络。在公开数据集SARS-CoV-2 CT和CT Scans for COVID-19 Classification上进行实验,实验结果表明MCLSE对整体样本分类的准确率分别达到99.19%和99.75%,较主流模型有很大提升。 展开更多
关键词 COVID-19图像 医学图像分类 卷积神经网络 自监督学习 对比学习
下载PDF
面向移动端图像分类的轻量级CNN优化
18
作者 张晓青 刘小舟 陈登 《计算机工程与设计》 北大核心 2024年第2期436-442,共7页
为解决图像分类算法由于计算量大和参数冗余难以应用在存储空间与计算能力受限的移动设备上的问题,提出一种轻量的卷积计算模块Extremely Lightweight Block(ELBlock),采用逐点卷积叠加深度可分离卷积的方法,对逐点卷积进行分组,增加相... 为解决图像分类算法由于计算量大和参数冗余难以应用在存储空间与计算能力受限的移动设备上的问题,提出一种轻量的卷积计算模块Extremely Lightweight Block(ELBlock),采用逐点卷积叠加深度可分离卷积的方法,对逐点卷积进行分组,增加相邻层过滤器之间的对角相关性,进一步降低卷积操作的计算复杂度;利用通道混洗关联输入和输出通道,提高特征的信息表达能力;基于ELBlock设计一个极其轻量的小型神经网络架构ELNet,结构更加简洁、高效。在Android手机上的实验结果表明,所提ELNet在保证分类精度的同时,具有计算量小、参数少和推理时间短的优点。 展开更多
关键词 深度学习 图像分类 轻量级神经网络 模型优化 模型压缩 模型部署 移动终端
下载PDF
弱监督学习算法下土地光学遥感图像分类
19
作者 杨锋 王秀丽 +1 位作者 周雨石 高松峰 《计算机仿真》 2024年第3期41-44,97,共5页
由于土地细节特征较多,类型复杂多样,图像采集难度较大,在不同的时间和区域,土地特征也会发生变化,因此土地分类过程较为复杂。针对以上问题,提出基于弱监督学习的土地光学遥感图像分类方法。利用伪中值滤波法去除光学遥感图像噪声,并... 由于土地细节特征较多,类型复杂多样,图像采集难度较大,在不同的时间和区域,土地特征也会发生变化,因此土地分类过程较为复杂。针对以上问题,提出基于弱监督学习的土地光学遥感图像分类方法。利用伪中值滤波法去除光学遥感图像噪声,并通过模糊对比度增强法增强图像对比度;基于此,利用弱监督定位网络获取图像的感兴趣示例,并将子概念层引入多示例聚合网络计算感兴趣示例和标签之间的匹配分数,实现土地图像分类。实验结果表明,上述方法的土地分类准确,且Kappa系数更接近于1,说明所提方法应用性能较优。 展开更多
关键词 弱监督学习 遥感图像分类 伪中值滤波 模糊对比度 子概念学习
下载PDF
基于多模型融合的细粒度图像分类算法
20
作者 王宁 李宝山 《内蒙古科技大学学报》 CAS 2024年第1期77-81,共5页
针对细粒度图像分类中单模型方法泛化能力不足问题,提出了一种用于细粒度图像分类的动态权重多模型融合方法。该方法使用基于注意力机制的网络模型作为参与融合的子模型,同时在模型训练过程中,提出了权重自适应调整算法。该算法能够根... 针对细粒度图像分类中单模型方法泛化能力不足问题,提出了一种用于细粒度图像分类的动态权重多模型融合方法。该方法使用基于注意力机制的网络模型作为参与融合的子模型,同时在模型训练过程中,提出了权重自适应调整算法。该算法能够根据子模型在每次训练中的实际表现和自适应的调整其权重值,保证模型整体达到最优状态。实验结果表明:相较于传统的单模型方法,此方法在提升分类效果的同时模型性能也更加稳定,而且在复杂背景分类任务中表现优异,现实意义更强。 展开更多
关键词 图像分类 细粒度 多模型融合 动态权重 注意力机制
下载PDF
上一页 1 2 167 下一页 到第
使用帮助 返回顶部