期刊文献+
共找到369篇文章
< 1 2 19 >
每页显示 20 50 100
基于CenterNet的多教师联合知识蒸馏
1
作者 刘绍华 杜康 +1 位作者 佘春东 杨傲 《系统工程与电子技术》 EI CSCD 2024年第4期1174-1184,共11页
介绍了一种基于轻量化CenterNet的多教师联合知识蒸馏方案。所提方案能有效解决模型轻量化带来的性能恶化问题,可以显著缩小教师模型和学生模型之间的性能差距。将大规模复杂模型作为教师模型,指导训练轻量化学生模型。相比于模型的传... 介绍了一种基于轻量化CenterNet的多教师联合知识蒸馏方案。所提方案能有效解决模型轻量化带来的性能恶化问题,可以显著缩小教师模型和学生模型之间的性能差距。将大规模复杂模型作为教师模型,指导训练轻量化学生模型。相比于模型的传统训练方案,使用所提知识蒸馏训练方案可以在相同的训练轮数后使轻量化模型达到更优的检测性能。主要贡献是提出了适用于CenterNet目标检测网络的新型知识蒸馏训练方案——多教师联合知识蒸馏。在后续实验中,进一步引入了蒸馏注意力机制,从而优化了多教师联合知识蒸馏的训练效果。在VOC2007数据集(Visual Object Classes 2007 Dataset)上,以MobileNetV2轻量化网络作为主干网络为例,相较于传统的CenterNet(主干网络为ResNet50),所提方案在参数量指标上压缩了74.7%,推理速度提升了70.5%,在平均精度上只有1.99的降低,取得了更好的“性能-速度”平衡。实验证明,同样经过100轮训练,使用多教师联合知识蒸馏训练方案的轻量化模型相较于普通训练方案,平均精度提升了11.30。 展开更多
关键词 轻量化 知识蒸馏 注意力机制 联合训练
下载PDF
CheatKD:基于毒性神经元同化的知识蒸馏后门攻击方法
2
作者 陈晋音 李潇 +3 位作者 金海波 陈若曦 郑海斌 李虎 《计算机科学》 CSCD 2024年第3期351-359,共9页
深度学习模型性能不断提升,但参数规模也越来越大,阻碍了其在边缘端设备的部署应用。为了解决这一问题,研究者提出了知识蒸馏(Knowledge Distillation,KD)技术,通过转移大型教师模型的“暗知识”快速生成高性能的小型学生模型,从而实现... 深度学习模型性能不断提升,但参数规模也越来越大,阻碍了其在边缘端设备的部署应用。为了解决这一问题,研究者提出了知识蒸馏(Knowledge Distillation,KD)技术,通过转移大型教师模型的“暗知识”快速生成高性能的小型学生模型,从而实现边缘端设备的轻量部署。然而,在实际场景中,许多教师模型是从公共平台下载的,缺乏必要的安全性审查,对知识蒸馏任务造成威胁。为此,我们首次提出针对特征KD的后门攻击方法CheatKD,其嵌入在教师模型中的后门,可以在KD过程中保留并转移至学生模型中,进而间接地使学生模型中毒。具体地,在训练教师模型的过程中,CheatKD初始化一个随机的触发器,并对其进行迭代优化,以控制教师模型中特定蒸馏层的部分神经元(即毒性神经元)的激活值,使其激活值趋于定值,以此实现毒性神经元同化操作,最终使教师模型中毒并携带后门。同时,该后门可以抵御知识蒸馏的过滤被传递到学生模型中。在4个数据集和6个模型组合的实验上,CheatKD取得了85%以上的平均攻击成功率,且对于多种蒸馏方法都具有较好的攻击泛用性。 展开更多
关键词 后门攻击 深度学习 知识蒸馏 鲁棒性
下载PDF
基于知识蒸馏的不平衡数据下入侵检测方法研究
3
作者 董国芳 刘兵 鲁烨堃 《云南民族大学学报(自然科学版)》 CAS 2024年第2期219-224,共6页
基于深度学习的网络入侵检测模型面临模型结构复杂、部署效率低及流量数据类别不平衡的问题.针对这些问题,提出了1种结合知识蒸馏和类别权重焦点损失的网络入侵检测方法.该方法以精度高、参数量较多的入侵检测模型作为教师模型,与小型... 基于深度学习的网络入侵检测模型面临模型结构复杂、部署效率低及流量数据类别不平衡的问题.针对这些问题,提出了1种结合知识蒸馏和类别权重焦点损失的网络入侵检测方法.该方法以精度高、参数量较多的入侵检测模型作为教师模型,与小型学生模型生成蒸馏损失;引入增加类别权重的焦点损失函数作为学生损失;结合蒸馏损失与学生损失生成总的损失函数优化学生模型.实验结果表明,该方法性能相较于非蒸馏模型在各项指标上均有一定提升. 展开更多
关键词 入侵检测 深度学习 知识蒸馏 不平衡数据 焦点损失
下载PDF
基于类间排名相关性的解耦知识蒸馏
4
作者 陈颖 朱子奇 +1 位作者 徐仕成 李敏 《计算机技术与发展》 2024年第1期52-58,共7页
知识蒸馏(KD)从提出到现在已经取得了很大的成功,不过很多蒸馏策略都是把目光放在了中间层的特征,反而忽略了logit蒸馏的可发展性。解耦知识蒸馏(DKD)的提出使得logit蒸馏重回大众视野。不论是知识蒸馏还是解耦知识蒸馏,都是使用了强一... 知识蒸馏(KD)从提出到现在已经取得了很大的成功,不过很多蒸馏策略都是把目光放在了中间层的特征,反而忽略了logit蒸馏的可发展性。解耦知识蒸馏(DKD)的提出使得logit蒸馏重回大众视野。不论是知识蒸馏还是解耦知识蒸馏,都是使用了强一致性约束条件从而导致蒸馏效果次优,特别是在教师网络和学生网络架构悬殊时这种现象尤为突出。针对这个问题,提出了基于类间排名关系一致性的方法。该方法保留教师和学生非目标类预测间的关系,利用类间的排名相关性作为知识蒸馏模型中代理损失和评价指标之间的关系,从而进行教师网络与学生网络的关系匹配。该方法把这种较为轻松的关系匹配扩展到解耦知识蒸馏中,并在数据集CIFAR-100和ImageNet-1K进行验证。实验结果表明,该方法对于CIFAR-100的分类准确率达到了77.38%,比基准方法提高了0.93百分点,提高了解耦知识蒸馏图像分类的效果,证明了方法的有效性。同时,对比实验的结果证明该方法更具有竞争力。 展开更多
关键词 知识蒸馏 解耦知识蒸馏 强一致性约束 关系匹配 排名相关性
下载PDF
基于剪枝与知识蒸馏的轻量级人像抠图方法
5
作者 程航 徐树公 《工业控制计算机》 2024年第1期91-93,共3页
近年来,随着人像抠图技术的广泛应用,对其实时性与精度的要求也逐渐提高。现有轻量级方法在精度上难以得到保证,而精度更高的方法往往使用较大的网络结构,无法满足实时性需求。为了解决这一问题,提出了一种基于剪枝与知识蒸馏的轻量级... 近年来,随着人像抠图技术的广泛应用,对其实时性与精度的要求也逐渐提高。现有轻量级方法在精度上难以得到保证,而精度更高的方法往往使用较大的网络结构,无法满足实时性需求。为了解决这一问题,提出了一种基于剪枝与知识蒸馏的轻量级人像抠图方法。该方法首先通过网络剪枝来获得一个轻量级学生网络结构,随后使用该学生网络进行知识蒸馏。实验证明,该方法可以在保证模型精度的前提下有效减少参数量和推理耗时,且相较现有的轻量级人像抠图方法具有更少的参数量和更高的精度。 展开更多
关键词 神经网络 图像抠图 网络剪枝 知识蒸馏
下载PDF
基于知识蒸馏改进双路BERT的经济类文本情感分析
6
作者 汪珶 《山西师范大学学报(自然科学版)》 2024年第1期39-44,共6页
在互联网时代,越来越多的财务公司选择在财经新闻平台上发表自己的见解,这些评论文本作为舆情的载体,可以充分反映财务公司的情绪,影响公众的投资决策和市场走势.情感分析为分析海量的经济类文本情感类型提供了有效的研究手段.但是,由... 在互联网时代,越来越多的财务公司选择在财经新闻平台上发表自己的见解,这些评论文本作为舆情的载体,可以充分反映财务公司的情绪,影响公众的投资决策和市场走势.情感分析为分析海量的经济类文本情感类型提供了有效的研究手段.但是,由于特定领域文本的专业性和大标签数据集的不适用性,经济类文本情感分析给传统的情感分析模型带来了巨大的挑战.当将一般情感分析模型应用于经济等特定领域时,模型在准确率与召回率上表现较差.为了克服这些挑战,文章针对财经新闻平台上的经济类文本的情感分析任务,从词表示模型出发,提出了基于知识蒸馏方法的双路BERT(Two-way BERT based on knowledge distillation method)情感分析模型,与文本卷积神经网络(Text-CNN)、卷积递归神经网络(CRNN)、双向长时和短时记忆网络(Bi-LSTM)等算法进行对比实验,结果得出该改进方法相较于其他算法在准确率、召回率和F1值均提升了1%~3%,具有较好的泛化性能. 展开更多
关键词 知识蒸馏 双路BERT 经济文本情感分析
下载PDF
通道剪枝与知识蒸馏相结合的轻量化SAR目标检测
7
作者 黄启灏 靳国旺 +2 位作者 熊新 王丽美 李佳豪 《测绘学报》 EI CSCD 2024年第4期712-723,共12页
轻量化SAR目标检测方法对快速检测SAR影像中的地物目标具有重要意义。针对轻量化检测方法精度不高的问题,设计了一种通道剪枝与知识蒸馏相结合的轻量化SAR目标检测方法。该方法通过对复杂网络中批归一化层的缩放因子γ进行稀疏化训练,... 轻量化SAR目标检测方法对快速检测SAR影像中的地物目标具有重要意义。针对轻量化检测方法精度不高的问题,设计了一种通道剪枝与知识蒸馏相结合的轻量化SAR目标检测方法。该方法通过对复杂网络中批归一化层的缩放因子γ进行稀疏化训练,判别对应特征通道的重要程度,进而裁剪次要通道,并在微调训练后将其作为教师网络,构造知识蒸馏框架指导轻量模型训练,提高轻量模型的检测精度。采用YOLOv5-6.1算法搭建了检测框架,并在重组的MSAR和SSDD多类目标数据集上进行了训练和检测试验,结果表明该方法能够在保持模型体积仅3.73 MB的轻量化条件下,提升SAR目标检测精度,验证了本文方法的有效性。 展开更多
关键词 SAR 目标检测 轻量化 通道剪枝 知识蒸馏
下载PDF
融合自我知识蒸馏和卷积压缩的轻量化人体姿态估计方法
8
作者 闫忠心 白琳 李陶深 《小型微型计算机系统》 CSCD 2024年第2期461-469,共9页
为追求更准确的关键点检测结果,现有许多有关人体姿态估计研究多采用复杂的深度网络架构构建模型,忽略了模型的实际部署成本,导致模型在资源受限的边缘设备上很难实际部署,缺乏实用性.为了解决上述问题,本文设计了一种融合自我知识蒸馏... 为追求更准确的关键点检测结果,现有许多有关人体姿态估计研究多采用复杂的深度网络架构构建模型,忽略了模型的实际部署成本,导致模型在资源受限的边缘设备上很难实际部署,缺乏实用性.为了解决上述问题,本文设计了一种融合自我知识蒸馏和卷积压缩的轻量化人体姿态估计模型.该模型首先使用改进的EfficientNet网络构建一个编码器,提取图像的多尺度特征;其次,基于深度可分离转置卷积,设计一种轻量化上采样解码器,估计人体姿态;最后,采用轻量化多尺度双向融合与知识自我蒸馏方法,进一步提高人体姿态估计的准确性.在COCO和MPII标准数据集上进行了广泛的定性、定量和消融实验,实验结果表明所提出的模型不仅能获得准确的人体姿态估计,而且能显著降低模型的计算复杂性. 展开更多
关键词 深度学习 人体姿态估计 自我知识蒸馏 卷积压缩
下载PDF
k-best维特比解耦合知识蒸馏的命名实体识别模型
9
作者 赵红磊 唐焕玲 +2 位作者 张玉 孙雪源 鲁明羽 《计算机科学与探索》 CSCD 2024年第3期780-794,共15页
为提升命名实体识别(NER)模型的性能,可采用知识蒸馏方法,但是传统知识蒸馏损失函数因内部存在的耦合关系会导致蒸馏效果较差。为了解除耦合关系,有效提升输出层特征知识蒸馏的效果,提出一种结合k-best维特比解码的解耦合知识蒸馏方法(k... 为提升命名实体识别(NER)模型的性能,可采用知识蒸馏方法,但是传统知识蒸馏损失函数因内部存在的耦合关系会导致蒸馏效果较差。为了解除耦合关系,有效提升输出层特征知识蒸馏的效果,提出一种结合k-best维特比解码的解耦合知识蒸馏方法(kvDKD),该方法利用k-best维特比算法提高计算效率,能够有效提升模型性能。另外,基于深度学习的命名实体识别在数据增强时易引入噪声,因此提出了融合数据筛选和实体再平衡算法的数据增强方法,旨在减少因原数据集引入噪声和增强数据错误标注的问题,提高数据集质量,减少过度拟合。最后在上述方法的基础上,提出了一种新的命名实体识别模型NER-kvDKD。在MSRA、Resume、Weibo、CLUENER和CoNLL-2003数据集上的对比实验结果表明,该方法能够提高模型的泛化能力,同时也有效提高了学生模型性能。 展开更多
关键词 命名实体识别(NER) 知识蒸馏 k-best维特比解码 数据增强
下载PDF
融合动态掩码注意力与多教师多特征知识蒸馏的文本分类
10
作者 王润周 张新生 王明虎 《中文信息学报》 CSCD 2024年第3期113-129,共17页
知识蒸馏技术可以将大规模模型中的知识压缩到轻量化的模型中,在文本分类任务中实现更高效的推断。现有的知识蒸馏方法较少同时考虑多种教师与多个特征层之间的信息融合。此外,蒸馏过程采用全局填充,未能动态关注数据中的有效信息。为此... 知识蒸馏技术可以将大规模模型中的知识压缩到轻量化的模型中,在文本分类任务中实现更高效的推断。现有的知识蒸馏方法较少同时考虑多种教师与多个特征层之间的信息融合。此外,蒸馏过程采用全局填充,未能动态关注数据中的有效信息。为此,该文提出一种融合动态掩码注意力机制与多教师多特征知识蒸馏的文本分类模型,不仅引入多种教师模型(RoBERTa、Electra)的知识源,还兼顾不同教师模型在多个特征层的语义信息,并通过设置动态掩码模型注意力机制使得蒸馏过程动态关注不等长数据,减少无用填充信息的干扰。在4种公开数据集上的实验结果表明,经过蒸馏后的学生模型(TinyBRET)在预测性能上均优于其他基准蒸馏策略,并在采用教师模型1/10的参数量、约1/2的平均运行时间的条件下,取得与两种教师模型相当的分类结果,平均准确率仅下降4.18%和3.33%,平均F 1值仅下降2.30%和2.38%。其注意力热度图也表明动态掩码注意力机制切实加强关注了数据尾部与上下文信息。 展开更多
关键词 动态掩码注意力 多教师多特征 知识蒸馏 文本分类
下载PDF
一种基于知识蒸馏的量化卷积神经网络FPGA部署
11
作者 罗德宇 郭千禧 +2 位作者 张怀诚 黄启俊 王豪 《电子技术应用》 2024年第4期97-101,共5页
设计了一种针对心电数据实时分类的量化神经网络,将权重量化为两位整数,运用知识蒸馏的方法使性能达到了期望的效果,并部署于FPGA开发板上。知识蒸馏后的量化网络比全精度网络的分类准确率提升了9%。在FPGA开发板上的运行结果符合预期,... 设计了一种针对心电数据实时分类的量化神经网络,将权重量化为两位整数,运用知识蒸馏的方法使性能达到了期望的效果,并部署于FPGA开发板上。知识蒸馏后的量化网络比全精度网络的分类准确率提升了9%。在FPGA开发板上的运行结果符合预期,达到了需要的性能,可以对左束支传导阻滞(L)、右束支传导阻滞(R)、正常心拍(N)和室性早搏综合征(V)四种心电信号进行分类,相比于其他量化方式对存储参数的需求更小,资源使用更少,相比于CPU速度提升了1.5倍,运行时间达到实时性要求,适合于部署在小型、轻量化的资源有限的可穿戴设备上。 展开更多
关键词 心电信号 量化卷积神经网络 知识蒸馏 FPGA
下载PDF
基于知识蒸馏和定位引导的Pointpillars点云检测网络
12
作者 赵晶 李少博 +3 位作者 郭杰龙 俞辉 张剑锋 李杰 《液晶与显示》 CSCD 2024年第1期79-88,共10页
激光雷达数据由于其几何特性,被广泛应用于三维目标检测任务中。由于点云数据的稀疏性和不规则性,难以实现特征提取的质量和推理速度间的平衡。本文提出一种基于体柱特征编码的三维目标检测算法,以Pointpillars网络为基础,设计Teacher-S... 激光雷达数据由于其几何特性,被广泛应用于三维目标检测任务中。由于点云数据的稀疏性和不规则性,难以实现特征提取的质量和推理速度间的平衡。本文提出一种基于体柱特征编码的三维目标检测算法,以Pointpillars网络为基础,设计Teacher-Student模型框架对回归框尺度进行蒸馏,增加蒸馏损失,优化训练网络模型,提升特征提取的质量。为进一步提高模型检测效果,设计定位引导分类项,增加分类预测和回归预测之间的相关性,提高物体识别准确率。本网络所做改进没有引入额外的网络嵌入。算法在KITTI数据集上的实验结果表明,相比于基准网络,在三维模式下的平均精度值从60.65%提升到了64.69%,鸟瞰图模式下的平均精度值从67.74%提升到70.24%。模型推理速度为45 FPS,在提升检测精度的同时满足了实时性要求。 展开更多
关键词 激光点云 三维目标检测 知识蒸馏 分类置信度
下载PDF
图知识蒸馏综述:算法分类与应用分析
13
作者 刘静 郑铜亚 郝沁汾 《软件学报》 EI CSCD 2024年第2期675-710,共36页
图数据,如引文网络,社交网络和交通网络,广泛地存在现实生活中.图神经网络凭借强大的表现力受到广泛关注,在各种各样的图分析应用中表现卓越.然而,图神经网络的卓越性能得益于标签数据和复杂的网络模型,而标签数据获取困难且计算资源代... 图数据,如引文网络,社交网络和交通网络,广泛地存在现实生活中.图神经网络凭借强大的表现力受到广泛关注,在各种各样的图分析应用中表现卓越.然而,图神经网络的卓越性能得益于标签数据和复杂的网络模型,而标签数据获取困难且计算资源代价高昂.为了解决数据标签的稀疏性和模型计算的高复杂性问题,知识蒸馏被引入到图神经网络中.知识蒸馏是一种利用性能更好的大模型(教师模型)的软标签监督信息来训练构建的小模型(学生模型),以期达到更好的性能和精度.因此,如何面向图数据应用知识蒸馏技术成为重大研究挑战,但目前尚缺乏对于图知识蒸馏研究的综述.旨在对面向图的知识蒸馏进行全面综述,首次系统地梳理现有工作,弥补该领域缺乏综述的空白.具体而言,首先介绍图和知识蒸馏背景知识;然后,全面梳理3类图知识蒸馏方法,面向深度神经网络的图知识蒸馏、面向图神经网络的图知识蒸馏和基于图知识的模型自蒸馏方法,并对每类方法进一步划分为基于输出层、基于中间层和基于构造图知识方法;随后,分析比较各类图知识蒸馏算法的设计思路,结合实验结果总结各类算法的优缺点;此外,还列举图知识蒸馏在计算机视觉、自然语言处理、推荐系统等领域的应用;最后对图知识蒸馏的发展进行总结和展望.还将整理的图知识蒸馏相关文献公开在GitHub平台上,具体参见:https://github.com/liujing1023/Graph-based-Knowledge-Distillation. 展开更多
关键词 图数据 图神经网络 知识蒸馏
下载PDF
基于知识蒸馏的步态识别方法
14
作者 李若愚 云利军 +2 位作者 金雪松 杨彦辰 程飞燕 《云南师范大学学报(自然科学版)》 2024年第2期49-53,共5页
针对步态识别中网络模型复杂度高、参数量大、训练测试速度慢等问题,提出一种基于知识蒸馏的步态识别方法.通过知识蒸馏方法对ConvNext-KD模型进行训练,在不增加新训练数据集、模型复杂度和模型参数量的前提下,提高ConvNext-KD模型的识... 针对步态识别中网络模型复杂度高、参数量大、训练测试速度慢等问题,提出一种基于知识蒸馏的步态识别方法.通过知识蒸馏方法对ConvNext-KD模型进行训练,在不增加新训练数据集、模型复杂度和模型参数量的前提下,提高ConvNext-KD模型的识别准确率.该方法在中科院CASIA-B和CASIA-C数据库中进行多次仿真实验.结果表明,ConvNext-KD模型在保持较小参数量和较低复杂度的同时,可以显著缩短训练测试的时长并取得较高识别准确率. 展开更多
关键词 步态识别 知识蒸馏 ConvNext
下载PDF
融合迁移学习和知识蒸馏的轻量级马铃薯叶片病害识别模型的构建方法
15
作者 章广传 李彤 +2 位作者 高泉 叶荣 何云 《江苏农业科学》 2024年第4期197-206,共10页
轻量级深度学习模型常被部署于移动端或物联网端,以实现算力资源受限条件下马铃薯病害的识别。但轻量级模型网络层数较少,模型特征提取能力有限,无法实现相似表型特征的精确提取。为解决上述问题,提出一种轻量级残差网络模型的构建方法... 轻量级深度学习模型常被部署于移动端或物联网端,以实现算力资源受限条件下马铃薯病害的识别。但轻量级模型网络层数较少,模型特征提取能力有限,无法实现相似表型特征的精确提取。为解决上述问题,提出一种轻量级残差网络模型的构建方法,该方法融合迁移学习和知识蒸馏策略训练模型,在教师模型上使用迁移学习策略缩短教师模型的训练时间,并将ResNet18模型进行模型剪枝,使用降采样的方法提高模型识别准确率,最终在保证轻量化的前提下,实现对马铃薯叶片病害类别的精准识别。在马铃薯叶片数据集上进行试验,结果表明,本研究方法构建的轻量级模型的识别准确率相较于Resnet18提高1.55百分点,模型大小缩小49.18%;相较于目前农作物病害识别领域,常用的轻量级模型MobileNetV3在模型大小相近的情况下,识别准确率提高2.91百分点。该模型能够满足大部分实际应用下的场景,可为部署在物联网和移动端设备上的模型提供参考。 展开更多
关键词 马铃薯 病害识别 轻量级模型 迁移学习 知识蒸馏
下载PDF
基于知识蒸馏的GAN生成图像质量评价方法
16
作者 闫嘉阔 司占军 《印刷与数字媒体技术研究》 CAS 2024年第1期51-59,共9页
为了是提高GAN模型生成的图像质量的预测精度,以更好地符合人类对图像质量的主观评价,本研究介绍了一种基于知识蒸馏的半监督图像质量评价(IQA)方法。该方法利用CNN和ViT模型的结合,充分捕获全局和局部信息,学习高质量图像与失真图像之... 为了是提高GAN模型生成的图像质量的预测精度,以更好地符合人类对图像质量的主观评价,本研究介绍了一种基于知识蒸馏的半监督图像质量评价(IQA)方法。该方法利用CNN和ViT模型的结合,充分捕获全局和局部信息,学习高质量图像与失真图像之间特征的分布差异,并通过知识蒸馏传输高级特征信息。模型通过前向传播,得到图像质量评价分数。为了提高输入特征的多样性和模型的处理速度,本研究还采用了级联分组注意(CGA)机制对输入特征处理。通过在多个公共数据集上的实验表明,本研究方法的评价结果优于现有的评价方法,总体效果理想,相对鲁棒性相对优异,可以获得更加符合人类视觉效果的IQA结果。 展开更多
关键词 知识蒸馏 GAN模型 图像质量评价 级联分组注意力
下载PDF
基于知识蒸馏模型的文本情感分析
17
作者 李锦辉 刘继 《软件工程》 2024年第4期27-32,共6页
为了解决预训练语言模型训练时间过长、参数多且难以部署,以及非预训练语言模型分类效果较差的问题,提出了基于知识蒸馏模型的文本情感分析。以预训练深度学习模型(Bidirectional Encoder Representations from Transformers, BERT)作... 为了解决预训练语言模型训练时间过长、参数多且难以部署,以及非预训练语言模型分类效果较差的问题,提出了基于知识蒸馏模型的文本情感分析。以预训练深度学习模型(Bidirectional Encoder Representations from Transformers, BERT)作为教师模型,选择双向长短期记忆网络(Bidirectional Long Short-Term Memory, BiLSTM)作为学生模型;在知识蒸馏过程中,将教师模型的Softmax层的输出作为“知识”蒸馏给学生模型,并将蒸馏后的模型应用到公共事件网络舆情文本情感分析中。实验结果表明,该模型参数仅为BERT模型的1/13,使BiLSTM模型的准确率提升了2.2百分点,优于其他同类别轻量级模型,提高了文本情感分析效率。 展开更多
关键词 知识蒸馏 网络舆情 BERT模型 BiLSTM模型
下载PDF
KDTGAN:基于Transformer-GAN和知识蒸馏的高光谱目标检测
18
作者 谢雯 闪晨超 +1 位作者 张哲哲 张嘉鹏 《遥测遥控》 2024年第2期10-17,共8页
高光谱目标检测在地球观测中至关重要,被广泛应用于军事和民用领域。然而,由于高光谱图像的背景复杂性和目标样本的有限性,该任务面临较大的挑战。本文首先采用CEM (约束能量最小化)粗检测方法提取背景数据。随之,引入了一种新的知识蒸... 高光谱目标检测在地球观测中至关重要,被广泛应用于军事和民用领域。然而,由于高光谱图像的背景复杂性和目标样本的有限性,该任务面临较大的挑战。本文首先采用CEM (约束能量最小化)粗检测方法提取背景数据。随之,引入了一种新的知识蒸馏模型,即KDTGAN (通过Transformer-GAN实现)。教师模型的生成器采用了Transformer编码器的结构,并结合多尺度数据融合的方法,能够准确地学习背景分布,进而通过重构背景信息实现目标检测。为了克服GAN(生成对抗网络)训练不稳定的挑战,特别是纯背景数据的稀缺性,本文提出了一种新的损失算法,以减小可疑目标样本对模型性能的负面影响。为了降低模型的计算负担,本文引入知识蒸馏,并设计新的蒸馏损失对学生模型加以约束,使模型轻量化的同时提高学生模型检测精度。实验结果表明:KDTGAN相较于当前检测方法表现更优,具有更高的检测精度和鲁棒性。 展开更多
关键词 高光谱图像 目标检测 知识蒸馏 生成对抗网络 Transformer-GAN
下载PDF
基于知识蒸馏的宫颈细胞图像分类研究
19
作者 吴桐 黎远松 《现代计算机》 2024年第3期41-47,共7页
宫颈癌筛查对宫颈癌预防和早期宫颈癌诊断具有重要意义。针对现有宫颈细胞图像分类模型泛化能力不足、参数量大、对硬件要求高且难以部署终端等问题,提出一种基于知识蒸馏的宫颈细胞图像分类方法。使用残差网络为骨干网络,以ResNet18为... 宫颈癌筛查对宫颈癌预防和早期宫颈癌诊断具有重要意义。针对现有宫颈细胞图像分类模型泛化能力不足、参数量大、对硬件要求高且难以部署终端等问题,提出一种基于知识蒸馏的宫颈细胞图像分类方法。使用残差网络为骨干网络,以ResNet18为基础学生网络,引入知识蒸馏机制使用ResNet34作为教师网络进行指导学习。采用迁移学习方法提高教师模型基准精度;将教师网络概率预测知识通过知识蒸馏传递给学生网络进行学习,以提升学生模型分类准确率。实验结果表明:知识蒸馏优化后的学生网络ResNet18精度高达95.59%,相比未优化前精度91.13%提升了4.46个百分点。蒸馏优化后的模型参数量小、精度高,网络的整体性能优秀,为建立临床轻量级宫颈细胞图像分类模型研究提供了参考。 展开更多
关键词 宫颈癌 宫颈细胞图像分类 残差网络 迁移学习 知识蒸馏
下载PDF
一种阶段重置的知识蒸馏方法研究与仿真
20
作者 陈骏立 孙占全 《建模与仿真》 2024年第2期1455-1465,共11页
知识蒸馏是一种将知识从教师网络传递到学生网络的模型压缩方法。目前的知识蒸馏方法存在教师网络和学生网络之间的语义信息不一致的问题,具体而言,师生模型之间的前向推理距离不一致导致语义信息不一致,最终损耗蒸馏性能。为了解决这... 知识蒸馏是一种将知识从教师网络传递到学生网络的模型压缩方法。目前的知识蒸馏方法存在教师网络和学生网络之间的语义信息不一致的问题,具体而言,师生模型之间的前向推理距离不一致导致语义信息不一致,最终损耗蒸馏性能。为了解决这个问题,本文探索一种新的阶段重置知识蒸馏方法。该方法设计了以阶段为单位的知识蒸馏,师生网络相同阶段共享输出,降低了由学生与教师推理路径长度差异过大造成的特征语义不匹配的影响,从而提升学生网络的性能。最后,本文用提出的方法在公共数据集上进行仿真实验,并与最新的方法进行比较,实验结果表明本文提出的方法更具优势。 展开更多
关键词 神经网络 分类模型 模型压缩 知识蒸馏 阶段重置
下载PDF
上一页 1 2 19 下一页 到第
使用帮助 返回顶部