期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
面向Transformer模型边缘端部署的常用激活函数高精度轻量级量化推理方法
1
作者 杨赟辉 程虎 +2 位作者 魏敬和 刘国柱 桑贤侦 《电子学报》 EI CAS CSCD 北大核心 2024年第10期3301-3311,共11页
基于Transformer的大语言模型(Large Language Models,LLM)和视觉Transformer(Vision Transformers,ViTs)分别在自然语言处理、机器视觉任务上实现了最为先进的性能.但是ViTs和LLM的常用激活函数GELU(Gaussian Error Linear Unit)、Swis... 基于Transformer的大语言模型(Large Language Models,LLM)和视觉Transformer(Vision Transformers,ViTs)分别在自然语言处理、机器视觉任务上实现了最为先进的性能.但是ViTs和LLM的常用激活函数GELU(Gaussian Error Linear Unit)、Swish在Transformer全量化推理中存在精度不足、计算效率低的问题,限制了它们在资源受限的边缘端设备上的部署和应用.本文提出了一种基于分段二次多项式拟合的激活函数高精度近似计算方法(Segmented Quadratic Polynomial Fitting,SQPF)及其量化推理过程,以实现端侧非线性激活函数的高性能部署.SQPF采用最小二乘法和粒子群优化方法求解非线性激活函数拟合优化问题,给出最优的二次多项式拟合系数和区间划分.得到的二次多项式拟合采用动态精度定点对称量化方法进行纯整数推理,推理过程仅包含移位操作和乘加运算.本文使用SQPF计算了GELU和Swish的二次多项式拟合Si-GELU和Si-Swish,并评估了量化推理精度.实验结果表明,在标准数据集ImageNet上,Si-GELU引起的ViTs(ViT、DeiT和Swin)模型分类任务准确率衰减仅为0.09%,是其他同类方法的27.3%;在主流的大语言模型评测数据集MMLU上,Si-Swish引起的子类别精度衰减不超过0.77%,大类别精度衰减不超过0.23%.极小的精度损失表明SQPF计算得到的最优分段二次多项式拟合可以直接替换Transformer模型中全精度浮点激活函数,不必进行参数微调或者重训练. 展开更多
关键词 Transformer 全量化推理 GELU函数 swish函数 分段二次多项式拟合
下载PDF
Swish激活函数在中小规模数据集上的性能表现 被引量:8
2
作者 米硕 田丰收 +2 位作者 孙瑞彬 葛敏 赵汝程 《科技创新与应用》 2018年第1期4-5,共2页
Swish激活函数是一种新的激活函数,其形式为:f(x)=x*sigmod(x),Swish-β激活函数的形式则为f(x)=x*sigmod(b*x),其拥有不饱和,光滑且非单调性的特征,而测试表明Swish以及Swish-β激活函数拥有极佳的性能,尤其是与局部响应归一化配合,以... Swish激活函数是一种新的激活函数,其形式为:f(x)=x*sigmod(x),Swish-β激活函数的形式则为f(x)=x*sigmod(b*x),其拥有不饱和,光滑且非单调性的特征,而测试表明Swish以及Swish-β激活函数拥有极佳的性能,尤其是与局部响应归一化配合,以及较深的深度神经网络上,表现出了对目前大多数激活函数的性能优势。 展开更多
关键词 swish激活函数 深度学习 神经网络
下载PDF
基于YOLOv5⁃Eff网络的织物疵点检测算法 被引量:2
3
作者 石玉文 林富生 +1 位作者 宋志峰 余联庆 《棉纺织技术》 CAS 北大核心 2023年第12期20-25,共6页
针对目标检测精度低、小目标易漏检等问题,提出一种基于改进YOLOv5模型的检测算法。选取改进EfficientNet B1网络作为主干特征提取网络;引入ACmix注意力模块提高网络对小尺度目标的敏感度,降低噪声所带来的影响,解决小缺陷特征图在卷积... 针对目标检测精度低、小目标易漏检等问题,提出一种基于改进YOLOv5模型的检测算法。选取改进EfficientNet B1网络作为主干特征提取网络;引入ACmix注意力模块提高网络对小尺度目标的敏感度,降低噪声所带来的影响,解决小缺陷特征图在卷积操作中的失真情况;将SiLU与Swish激活函数结合,根据目标的数量和密度来动态调整阈值,提高算法灵活性。研究结果表明:相比于原始YOLOv5模型,改进后的YOLOv5算法的精确率、召回率和平均精度均值分别提升了4.33个百分点、2.11个百分点和4.32个百分点。该算法能准确识别织物疵点的整体特征,对于复杂场景下的疵点以及小目标疵点检测任务更为适用。 展开更多
关键词 YOLOv5 EfficientNet 注意力模块 swish动态激活函数 织物疵点
下载PDF
正弦算法优化正则化ELM在NOx排放量建模中的应用 被引量:2
4
作者 马良玉 程善珍 王永军 《华北电力大学学报(自然科学版)》 CAS 北大核心 2022年第3期112-118,共7页
为优化锅炉配风配粉降低NO x排放浓度,以某1000 MW火电机组现场变工况运行数据为基础,采用正弦算法(Sine algorithm,SA)优化的正则化极限学习机(Regularized extreme learning machine,RELM)建立了NO x排放量的预测模型。为提高预测模... 为优化锅炉配风配粉降低NO x排放浓度,以某1000 MW火电机组现场变工况运行数据为基础,采用正弦算法(Sine algorithm,SA)优化的正则化极限学习机(Regularized extreme learning machine,RELM)建立了NO x排放量的预测模型。为提高预测模型的精度,通过比较不同激活函数对RELM模型性能的影响,选用了新的Swish激活函数;采用奇异值分解法确定RELM的最佳隐含层节点个数,并引入一种自适应调整惯性权重的正弦算法对RELM的输入权值和阈值进行优化。将基于以上策略建立的SA-RELM模型与SA-ELM、RELM及PSO-RELM等模型的预测结果进行对比,表明基于SA-RELM的NO x排放量预测模型具有更高的精度和泛化能力。 展开更多
关键词 NO x排放量 预测模型 正则化极限学习机 正弦算法 swish激活函数
下载PDF
基于残差网络和门控卷积网络的语音识别研究 被引量:9
5
作者 朱学超 张飞 +2 位作者 高鹭 任晓颖 郝斌 《计算机工程与应用》 CSCD 北大核心 2022年第7期185-191,共7页
由于传统循环神经网络具有复杂的结构,需要大量的数据才能在连续语音识别中进行正确训练,并且训练需要耗费大量的时间,对硬件性能要求很大。针对以上问题,提出了基于残差网络和门控卷积神经网络的算法,并结合联结时序分类算法,构建端到... 由于传统循环神经网络具有复杂的结构,需要大量的数据才能在连续语音识别中进行正确训练,并且训练需要耗费大量的时间,对硬件性能要求很大。针对以上问题,提出了基于残差网络和门控卷积神经网络的算法,并结合联结时序分类算法,构建端到端中文语音识别模型。该模型将语谱图作为输入,通过残差网络提取高层抽象特征,然后通过堆叠门控卷积神经网络捕获有效的长时间记忆,摆脱了传统循环神经网络对上下文相关性建模的依赖,加快了模型的训练速度。对残差网络进行了优化,并在门控卷积神经网络中加入了前馈神经网络,极大提高了模型的性能。实验结果表明,在Aishell-1中文数据集上,该模型的字错误率降低至11.43%;并且在-5 dB低信噪比环境下,字错误率达到了19.77%。 展开更多
关键词 残差网络 门控卷积神经网络 联结时序分类 swish激活函数
下载PDF
基于Tensorflow对卷积神经网络的优化研究 被引量:17
6
作者 郭敏钢 宫鹤 《计算机工程与应用》 CSCD 北大核心 2020年第1期158-164,共7页
针对卷积神经网络在性耗比上的不足,提出了异构式CPU+GPU的协同计算模型,在模型计算过程中使CPU负责逻辑性强的事物处理和串行计算,使GPU执行高度线程化的并行处理任务。通过实验测试与单GPU训练、单CPU训练进行对比,结果表明异构式CPU+... 针对卷积神经网络在性耗比上的不足,提出了异构式CPU+GPU的协同计算模型,在模型计算过程中使CPU负责逻辑性强的事物处理和串行计算,使GPU执行高度线程化的并行处理任务。通过实验测试与单GPU训练、单CPU训练进行对比,结果表明异构式CPU+GPU计算模型在性耗比上更加优异。针对在卷积神经网络中Swish激活函数在反向传播求导误差梯度时涉及参数较多所导致的计算量较大,收敛速度慢,以及ReLU激活函数在x负区间内导数为零所导致的负梯度被置为零且神经元可能无法被激活的问题,提出了新的激活函数ReLU-Swish。通过测试训练对比并分析结果,将Swish激活函数小于零与ReLU激活函数大于零的部分组成分段函数,并且通过CIFAR-10和MNIST两个数据集进行测试对比实验。实验结果表明,ReLU-Swish激活函数在收敛速度以及模型测试训练的准确率上对比Swish激活函数及ReLU激活函数有较明显的提高。 展开更多
关键词 Tensorflow CPU+GPU 卷积神经网络 swish激活函数 ReLU激活函数 ReLU-swish激活函数
下载PDF
改进残差网络的指静脉识别 被引量:8
7
作者 包晓安 易芮 +2 位作者 徐璐 吴彪 钟乐海 《西安工程大学学报》 CAS 2020年第3期67-74,共8页
在指静脉识别中,如何利用卷积神经网络提取具有类间分离和类内聚合的静脉特征是当前的研究热点,为此提出了在卷积神经网络中采用中心损失(center loss)用于减小指静脉的类内距离,同时采用softmax loss用于约束类间距离,以此作为网络的... 在指静脉识别中,如何利用卷积神经网络提取具有类间分离和类内聚合的静脉特征是当前的研究热点,为此提出了在卷积神经网络中采用中心损失(center loss)用于减小指静脉的类内距离,同时采用softmax loss用于约束类间距离,以此作为网络的损失函数。为了进一步提高模型的表达能力,采用swish激活函数代替线性整流(rectified linear unit,ReLU)激活函数,在此基础上,将全局平均池化层的输出向量进行归一化操作后作为指静脉的特征向量,减少网络参数的同时保留了指静脉的高级语义信息。结果表明:改进后的指静脉识别算法在FV-USM和MMCBNU-6000这2个数据集上识别的准确率分别达到98.23%和98.35%,优于传统的卷积神经网络识别算法。 展开更多
关键词 指静脉识别 中心损失 softmax LOSS 判别特征 swish激活函数
下载PDF
基于改进YOLOv3网络的烟梗识别定位方法 被引量:2
8
作者 刘新宇 郝同盟 +1 位作者 张红涛 逯芯妍 《食品与机械》 北大核心 2022年第3期103-109,共7页
目的:实现烟叶分级流程烟梗部位的智能抓取,防止智能烟叶分级系统中机械手在抓取烟叶时对叶面造成损伤,减少烟叶智能分级设备生产中的人为操作,解决烟叶分级系统中的单片烟叶识别分类问题与对应等级单片烟叶存放问题。方法:提出一种基... 目的:实现烟叶分级流程烟梗部位的智能抓取,防止智能烟叶分级系统中机械手在抓取烟叶时对叶面造成损伤,减少烟叶智能分级设备生产中的人为操作,解决烟叶分级系统中的单片烟叶识别分类问题与对应等级单片烟叶存放问题。方法:提出一种基于改进YOLOv3的卷积神经网络烟梗自动识别定位模型。该模型在原有的YOLOv3的基础模型上改变单元模块结构引入注意力机制模块,优化模型参数,使用Swish激活函数,实现了对烟叶图像全部信息进行目标定位识别,构建烟梗目标检测模型。结果:改进后的YOLOv3模型的loss能更快的收敛,其mAP由90.46%提升为97.48%,准确率由95.33%提升为97.35%,回归率由84.65%提升为95.65%,为后续烟叶自动化分类打下基础。结论:与YOLOv3、Faster-rcnn、YOLOv4、Efficientdet算法作对比分析表明试验提出的算法更加轻量化,识别效果更好,能减少对烟梗试验平台的硬件配置要求,提高烟叶分类系统的经济效益,为烟叶分级系统中烟叶上料与分仓提供准确的位置信息。 展开更多
关键词 烟梗 识别定位 改进YOLOv3 卷积神经网络 注意力机制 swish激活函数
下载PDF
基于FCOS算法改进的交通标志检测
9
作者 陈哲 程艳云 《计算机工程与设计》 北大核心 2022年第11期3271-3278,共8页
针对道路中交通标志检测存在的检测对象目标小、自然环境干扰等问题,提出基于全卷积单阶段目标检测(fully convolutional one-stage object detection,FCOS)算法改进的多尺度特征融合的单阶段无锚检测器。以FCOS算法为框架,在特征提取... 针对道路中交通标志检测存在的检测对象目标小、自然环境干扰等问题,提出基于全卷积单阶段目标检测(fully convolutional one-stage object detection,FCOS)算法改进的多尺度特征融合的单阶段无锚检测器。以FCOS算法为框架,在特征提取网络中通过引入注意力模块CBAM(convolutional block attention module)对数据集进行特征提取,在该网络中引入模型效果优于Re LU的swish激活函数;在特征加强网络中进行轻量级的多尺度特征融合。在TT100K数据集上的实验结果表明,该算法的F1-measure达到了83.2%,检测速度达到了24.39FPS,验证了改进后网络的可行性和有效性。 展开更多
关键词 全卷积单阶段目标检测 交通标志检测 注意力模块 swish激活函数 多尺度特征融合
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部