基于高次指数平滑动态边界限制的深度学习优化算法被引量：5

Deep Learning Optimization Algorithm Based on High Order Exponential Smoothing Dynamic Boundary Constraint

导出

摘要针对自适应算法存在的不收敛问题,提出了一种Adam改进算法.通过引入多个超参数,并进行多次指数平滑,来弥补一次指数平滑的不足.此外,对二阶动量计算加以修正,预防了二阶动量数据发生不良的波动,从而达到平滑非预期的大学习率的效果.分别在Resnet模型和Densenet模型上对cifar10和cifar100数据集进行了对比实验.从实验可以看出,所提算法适用于不同的模型结构和不同数据集,与Adam算法相比,其准确率平均提升了1.3%,同时为收敛问题提供了一种有效的解决方案. To solve the problem of non-convergence of the adaptive algorithm,we propose an improved Adam algorithm.By introducing multiple hyperparameters and performing exponential smoothing for many times,it makes up for the deficiency of one exponential smoothing.In addition,we modify the second-order momentum calculation to prevent the bad fluctuation of the second-order momentum data,so as to smooth the unexpected university study rate.We conduct comparative experiments on cifar10 and cifar100 datasets based on the Resnet model and the Densenet model.As we can see from the experiment,the proposed algorithm is suitable for different model structures and different data sets.Compared with Adam algorithm,the accuracy of the proposed algorithm is improved by 1.3%on average,and the algorithm provides an effective solution for the convergence problem.

作者张珂杨歆豪张嘉慧倪俊芳 ZHANG Ke;YANG Xinhao;ZHANG Jahui;NI Junfang(School of Mechanical and Electrical Engineering,Soochow University,Suzhou 215000,China)

机构地区苏州大学机电工程学院

出处《信息与控制》 CSCD 北大核心 2021年第6期685-693,共9页 Information and Control

基金国家自然科学基金资助项目(61971297)。

关键词指数移动平均算法自适应学习速率二阶动量 exponential moving average algorithm adaptive learning rate second order momentu

分类号 TP273 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献5

1Ameer Hamza Khan,Xinwei Cao,Shuai Li,Vasilios N.Katsikis,Liefa Liao.BAS-ADAM:An ADAM Based Approach to Improve the Performance of Beetle Antennae Search Optimizer[J].IEEE/CAA Journal of Automatica Sinica,2020,7(2):461-471. 被引量：28
2张荣,李伟平,莫同.深度学习研究综述[J].信息与控制,2018,47(4):385-397. 被引量：140
3贾熹滨,史佳帅.Ada_Nesterov动量法——一种具有自适应学习率的Nesterov动量法[J].计算机科学与应用,2019,9(2):351-358. 被引量：5
4Ernest K.Ryu,Wotao Yin.PROXIMAL-PROXIMAL-GRADIENT METHOD[J].Journal of Computational Mathematics,2019,37(6):778-812. 被引量：1
5许锋,卢建刚,孙优贤.神经网络在图像处理中的应用[J].信息与控制,2003,32(4):344-351. 被引量：49

二级参考文献56

1Lee C C, Degyves J P. Color image processing in a cellular neu-rid-network environment [ J ]. IEEE Transactions on Neural Networks, 1996,7(5) :1086 - 1098.
2Clarke L P, Qian W. Fuzzy-logic adaptive neural networks for nuclear medicine image restoration [A]. The 20th Annual International Conference on Engineering in Medicine and Biology Society[C]. 1998,vol. 3. 1363 - 1366.
3Qian W, Clarke L P. Wavelet-based neural network with fuzzylogic adaptivity for nuclear image restoration [J]. Proceedings of the IEEE, 1996,84(10) :1458 - 1473.
4Cheung H N, Bouzerdoum A, Newland W. Properties of shunting inhibitory cellular neural networks for colour image enhancement[ A]. The 6th International Conference on Neural Information Processing [ C]. 1999 ,vol. 3. 1219 - 1223.
5Kondo K, Iguch M, Ishigaki H, et al. Design of complex-valued CNN filters for medical image enhancement [ A ]. IFSA World Congress and 20th NAFIPS International Conference [C]. 2001,vol. 3.1642 - 1646.
6Ahmed F, Gustafson S C, Karim M A. High-fidelity image interpolation using radial basia function neural networks [ A ]. Aerospace and Electronics Conference [ C ]. 1995,vol. 2. 588 -592.
7Sun Y. Hopfield neural network based algorithms for image restoration and reconstruction I algorithms and simulations [ J ].IEEE Transactions on Signal Processing, 2000,48 ( 7 ) : 2105-2118.
8Sun Y. Hopfield neural network based algorithms for image restoration and reconstruction II algorithms and simulations [ J ].IEEE Transactions on Signal Processing, 2000,48 ( 7 ) : 2105-2118.
9Perry S W, Wyber R J. A Hopfield neural network approach for the reconstruction of wide-bandwidth sonar data. Neural Networks for Signal Processing, 2000,2:876 -885.
10Dony R D, et al. Neural network approaches to image compression [J]. Proc IEEE, 1995,83:288 -303.

共引文献217

1朱剑文,帅磊,钮云龙,曹大泉,赵桂芝,梁秀佐,张译文,杨维耿.基于Geant4的联合模型神经网络法解析γ能谱[J].南华大学学报（自然科学版）,2022,36(4):75-81.
2王飞,汪鹏,周琳,陈蜀虎,吴昊.基于深度学习的影像智能诊断平台建设与应用[J].中国数字医学,2020,15(1):11-13. 被引量：10
3陈绎冰,李天依,李欣艳,赵文川,范荣峰,陈凤娇,杨元建.基于随机森林和遥感的台风降水云光谱与降水关系研究[J].遥感技术与应用,2022,37(5):1277-1288. 被引量：1
4丁名都,李琳.基于CNN和HOG双路特征融合的人脸表情识别[J].信息与控制,2020,49(1):47-54. 被引量：17
5牛一凡,邵景峰.基于非线性数据融合的设备多阶段寿命预测[J].信息与控制,2019,48(6):729-737. 被引量：9
6邹宜君,赵新刚,徐卫良,韩建达.基于卷积神经网络的自适应样本加权脑机接口建模[J].信息与控制,2019,48(6):658-665. 被引量：2
7傅隆生,宋珍珍,Zhang Xin,李瑞,王东,崔永杰.深度学习方法在农业信息中的研究进展与应用现状[J].中国农业大学学报,2020,25(2):105-120. 被引量：53
8韩忠华,张文缤,李曼,孙亮亮.基于动态集成学习的预制构件加工工时预测问题研究[J].控制工程,2023,30(7):1338-1345.
9张新刚.低分辨率模糊车辆的人工智能识别研究[J].信息通信,2019,0(12):121-123.
10严义,吴迎笑.基于神经网络的图像高反差算法的研究与实现[J].仪器仪表学报,2006,27(z3):2302-2305. 被引量：1

同被引文献49

1杨格兰,邓晓军,刘琮.基于深度时空域卷积神经网络的表情识别模型[J].中南大学学报（自然科学版）,2016,47(7):2311-2319. 被引量：14
2陆继翔,张琪培,杨志宏,涂孟夫,陆进军,彭晖.基于CNN-LSTM混合神经网络模型的短期负荷预测方法[J].电力系统自动化,2019,43(8):131-137. 被引量：339
3张航,李洪双.结构优化设计的改进交叉熵支持向量机方法[J].西北工业大学学报,2018,36(3):448-455. 被引量：3
4董秋成,吴爱国,董娜,冯伟.用于卷积神经网络图像预处理的目标中心化算法[J].中南大学学报（自然科学版）,2019,50(3):579-586. 被引量：5
5刘洪,郑楠,葛少云,徐正阳,郭力.内嵌需求响应与优化运行策略的主动配电系统源网协同规划[J].电力系统自动化,2020,44(3):89-97. 被引量：31
6张科,苏雨,王靖宇,王霰宇,张彦华.基于融合特征以及卷积神经网络的环境声音分类系统研究[J].西北工业大学学报,2020,38(1):162-169. 被引量：21
7王晓梅,卢芳,卢京祥,杨思渊,艾芊,王家武,晋京.含分布式光伏和电动汽车的主动配电网电压一致性协同控制[J].电测与仪表,2020,57(11):101-107. 被引量：18
8王奇超,文再文,蓝光辉,袁亚湘.优化算法的复杂度分析[J].中国科学：数学,2020,50(9):1271-1336. 被引量：9
9栗然,孙帆,丁星,韩怡,刘英培,严敬汝.考虑多能时空耦合的用户级综合能源系统超短期负荷预测方法[J].电网技术,2020,44(11):4121-4131. 被引量：50
10薛田良,刘希懋,张赟宁,曾阳阳.拒绝服务攻击下的分布式弹性负荷频率控制[J].电测与仪表,2021,58(1):158-164. 被引量：3

引证文献5

1万安平,杨洁,缪徐,陈挺,左强,李客.基于注意力机制与神经网络的热电联产锅炉负荷预测[J].上海交通大学学报,2023,57(3):316-325. 被引量：3
2董文静,赵月爱.基于卷积网络的Adam算法的改进[J].太原师范学院学报（自然科学版）,2023,22(3):5-12. 被引量：1
3秦颖婕,樊玮,杨诚,刘宇,王馨尉,许琴.基于深度学习的光伏储能电站负荷模糊逻辑优化控制算法[J].机械与电子,2024,42(7):31-35.
4罗震宇.网络拒绝服务攻击下主动配电网的分布式弹性协同控制[J].电子设计工程,2024,32(16):92-96.
5常庆,罗龙峰.基于XGBoost特征提取的热电联产发电功率预测[J].软件工程与应用,2022,11(5):1105-1122.

二级引证文献4

1刘耀蔚,宋俊霖,王立闻,彭凡.锅炉高温部件寿命快速评估方法[J].东方电气评论,2023,37(4):34-37.
2卓越,赖志芳,张铭,王悦新.基于机器视觉的智能搬运小车[J].电子产品世界,2024,31(3):14-18.
3阚超,劭文锋.基于SSA-PSO-GRU的短期电力负荷预测[J].电子设计工程,2024,32(12):54-59.
4张奇,王禄,邢吉生.基于蒙特卡罗法优化GRU神经网络的热电联产负荷预测[J].北华大学学报（自然科学版）,2024,25(4):545-551.

1陈靖邦,潘俊哲,沈皓朗,谷培,扈明涛.一种多趋势指标结合与择时引入峰值的投资组合优化系统[J].计算机科学,2021,48(S02):693-698. 被引量：2
2郭丞,吴飞,朱海.多场景下的行人步频自适应检测方法[J].全球定位系统,2021,46(6):98-106. 被引量：2
3吴晓,郭圳滨.可变折扣马氏决策过程首达模型列的收敛问题[J].应用概率统计,2021,37(6):598-610.
4张晓凯,郭道省,张邦宁.空天地一体化网络研究现状与新技术的应用展望[J].天地一体化信息网络,2021,2(4):19-26. 被引量：19
5陈建华,丁冬,于希娟,丁红,忻煜.考虑发电机阀点效应的改进拉格朗日松弛有功调度策略[J].电力系统自动化,2021,45(24):115-121.

信息与控制

2021年第6期

浏览历史

内容加载中请稍等...

基于高次指数平滑动态边界限制的深度学习优化算法被引量：5

参考文献5

二级参考文献56

共引文献217

同被引文献49

引证文献5

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于高次指数平滑动态边界限制的深度学习优化算法 被引量：5

参考文献5

二级参考文献56

共引文献217

同被引文献49

引证文献5

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于高次指数平滑动态边界限制的深度学习优化算法被引量：5