深度学习模型压缩与加速综述被引量：61

Survey of Deep Learning Model Compression and Acceleration

下载PDF

导出

摘要随着训练可用数据量的增长与计算平台处理能力的增强,基于深度学习的智能模型能够完成越来越复杂的任务,其在计算机视觉、自然语言处理等人工智能领域已经取得重大的突破.然而,这些深度模型具有庞大的参数规模,与此相伴的可畏的计算开销与内存需求使其在计算能力受限平台(例如移动嵌入式设备)的部署中遇到了巨大的困难与挑战.因此,如何在不影响深度学习模型性能的情况下进行模型压缩与加速成为研究热点.首先对国内外学者提出的经典深度学习模型压缩与加速方法进行分析,从参数剪枝、参数量化、紧凑网络、知识蒸馏、低秩分解、参数共享和混合方式这7个方面分类总结;其次,总结对比几种主流技术的代表性方法在多个公开模型上的压缩与加速效果;最后,对于模型压缩与加速领域的未来研究方向加以展望. With the development of the amount of data available for training and the processing power of new computing platform,the intelligent model based on deep learning can accomplish more and more complex tasks,and it has made major breakthroughs in the field of AI such as computer vision and natural language processing.However,the large number of parameters of these deep models bring awesome computational overhead and memory requirements,which makes the big models must face great difficulties and challenges in the deployment of computing-capable platforms(such as mobile embedded devices).Therefore,model compression and acceleration without affecting the performance have become a research hotspot.This study first analyzes the classical deep learning model compression and acceleration methods proposed by domestic and international scholars,and summarize seven aspects:Parameter pruning,parameter quantization,compact network,knowledge distillation,low-rank decomposition,parameter sharing,and hybrid methods.Secondly,the compression and acceleration performance of several mainstream representative methods is compared on multiple public models.Finally,the future research directions in the field of model compression and acceleration are discussed.

作者高晗田育龙许封元仲盛 GAO Han;TIAN Yu-Long;XU Feng-Yuan;ZHONG Sheng(State Key Laboratory for Novel Software Technology(Nanjing University),Nanjing 210023,China)

机构地区计算机软件新技术国家重点实验室(南京大学)

出处《软件学报》 EI CSCD 北大核心 2021年第1期68-92,共25页 Journal of Software

基金国家自然科学基金(61872180,61872176) 江苏省“双创计划” 江苏省“六大人才高峰”高层次人才项目(B类) 蚂蚁金服科研基金中央高校基本科研业务费专项资金(14380069)。

关键词深度学习模型压缩模型加速参数剪枝参数量化紧凑网络 deep learning model compression model acceleration parameter pruning parameter quantization compact network

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献4

1Jian CHENG,Pei-song WANG,Gang LI,Qing-hao HU,Han-qing LU.Recent advances in efficient computation of deep convolutional neural networks[J].Frontiers of Information Technology & Electronic Engineering,2018,19(1):64-77. 被引量：36
2雷杰,高鑫,宋杰,王兴路,宋明黎.深度网络模型压缩综述[J].软件学报,2018,29(2):251-266. 被引量：45
3曹文龙,芮建武,李敏.神经网络模型压缩方法综述[J].计算机应用研究,2019,36(3):649-656. 被引量：12
4纪荣嵘,林绍辉,晁飞,吴永坚,黄飞跃.深度神经网络压缩与加速综述[J].计算机研究与发展,2018,55(9):1871-1888. 被引量：56

二级参考文献5

1张敏,戈文航.基于概率计算的重叠双聚类算法[J].计算机工程与设计,2012,33(9):3579-3583. 被引量：3
2何志芬,杨明,刘会东.多标记分类和标记相关性的联合学习[J].软件学报,2014,25(9):1967-1981. 被引量：21
3梁斌,刘全,徐进,周倩,章鹏.基于多注意力卷积神经网络的特定目标情感分析[J].计算机研究与发展,2017,54(8):1724-1735. 被引量：138
4周晔,张军平.基于多尺度深度学习的商品图像检索[J].计算机研究与发展,2017,54(8):1824-1832. 被引量：12
5Zhi-HuaZhou.Rule Extraction： Using Neural Networks or for Neural Networks？[J].Journal of Computer Science & Technology,2004,19(2):249-253. 被引量：14

共引文献137

1艾祖鹏,刘雨帆,阮晓峰,李兵.深度卷积神经网络压缩与加速研究进展[J].中国基础科学,2022(3):1-9.
2董晓,刘雷,李晶,冯晓兵.面向稀疏卷积神经网络的GPU性能优化方法[J].软件学报,2020(9):2944-2964. 被引量：3
3杨本臣,裴欢菲.灰狼优化支持向量机的推荐算法[J].辽宁工程技术大学学报（自然科学版）,2021,40(6):552-557. 被引量：3
4Peng Liu,Wei Jiang,Xiaohui Wang,Hongmin Li,Hongjian Sun.Research and application of artificial intelligence service platform for the power field[J].Global Energy Interconnection,2020,3(2):175-185. 被引量：3
5周光朕,杜姗姗,冯瑞,欧丽君,刘斌.基于残差量化卷积神经网络的人脸识别方法[J].计算机系统应用,2018,27(8):35-41. 被引量：5
6杨扬,蓝章礼,陈巍.基于统计分析的卷积神经网络模型压缩方法[J].计算机系统应用,2018,27(8):49-55. 被引量：1
7段秉环,文鹏程,李鹏.面向嵌入式应用的深度神经网络压缩方法研究[J].航空计算技术,2018,48(5):50-53. 被引量：3
8马力,王永雄.基于稀疏化双线性卷积神经网络的细粒度图像分类[J].模式识别与人工智能,2019,32(4):336-344. 被引量：14
9曾凡婧,雷鸣.基于卷积神经网络的花卉识别研究[J].电脑知识与技术,2019,15(4Z):185-188. 被引量：1
10冀树伟,杨喜旺,黄晋英,尹宁.基于特征复用的卷积神经网络模型压缩方法[J].计算机应用,2019,39(6):1607-1613. 被引量：6

同被引文献444

1奚琰.基于对比学习的细粒度遮挡人脸表情识别[J].计算机系统应用,2022,31(11):175-183. 被引量：4
2张政馗,庞为光,谢文静,吕鸣松,王义.面向实时应用的深度学习研究综述[J].软件学报,2020(9):2654-2677. 被引量：36
3葛道辉,李洪升,张亮,刘如意,沈沛意,苗启广.轻量级神经网络架构综述[J].软件学报,2020(9):2627-2653. 被引量：50
4邱锡鹏.《神经网络与深度学习》[J].中文信息学报,2020(7):4-4. 被引量：17
5徐嘉荟.基于模型剪枝的神经网络压缩技术研究[J].信息通信,2019,0(12):165-167. 被引量：7
6陆晔,祝涵珂,黄海涛.深度学习模型压缩方法及产品研究[J].电信科学,2020,36(S01):185-192. 被引量：2
7刘志颖,缪希仁,陈静,江灏.电力架空线路巡检可见光图像智能处理研究综述[J].电网技术,2020,44(3):1057-1069. 被引量：97
8肖勇,吴昊文,王宗义,王岩.面向可中断负荷控制的需求响应通信业务优化[J].电力系统自动化,2020,44(15):36-43. 被引量：12
9张星洲,鲁思迪,施巍松.边缘智能中的协同计算技术研究[J].人工智能,2019,0(5):55-67. 被引量：32
10万磊,佟鑫,盛明伟,秦洪德,唐松奇.Softmax分类器深度学习图像分类方法应用综述[J].导航与控制,2019,0(6):1-9. 被引量：62

引证文献61

1牛鑫,吕现伟,余辰.边缘智能:现状与挑战[J].武汉大学学报（理学版）,2023,69(2):270-282. 被引量：5
2李汶霞,殷声.燃烧合成中的有机物[J].材料导报,2000,14(5):45-48. 被引量：14
3侯晓龙,周培林,邹月娴.基于知识蒸馏的口语理解模型研究与实现[J].电子技术与软件工程,2021(2):180-184.
4刘鑫,韩强,周永帅,庹先国.基于深度学习的白酒分类识别方法[J].食品与机械,2021,37(4):68-71. 被引量：3
5李良熹,荣进国.基于深度学习的智能烘培类商品识别系统研究[J].信息与电脑,2021,33(13):156-158. 被引量：1
6孟宪法,刘方,李广,黄萌萌.卷积神经网络压缩中的知识蒸馏技术综述[J].计算机科学与探索,2021,15(10):1812-1829. 被引量：13
7蒋润熙,阿里甫·库尔班,耿丽婷.面向轻量化网络的安全帽检测算法[J].计算机工程与应用,2021,57(20):263-270. 被引量：19
8彭宇,姬森展,于希明,刘胜剑.语义分割网络的FPGA加速计算方法综述[J].仪器仪表学报,2021,42(9):1-12. 被引量：17
9杨学杰,宋凯,曹付勇,王一夔,许荣浩.前端化目标检测技术在电力巡检中的应用研究[J].山东电力技术,2022,49(1):7-12. 被引量：5
10余方洁,王斌.基于RGB-D图像的移动端点云分割方法研究[J].重庆理工大学学报（自然科学）,2022,36(2):126-134.

二级引证文献167

1张立豪,李鹏,刘轩宇.基于深度迁移学习的变工况气体泄漏检测[J].仪器仪表学报,2023,44(6):177-187. 被引量：2
2任晓旭,仇超,邓辉,戴子明,刘泽军,王晓飞.边缘智能融合区块链:研究现状、应用及挑战[J].信息与控制,2024,53(1):1-16. 被引量：2
3王征勇,徐臻,曹培根.电厂作业人员安全装备穿戴检测系统[J].电子技术应用,2021,47(S01):278-282. 被引量：4
4伍凡,沙俊伟,刘若鹏,徐贵力.基于搭桥式点云拼接的管道三维重建研究[J].电子测量技术,2023,46(21):151-158.
5孙立法,易茂祥,刘正文,鲁迎春,梁华国.建筑电气监控L-N总线控制器设计与测试[J].电子测量技术,2023,46(21):100-106. 被引量：1
6杜忠文,李庚霖,蒋菡,褚江恒,伍俊.基于次级缓存的SDRAM调度策略的研究[J].电子测量技术,2023,46(14):37-42. 被引量：1
7骆正山,刘雨静,王小完.多工况下基于EEMD-ICNN的输油管道泄漏识别[J].电子测量技术,2023,46(5):179-184. 被引量：1
8朱振峰,王若兰.低温燃烧合成法制备Ce_(1-x)Pr_xO_2红色纳米稀土颜料[J].中国陶瓷工业,2004,11(4):1-3. 被引量：21
9陈晓鹏.浪潮力倡“行业PC”新概念[J].中国计算机用户,2002(19):54-54.
10许前丰,严有为.凝胶-燃烧合成法制备纳米氧化物颗粒的研究进展[J].材料导报,2005,19(F05):119-121. 被引量：2

1那些不像成语的成语[J].作文（5-6年级适用）,2020(11).
2刘瑄,池明旻.基于多粒度特征蒸馏的遥感图像场景分类研究[J].计算机工程,2021,47(1):224-229. 被引量：2
3陈科峻,张叶.基于YOLO-v3模型压缩的卫星图像船只实时检测[J].液晶与显示,2020,35(11):1168-1176. 被引量：13
4张锐.汽车智能化即将进入加速轨道[J].中关村,2020(11):68-69.
5路来智,胡雪松.面向Linux系统的二进制漏洞防御技术的设计与实现[J].滨州学院学报,2020,36(4):69-73. 被引量：2
6郭斌,仵允港,王虹力,王豪,刘思聪,刘佳琪,於志文,周兴社.深度学习模型终端环境自适应方法研究[J].中国科学：信息科学,2020,50(11):1629-1644. 被引量：3
7张中前.基于STM32单片机的uC/OS-II操作系统移植[J].机电元件,2020,40(6):57-61. 被引量：4
8GONG Rongfang,HUANG Qin.Solving Severely Ill⁃Posed Linear Systems with Time Discretization Based Iterative Regularization Methods[J].Transactions of Nanjing University of Aeronautics and Astronautics,2020,37(6):979-994. 被引量：1

软件学报

2021年第1期

浏览历史

内容加载中请稍等...

深度学习模型压缩与加速综述被引量：61

参考文献4

二级参考文献5

共引文献137

同被引文献444

引证文献61

二级引证文献167

相关作者

相关机构

相关主题

浏览历史

深度学习模型压缩与加速综述 被引量：61

参考文献4

二级参考文献5

共引文献137

同被引文献444

引证文献61

二级引证文献167

相关作者

相关机构

相关主题

浏览历史

深度学习模型压缩与加速综述被引量：61