卷积神经网络压缩与加速技术研究进展被引量：9

Research Progress on Convolutional Neural Network Compression and Acceleration Technology

下载PDF

导出

摘要神经网络压缩技术的出现缓解了深度神经网络模型在资源受限设备中的应用难题,如移动端或嵌入式设备.但神经网络压缩技术在压缩处理的自动化、稀疏度与硬件部署之间的矛盾、避免压缩后模型重训练等方面存在困难.本文在回顾经典神经网络模型和现有神经网络压缩工具的基础上,总结参数剪枝、参数量化、低秩分解和知识蒸馏四类压缩方法的代表性压缩算法的优缺点,概述压缩方法的评测指标和常用数据集,并分析各种压缩方法在不同任务和硬件资源约束中的性能表现,展望神经网络压缩技术具有前景的研究方向. The development of neural network compression relieves the difficulty of deep neural networks running on resource-restricted devices,such as mobile or embedded devices.However,neural network compression encounters challenges in automation of compression,conflict of the sparsity and hardware deployment,avoidance of retraining compressed networks and other issues.This paper firstly reviews classic neural network models and current compression toolkits.Secondly,this paper summarizes advantages and weaknesses of representative compression methods of parameter pruning,quantization,low-rank factorization and distillation.This paper lists evaluating indicators and common datasets for the performance evaluation and then analyzes compression performance in different tasks and resource constraints.Finally,promising development trends are stated in this paper as references for promoting the neural network compression technique.

作者尹文枫梁玲燕彭慧民曹其春赵健董刚赵雅倩赵坤 YIN Wen-Feng;LIANG Ling-Yan;PENG Hui-Min;CAO Qi-Chun;ZHAO Jian;DONG Gang;ZHAO Ya-Qian;ZHAO Kun(Inspur Electronic Information Industry Co.Ltd.,Jinan 250101,China;Guangdong Inspur Big Data Research Co.Ltd.,Guangzhou 510632,China)

机构地区浪潮电子信息产业股份有限公司广东浪潮大数据研究有限公司

出处《计算机系统应用》 2020年第9期16-25,共10页 Computer Systems & Applications

关键词神经网络压缩参数剪枝参数量化低秩分解知识蒸馏 neural network compression parameter pruning parameter quantizatipn low-rank factorization knowledge distillation

分类号 TP332 [自动化与计算机技术—计算机系统结构] TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1Kaiming Nan,Sicong Liu,Junzhao Du,Hui Liu.Deep Model Compression for Mobile Platforms:A Survey[J].Tsinghua Science and Technology,2019,24(6):677-693. 被引量：7
2纪荣嵘,林绍辉,晁飞,吴永坚,黄飞跃.深度神经网络压缩与加速综述[J].计算机研究与发展,2018,55(9):1871-1888. 被引量：56

二级参考文献2

1梁斌,刘全,徐进,周倩,章鹏.基于多注意力卷积神经网络的特定目标情感分析[J].计算机研究与发展,2017,54(8):1724-1735. 被引量：139
2周晔,张军平.基于多尺度深度学习的商品图像检索[J].计算机研究与发展,2017,54(8):1824-1832. 被引量：12

共引文献61

1Peng Liu,Wei Jiang,Xiaohui Wang,Hongmin Li,Hongjian Sun.Research and application of artificial intelligence service platform for the power field[J].Global Energy Interconnection,2020,3(2):175-185. 被引量：3
2曾凡婧,雷鸣.基于卷积神经网络的花卉识别研究[J].电脑知识与技术,2019,15(4Z):185-188. 被引量：1
3向陶然,叶笑春,李文明,冯煜晶,谭旭,张浩,范东睿.基于细粒度数据流架构的稀疏神经网络全连接层加速[J].计算机研究与发展,2019,56(6):1192-1204. 被引量：11
4雷霆,谢榕昌,黄滔,钟力强,王柯,杨跞,樊韪铖.基于SSD改进算法的电缆隧道积水识别方法[J].广东电力,2019,32(9):131-136. 被引量：4
5陈莉君,李卓.基于深度神经压缩的YOLO优化[J].计算机技术与发展,2019,29(12):72-75. 被引量：2
6宋非洋,吴黎明,郑耿哲,何欣颖.基于MobileNetV3的结构性剪枝优化[J].自动化与信息工程,2019,40(6):20-25. 被引量：9
7任杰,高岭,于佳龙,袁璐.面向边缘设备的高能效深度学习任务调度策略[J].计算机学报,2020,43(3):440-452. 被引量：16
8孙胜,李叙晶,刘敏,杨博,过晓冰.面向异构IoT设备协作的DNN推断加速研究[J].计算机研究与发展,2020,57(4):709-722. 被引量：1
9晏晓天,黄山.基于分组异构卷积的轻量级目标检测网络[J].计算机科学,2020,47(4):108-111. 被引量：5
10裴斐,刘进锋,李崤河.一种面向移动端的图像风格迁移模型压缩算法[J].激光与光电子学进展,2020,57(6):219-225. 被引量：3

同被引文献51

1栾丽华,吉根林.决策树分类技术研究[J].计算机工程,2004,30(9):94-96. 被引量：115
2杜晓凤,李翠华,李晶.基于复合感受野的轮廓检测算法[J].电子与信息学报,2009,31(7):1630-1634. 被引量：17
3赵志宏,杨绍普,马增强.基于卷积神经网络LeNet-5的车牌字符识别研究[J].系统仿真学报,2010,22(3):638-641. 被引量：151
4周庆,牟超,杨丹.教育数据挖掘研究进展综述[J].软件学报,2015,26(11):3026-3042. 被引量：97
5卢钰.电子文件管理的前端控制原则[J].兰台世界,2016(24):52-56. 被引量：7
6杨艳青,柴旭荣.基于人工神经网络法的遥感影像分类研究[J].山西师范大学学报（自然科学版）,2017,31(1):94-98. 被引量：7
7王湘新,时洋,文梅.CNN卷积计算在移动GPU上的加速研究[J].计算机工程与科学,2018,40(1):34-39. 被引量：5
8李成录.大数据背景下机器学习算法的综述[J].信息记录材料,2018,19(5):4-5. 被引量：16
9蒋昂波,王维维.ReLU激活函数优化研究[J].传感器与微系统,2018,37(2):50-52. 被引量：103
10王浩畅,李斌.聊天机器人系统研究进展[J].计算机应用与软件,2018,35(12):1-6. 被引量：25

引证文献9

1陈嘉钰.智慧档案馆数据化管理功能的实现[J].档案管理,2021(1):57-58. 被引量：9
2马壮,杨威.边缘计算驱动的对话机器人终端部署[J].软件工程,2021,24(2):19-23. 被引量：3
3田佳鹭,邓立国.基于改进VGG-16神经网络的图像分类方法[J].计算技术与自动化,2021,40(2):131-135. 被引量：10
4张有波,郭威,周悦,徐高飞,李广伟,孙洪鸣.基于多粒度剪枝的水下遗迹实时目标检测[J].激光与光电子学进展,2021,58(14):278-287. 被引量：7
5郝一帆,杜子东,支天.二进制张量分解法简化神经网络推理计算[J].高技术通讯,2022,32(7):687-695.
6曹挚.基于深度学习的高校学生成绩预测与评价方法研究[J].信息记录材料,2022,23(11):123-125. 被引量：4
7曹挚.基于深度学习的软件缺陷预测方法研究[J].机电产品开发与创新,2023,36(1):142-143. 被引量：2
8曹毅杰.基于深度学习的剪枝优化技术研究[J].集成电路应用,2024,41(4):411-415.
9田欢,王鑫.螨虫图像特征可视化卷积神经网络研究[J].甘肃科技纵横,2024,53(6):58-64.

二级引证文献34

1周道先,张吟龙,徐高飞,杨雨沱,梁炜.基于形变卷积和深层聚合网络的水下文物检测[J].仪器仪表学报,2023,44(11):185-195. 被引量：1
2邓志平,王冬霞,马晓冬,曹玉东.基于注意力机制的NewVGG16-BiGRU鼾声分类[J].计算机应用,2023,43(S01):276-280. 被引量：1
3赵竟楠.档案数字化助力构建国民经济发展新格局[J].档案管理,2021(3):127-128. 被引量：4
4邓华云.档案管理从信息管理到数据管理的转型机制与策略探讨[J].湖南行政学院学报,2021(5):57-61. 被引量：2
5徐洁.高校智慧档案馆的智能管理存在问题及方略[J].兰台内外,2021(27):34-35. 被引量：1
6黄淼,李韬,文旭,钟浩.电磁暂态仿真模型敏捷生成方法研究[J].重庆理工大学学报（自然科学）,2022,36(2):191-196. 被引量：1
7王程丽,赵静,杨攀攀,李姗.基于迁移学习的小样本SAR船只目标识别[J].移动通信,2022,46(4):22-27. 被引量：4
8黄乾峰,董琴.基于卷积神经网络的农作物病害图像分类研究[J].信息与电脑,2022,34(5):138-142. 被引量：1
9饶舰,韩佳.基于大数据的公路工程安全智能管控云平台构建[J].土木建筑工程信息技术,2022,14(2):120-126. 被引量：7
10孙安.“NoSQL”数据管理技术在档案大数据中的应用探析[J].管理工程师,2022,27(3):34-40. 被引量：2

1郭丽敏,刘丹,王立辉,李清,俞军.一种适合资源受限设备的Falcon实现[J].微电子学与计算机,2020,37(9):50-55. 被引量：1
2龙虎,张小梅.基于大数据的多媒体弱关联数据智能压缩方法研究[J].现代电子技术,2020,43(19):102-105. 被引量：6

计算机系统应用

2020年第9期

浏览历史

内容加载中请稍等...

卷积神经网络压缩与加速技术研究进展被引量：9

参考文献2

二级参考文献2

共引文献61

同被引文献51

引证文献9

二级引证文献34

相关作者

相关机构

相关主题

浏览历史

卷积神经网络压缩与加速技术研究进展 被引量：9

参考文献2

二级参考文献2

共引文献61

同被引文献51

引证文献9

二级引证文献34

相关作者

相关机构

相关主题

浏览历史

卷积神经网络压缩与加速技术研究进展被引量：9