面向硬件加速的通用图像卷积实验平台

Hardware Acceleration Oriented General Experiment Platform of Image Convolution

下载PDF

导出

摘要 FPGA因具有较好的并行处理能力和灵活性,使其在卷积神经网络硬件加速计算中得到广泛的应用,但是传统的FPGA图像卷积实现中存在模块化设计以及空间开销较大的问题.本文提出了一种面向硬件加速的通用图像卷积开发平台.通过模块化设计,极大提高针对不同卷积核实现图像卷积开发的灵活性;另外通过图像批次处理技术,充分利用数据重复性实现内存共享,较好地降低了存储空间的开销.实验结果表明,本文设计的平台在模块化设计方面提供了更好的可重配置架构,非常适于实验教学应用;在存储空间需求方面,当并行度提高时,BRAM的复杂度只是线性增加,这对于功耗的降低具有优势. With fine parallel processing capability and flexibility,Field Programmable Gate Array(FPGA)has been widely applied to hardware-accelerated computation,especially in Convolution Neural Networks(CNN).However,traditional image convolution on FPGA has limited modular design and large space overhead.This study builds a general experiment platform of image convolution for hardware acceleration.Through the modular design,it greatly improves the flexibility in image convolution for different convolution kernels.In addition,an image batch-processing system is adopted to enable memory sharing due to data repetition,reducing the need for storage space.Experimental results present that the proposed platform boasts a better reconfigurable architecture in terms of modular design.Besides,the complexity of BRAM only increases linearly with higher parallelism,which has the advantage of reducing power consumption.

作者阚保强 KAN Bao-Qiang(Faculty of Information Technology,Concord College,Fujian Normal University,Fuzhou 350003,China)

机构地区福建师范大学协和学院信息技术系

出处《计算机系统应用》 2021年第2期77-82,共6页 Computer Systems & Applications

基金国家自然科学基金(61201216) 福建省教师教育科研项目(JAT191117) 泉州市科技计划(2017T009) 福建师范大学协和学院科研基金(KY20200202)。

关键词 FPGA 硬件加速图像卷积并行度 FPGA hardware acceleration image convolution parallelism

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1李小燕,张欣,闫小兵,任德亮,李彦青,傅长娟.基于FPGA的卷积神经网络加速系统[J].河北大学学报（自然科学版）,2019,39(1):99-105. 被引量：5
2曾成龙,刘强.面向嵌入式FPGA的高性能卷积神经网络加速器设计[J].计算机辅助设计与图形学学报,2019,31(9):1645-1652. 被引量：11
3卢冶,陈瑶,李涛,蔡瑞初,宫晓利.面向边缘计算的嵌入式FPGA卷积神经网络构建方法[J].计算机研究与发展,2018,55(3):551-562. 被引量：47

二级参考文献5

1马久跃,余子濠,包云岗,孙凝晖.体系结构内可编程数据平面方法[J].计算机研究与发展,2017,54(1):123-133. 被引量：2
2施巍松,孙辉,曹杰,张权,刘伟.边缘计算:万物互联时代新型计算模型[J].计算机研究与发展,2017,54(5):907-924. 被引量：504
3夏辉,于佳,秦尧,程相国,陈仁海,潘振宽.嵌入式领域ECC专用指令处理器的研究[J].计算机学报,2017,40(5):1092-1108. 被引量：6
4周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1751
5Erdal Oruklu,Richard Hanley,Semih Aslan,Christophe Desmouliers,Fernando M. Vallina,Jafar Saniie.System-on-Chip Design Using High-Level Synthesis Tools[J].Circuits and Systems,2012,3(1):1-9. 被引量：7

共引文献59

1丁祥海,王志会.边缘计算在计算机科学方向的进展研究[J].信息与管理研究,2019,0(6):73-83.
2张舰.父亲(外一首)[J].岁月,2000(7):60-60.
3邓向武,齐龙,马旭,蒋郁,陈学深,刘海云,陈伟烽.基于多特征融合和深度置信网络的稻田苗期杂草识别[J].农业工程学报,2018,34(14):165-172. 被引量：52
4张庭略.基于硬件的神经网络加速[J].通讯世界,2018,0(8):77-79. 被引量：1
5任卫欣.基于FPGA的硬件加速系统[J].电子制作,2018,26(23):73-76. 被引量：1
6宋铁.基于卷积神经网络的GFW加速调度算法[J].软件,2019,40(3):217-221.
7袁柳,李皓,李勐,涂吉.基于PCIe高速通信接口的图像处理系统设计[J].科学技术与工程,2019,19(22):235-240. 被引量：6
8陈辰,柴志雷,夏珺.基于Zynq7000 FPGA异构平台的YOLOv2加速器设计与实现[J].计算机科学与探索,2019,13(10):1677-1693. 被引量：20
9张立立,王力.新一代人工智能交通信号控制器架构研究[J].重庆交通大学学报（自然科学版）,2019,38(11):6-13. 被引量：9
10杨亮,李祁.基于三模冗余架构的航天器FPGA可靠性设计[J].计算机测量与控制,2019,27(12):244-248. 被引量：5

1徐佳乐,黄丹平,田建平,于少东,黄丹,罗惠波,田颖,刘亮.新型曲房内循环温度测控系统设计[J].食品与机械,2020,36(12):90-94. 被引量：2
2吴婷婷,余自成.人工神经网络技术在药学领域应用的研究进展[J].中国临床药学杂志,2021,30(1):72-76. 被引量：6
3康磊,李慧,郑豪威,李鑫.卷积神经网络RLeNet加速器设计[J].电脑知识与技术,2021,17(6):16-19. 被引量：2
4林冲,张立民,闫文君,张聿远.基于深度残差网络的实时无线电信号监测研究[J].测控技术,2020,39(12):74-79. 被引量：1
5钟鸣,李诚炜,陈菲,姜丽燕,李继文,王川.气相色谱法分析1,3-丁二烯产品中的二聚物及痕量抽提剂含量[J].石油化工,2021,50(1):61-66. 被引量：2
6牛云鹏,张多利,唐旭,宋宇鲲.一种可重构多核系统的仿真加速方案[J].微电子学与计算机,2021,38(2):19-24.
7侯杰,雷玉琳,饶丰,张静,王雁.角膜地形图与调制传递函数测量SMILE矫治近视术后有效光学区的比较[J].中华实验眼科杂志,2021,39(2):126-132. 被引量：11
8胡园园,张忠杰,黄露.量子化学计算解析手性共价有机框架材料6色谱固定相的手性拆分机理[J].色谱,2020,38(12):1449-1455.
9肖成,刘作军,张磊.基于自适应阈值的小波BP神经网络风电变桨系统故障预测[J].可再生能源,2021,39(2):201-207. 被引量：7
10郭保苏,庄集超,章钦,吴凤和.基于多分量卷积神经网络的多晶硅晶片颜色差异检测[J].中国机械工程,2021,32(3):297-304. 被引量：2

计算机系统应用

2021年第2期

浏览历史

内容加载中请稍等...

面向硬件加速的通用图像卷积实验平台

参考文献3

二级参考文献5

共引文献59

相关作者

相关机构

相关主题

浏览历史