基于众核架构的BP神经网络算法优化被引量：1

Optimization of BP neural network algorithm based on many-core architecture

下载PDF

导出

摘要近年来,众核处理器(Many Integrated Cores,MIC)越来越多地为人们所关注,众核架构已经成为许多超算的首选。BP神经网络是采用反向误差传播(Back Propagation,BP)算法的人工神经网络,对于处理器的浮点计算能力要求比较高。目前最新的Intel Xeon Phi(KNL)众核处理器可以达到3TFLOPS的双精度浮点峰值性能。本文对BP神经网络在KNL上进行了向量化扩展,并使用寄存器分块和缓存分块方法优化研究。实验结果表明在KNL上最快能达到220img/s的处理速度,其加速比达到了13.2,为GPU的2.9倍,KNC的2.28倍。 In recent years, the MIC（Many Integrated Cores）more and more people＇s attention, many core architecture has become the first choice for many supercomputing.BP neural network is a kind of artificial neural network based on BP（Back Propagation）algorithm, which requires a high level of floating-point computing capability.The latest Intel Xeon Phi （KNL） core processor can achieve 3TFLOPS double precision floating point peak performance.In this paper, we extend the BP neural network on KNL, and use the method of register block and cache block to optimize the research.The experimental results show that the fastest processing speed of 220img/s can be achieved on the KNL, and the speedup ratio is 13.2, which is times of GPU and KNC is 2.28 times.

作者周文

机构地区南京航空航天大学计算机科学与技术学院

出处《电子世界》 2017年第3期48-51,共4页 Electronics World

基金国家自然科学基金(Grant No.61571226) 江苏省自然科学基金(青年科学基金)(Grant No.BK20140823)资助

关键词众核架构 BP神经网络缓存分块向量化 many-core architecture BP neural network cache block vectorizatio

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

同被引文献3

1冯云,周淑秋.MPI+OpenMP混合并行编程模型应用研究[J].计算机系统应用,2006,15(2):86-89. 被引量：24
2宋鹏,解闯,李金山,谭军,刘伟,谭惠文.基于MPI+OpenMP的三维声波方程正演模拟[J].中国海洋大学学报（自然科学版）,2015,45(9):97-102. 被引量：5
3唐兵,Laurent BOBELIN,贺海武.基于MPI和OpenMP混合编程的非负矩阵分解并行算法[J].计算机科学,2017,44(3):51-54. 被引量：8

引证文献1

1程雨芊.基于并行编程模型的SPECK 2n算法实现与优化[J].网络安全技术与应用,2017(10):61-63.

1黄博文.为什么需要72核心？解析Xeon Phi X200处理器[J].微型计算机,2016,0(25):100-104.
2刘培奇,毕傲睿.一种改进的基于纹理的图像修复算法[J].工业控制计算机,2014,27(3):12-13. 被引量：2
3李旻,杜海顺,王琪.基于KNC算法的中文网页分类方法研究[J].河南大学学报（自然科学版）,2010,40(5):529-532.
4GPU/MIC双剑合璧浪潮推出新旗舰异构超算服务器[J].电脑与电信,2015,0(8):12-12.
5林忠.反向误差传播的学习策略[J].系统工程与电子技术,1991,13(9):1-5. 被引量：1
6张应龙,李翠平,陈红.信息网络中一个有效的基于链接的结点相似度度量[J].软件学报,2014,25(11):2602-2615. 被引量：3
7新年新亮点！KNC新品M-130即将上市[J].数码时代,2007(4):52-52.
8金属“薄”客 KNC HR-888闪亮登场[J].网络与信息,2006,20(12):25-25.
92.2寸精视天籁，KNC Hr885大屏临市[J].数码时代,2006(9):14-14.
10邵真天,袁杰.一种基于曲波变换的图像去块算法[J].智能系统学报,2012,7(2):102-107.

电子世界

2017年第3期

浏览历史

内容加载中请稍等...

基于众核架构的BP神经网络算法优化被引量：1

同被引文献3

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于众核架构的BP神经网络算法优化 被引量：1

同被引文献3

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于众核架构的BP神经网络算法优化被引量：1