-
题名基于众核架构的BP神经网络算法优化
被引量:1
- 1
-
-
作者
周文
-
机构
南京航空航天大学计算机科学与技术学院
-
出处
《电子世界》
2017年第3期48-51,共4页
-
基金
国家自然科学基金(Grant No.61571226)
江苏省自然科学基金(青年科学基金)(Grant No.BK20140823)资助
-
文摘
近年来,众核处理器(Many Integrated Cores,MIC)越来越多地为人们所关注,众核架构已经成为许多超算的首选。BP神经网络是采用反向误差传播(Back Propagation,BP)算法的人工神经网络,对于处理器的浮点计算能力要求比较高。目前最新的Intel Xeon Phi(KNL)众核处理器可以达到3TFLOPS的双精度浮点峰值性能。本文对BP神经网络在KNL上进行了向量化扩展,并使用寄存器分块和缓存分块方法优化研究。实验结果表明在KNL上最快能达到220img/s的处理速度,其加速比达到了13.2,为GPU的2.9倍,KNC的2.28倍。
-
关键词
众核架构
BP神经网络
缓存分块
向量化
-
Keywords
many-core architecture
BP neural network
cache block
vectorizatio
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-