期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于众核架构的BP神经网络算法优化 被引量:1
1
作者 周文 《电子世界》 2017年第3期48-51,共4页
近年来,众核处理器(Many Integrated Cores,MIC)越来越多地为人们所关注,众核架构已经成为许多超算的首选。BP神经网络是采用反向误差传播(Back Propagation,BP)算法的人工神经网络,对于处理器的浮点计算能力要求比较高。目前最新的Inte... 近年来,众核处理器(Many Integrated Cores,MIC)越来越多地为人们所关注,众核架构已经成为许多超算的首选。BP神经网络是采用反向误差传播(Back Propagation,BP)算法的人工神经网络,对于处理器的浮点计算能力要求比较高。目前最新的Intel Xeon Phi(KNL)众核处理器可以达到3TFLOPS的双精度浮点峰值性能。本文对BP神经网络在KNL上进行了向量化扩展,并使用寄存器分块和缓存分块方法优化研究。实验结果表明在KNL上最快能达到220img/s的处理速度,其加速比达到了13.2,为GPU的2.9倍,KNC的2.28倍。 展开更多
关键词 众核架构 BP神经网络 缓存分块 向量化
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部