期刊文献+

基于4 × 4卷积核的异步卷积加速算法研究

Asynchronous Convolution Acceleration Algorithm Based on 4 × 4 Convolution Kernels
下载PDF
导出
摘要 由于基于软件端卷积神经网络的卷积运算难以满足现在的卷积神经网络对运算性能与功耗的要求,为了克服困难,本文设计了一种基于4 × 4卷积核的异步卷积加速算法来对卷积神经网络进行加速。采用AddTree的形式来实现kernel矩阵和pic矩阵的乘加运算,1个Add Tree计算单元是1个4 × 4的卷积核与相同大小的图片矩阵的数据做乘加运算得到一个特征值,采用多个Add Tree的并行计算方式可以大幅度提升卷积计算速率。实验结果表明,该加速算法还有不受时钟频率限制的优点,可以工作在任何时钟频率下,且单个计算单元的计算速度也十分的快,计算一个特征值的时间大约在500 ns左右,相对于软件端的计算速率提升了10倍左右。
机构地区 兰州大学
出处 《软件工程与应用》 2018年第3期160-167,共8页 Software Engineering and Applications
基金 国家自然科学基金(61602224,61402121) 中央高校基础研究基金(lzujbky-2017-194,lzujbky-2018-130,GrantNo.lzujbky-2016-br03) 广西科技计划项目(桂科AB17129012)佛山市科技创新项目(GrantNo.2015IT100095) 中国教育科研网创新项目(GrantNo.NGIL20150606) 广东省科技创新项目(GrantNo.2016B010108002) 广西混杂计算与集成电路设计分析重点实验室开放基金课题资助(HCIC201714)。
  • 相关文献

参考文献7

二级参考文献83

  • 1杨治明,王晓蓉,彭军,陈应祖.BP人工神经网络在图像分割中的应用[J].计算机科学,2007,34(3):234-236. 被引量:46
  • 2焦李成.神经网络系统理论[M].西安:西安电子科技大学出版社,1996..
  • 3LeCun Y,Bottou L,Bengio Y,et al.Gradient-based learningapplied to document recognition[J].Proceedings ofthe IEEE,1998,86(11):2278-2324.
  • 4Simard P Y,Steinkraus D,Platt J C.Best practices forconvolutional neural networks applied to visual documentanalysis[C]//Proceedings of the 7th InternationalConference on Document Analysis and Recognition,2003:958-962.
  • 5Chellapilla K,Puri S,Simard P.High performance convolutionalneural networks for document processing[C]//10th International Workshop on Frontiers in HandwritingRecognition,2006.
  • 6Chellapilla K,Shilman M,Simard P.Optimally combininga cascade of classifiers[C]//Electronic Imaging,2006:207-214.
  • 7Garcia C,Delakis M.Convolutional face finder:a neuralarchitecture for fast and robust face detection[J].IEEETransactions on Pattern Analysis and Machine Intelligence,2004,26(11):1408-1423.
  • 8Frome A,Cheung G,Abdulkader A,et al.Large-scale privacyprotection in google street view[C]//IEEE InternationalConference on Computer Vision,2009:2373-2380.
  • 9Bouvrie J.Notes on convolutional neural networks[Z].2006.
  • 10Sankaradas M,Jakkula V,Cadambi S,et al.A massivelyparallel coprocessor for convolutional neural networks[C]//20th IEEE International Conference on Application-specificSystems,Architectures and Processors,2009:53-60.

共引文献616

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部