摘要
由于基于软件端卷积神经网络的卷积运算难以满足现在的卷积神经网络对运算性能与功耗的要求,为了克服困难,本文设计了一种基于4 × 4卷积核的异步卷积加速算法来对卷积神经网络进行加速。采用AddTree的形式来实现kernel矩阵和pic矩阵的乘加运算,1个Add Tree计算单元是1个4 × 4的卷积核与相同大小的图片矩阵的数据做乘加运算得到一个特征值,采用多个Add Tree的并行计算方式可以大幅度提升卷积计算速率。实验结果表明,该加速算法还有不受时钟频率限制的优点,可以工作在任何时钟频率下,且单个计算单元的计算速度也十分的快,计算一个特征值的时间大约在500 ns左右,相对于软件端的计算速率提升了10倍左右。
出处
《软件工程与应用》
2018年第3期160-167,共8页
Software Engineering and Applications
基金
国家自然科学基金(61602224,61402121)
中央高校基础研究基金(lzujbky-2017-194,lzujbky-2018-130,GrantNo.lzujbky-2016-br03)
广西科技计划项目(桂科AB17129012)佛山市科技创新项目(GrantNo.2015IT100095)
中国教育科研网创新项目(GrantNo.NGIL20150606)
广东省科技创新项目(GrantNo.2016B010108002)
广西混杂计算与集成电路设计分析重点实验室开放基金课题资助(HCIC201714)。