一种面向忆阻器加速器的神经网络模型压缩框架被引量：2

Towards ReRAM-based Accelerator:An Energy-efficient NN Model Compression Framework

下载PDF

导出

摘要当前基于忆阻器的神经网络加速器存在的资源需求高、系统功耗大等问题,提出了一种包含剪枝及量化算法在内的神经网络模型压缩框架.根据忆阻器阵列紧密耦合的特点,设计了一种忆阻器阵列感知的规则化增量剪枝算法,在保证模型准确度的条件下实现了硬件资源的节省;针对忆阻器加速器系统中ADC单元和忆阻器阵列功耗占比过大等问题,设计了一种二的幂次量化算法以降低加速器系统中ADC的精度需求以及计算阵列中低阻值忆阻器器件个数,实现系统功耗的降低.实验结果表明:提出的神经网络模型压缩框架在忆阻器加速器部署网络时可取得17.2〜30.7倍的能效提升以及4.3〜9.3倍的加速比,模型的精度损失维持在1%左右. The current ReRAM-based NN acceleratorshave many problems such as high hardwareresource demand and high power consumption.An energy-efficient modelcompression framework consisting of pruning and quantization algorithms is proposed.According to the tightly coupled crossbar structure and unstructured sparsity,a crossbar-aware incrementalstructured pruning algorithm is designedtoachievehigher sparsity and accuracy.A power of two quantizationmethod is designedto reduce ADC resolution requirements and the numberof low resistance states(LRS)ReRAM cells in crossbars to improvethe energy efficiency.Experimental results show thatthe proposed modelcompression framework can achieve 17.2-30.7x energy efficiencyand 4.3-9.3x speedup,compared with ReRAM-based acceleratorsfor dense NN with about 1%accuracy loss.

作者沈林耀王琴蒋剑飞景乃锋 SHEN Linyao;WANG Qin;JIANG Jianfei;JING Naifeng(School of Electronic Information and Electrical Engineering,Shanghai Jiao Tong University,Shanghai 200240,China)

机构地区上海交通大学电子信息与电气工程学院

出处《微电子学与计算机》 2021年第8期20-27,共8页 Microelectronics & Computer

关键词忆阻器加速器神经网络量化剪枝 ReRAM-based Accelerator Neural networks Quantization Pruning

分类号 TP389.1 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

同被引文献5

1刘建华,杨荣华,孙水华.离散二进制粒子群算法分析[J].南京大学学报（自然科学版）,2011,47(5):504-514. 被引量：62
2吴正苗,彭敏放,谭虎,沈美娥.基于SOFM网络和异质信息融合的模拟电路诊断[J].微电子学与计算机,2011,28(11):160-164. 被引量：2
3段书凯,胡小方,王丽丹,李传东,MAZUMDER Pinaki.忆阻器阻变随机存取存储器及其在信息存储中的应用[J].中国科学：信息科学,2012,42(6):754-769. 被引量：14
4朱玮,郭恬恬,刘兰,周荣荣.铝基薄膜忆阻器作为感觉神经系统的习惯化特性[J].物理学报,2021,70(6):291-298. 被引量：3
5朱任杰,张涛,柯志强.基于忆阻器的模拟人工神经元电路设计[J].微电子学与计算机,2014,31(8):171-176. 被引量：3

引证文献2

1文常保,刘达祺,朱玮,全思,茹锋.一种基于双忆阻的SOFM神经网络系统设计研究[J].微电子学与计算机,2022,39(5):111-117.
2成宇,邢恒拓,韩芳.基于忆阻器阵列的卷积网络混合映射部署优化[J].微电子学与计算机,2022,39(5):118-124.

1杨凯,李锐,罗林,谢利明.基于深度学习的车轮踏面表面缺陷检测研究[J].信息技术,2021,45(7):93-97. 被引量：8
2吴欣欣,欧焱,李文明,王达,张浩,范东睿.基于粗粒度数据流架构的稀疏卷积神经网络加速[J].计算机研究与发展,2021,58(7):1504-1517. 被引量：7
3刘强,邱黎明,祖自银,罗卫东,韦善阳,程肖禾,殷山.含裂隙煤样受载破坏过程视电阻分布特征[J].西安科技大学学报,2021,41(4):731-738. 被引量：2
4郑思杰,李杰,贺光辉.面向低延时目标检测的FPGA神经网络加速器设计[J].现代计算机,2021,27(18):38-43.
5汤庆浩,张常亮,张国伟,焦桢立.基于标准结构面粗糙度曲线的JRC量化算法[J].岩石力学与工程学报,2021,40(7):1402-1411. 被引量：8
6吴迪,胡斌,王如竹,余京京,林欣毅,李子亮.水工质热泵多种循环的理论研究与性能对比[J].化工学报,2021,72(S01):236-243. 被引量：1
7李欣瑶,刘飞阳,文鹏程,李鹏.卷积神经网络的软硬件协同加速技术[J].航空兵器,2021,28(3):99-104. 被引量：6

微电子学与计算机

2021年第8期

浏览历史

内容加载中请稍等...

一种面向忆阻器加速器的神经网络模型压缩框架被引量：2

同被引文献5

引证文献2

相关作者

相关机构

相关主题

浏览历史

一种面向忆阻器加速器的神经网络模型压缩框架 被引量：2

同被引文献5

引证文献2

相关作者

相关机构

相关主题

浏览历史

一种面向忆阻器加速器的神经网络模型压缩框架被引量：2