基于AI神经网络加速芯片的模型量化算法被引量：2

Model Quantization Algorithm Based on AI Neural Network Acceleration Chip

下载PDF

导出

摘要近年来,随着深度学习的不断发展,深度卷积神经网络在各个实际场景中得到广泛的应用。然而,由于训练好的模型参数的保存精度和推理精度通常是32位浮点型,其计算复杂度高、内存占用较大、耗时长等缺点,导致一些精度很高的模型往往很难部署到计算和内存资源受限的边缘设备上去。针对此,本文提出一种将浮点模型量化为定点模型的量化算法,此算法可以在模型训练过程中使用网络学习出特定的层应该采取的量化精度,避免了人为设定量化精度从而导致训练好的定点模型精度较浮点模型精度严重降低的情况。最后结合ASIC神经网络加速芯片进行边缘端部署,证明了算法的有效性。 In recent years, with the continuous development of deep learning, deep convolutional neural network has been widely used in various practical scenes. However, the storage accuracy and reasoning accuracy of trained model parameters are usually 32-bit floating-point type, which has the disadvantages of high computational complexity, large memory occupation and long time-consuming.As a result, some models with high accuracy are often difficult to deploy to edge devices with limited computing and memory resources.In view of this, this paper proposes a quantization algorithm that quantizes the floating-point model into a fixed-point model. This algorithm can use the network to learn the quantization accuracy that should be adopted by a specific layer in the process of model training,avoiding the situation that the quantization accuracy is artificially set, resulting in a serious reduction in the accuracy of the trained fixed-point model compared with the floating-point model. Finally, the edge deployment is combined with ASIC neural network acceleration chip to prove the effectiveness of the algorithm.

作者王骞陶青川 Wang Qian;Tao Qingchuan(School of Electronic Information,Sichuan University,Chengdu 610065)

机构地区四川大学电子信息学院

出处《现代计算机》 2021年第36期28-33,共6页 Modern Computer

关键词参数量化深度学习加速芯片 parameter quantification deep learning acceleration chip

分类号 TP183 [自动化与计算机技术—控制理论与控制工程] TN40 [电子电信—微电子学与固体电子学]

引文网络
相关文献

参考文献4

1张慧,王坤峰,王飞跃.深度学习在目标视觉检测中的应用进展与展望[J].自动化学报,2017,43(8):1289-1305. 被引量：245
2尹首一,郭珩,魏少军.人工智能芯片发展的现状及趋势[J].科技导报,2018,36(17):45-51. 被引量：34
3吴卫贤,赵鸣,黄晓丹.基于量化和模型剪枝的卷积神经网络压缩方法[J].软件导刊,2021,20(10):78-83. 被引量：7
4曾焕强,胡浩麟,林向伟,侯军辉,蔡灿辉.深度神经网络压缩与加速综述[J].信号处理,2022,38(1):183-194. 被引量：13

二级参考文献11

1王飞跃.平行系统方法与复杂系统的管理和控制[J].控制与决策,2004,19(5):485-489. 被引量：332
2Tom R.Halfhill,马志强.XMOS重新定义晶圆——软件定义芯片挑战ASIC、ASSP以及FPGA[J].电子产品世界,2007,14(10):80-80. 被引量：1
3韩俊刚,刘有耀,张晓.图形处理器的历史现状和发展趋势[J].西安邮电学院学报,2011,16(3):61-64. 被引量：24
4王飞跃.平行控制:数据驱动的计算控制方法[J].自动化学报,2013,39(4):293-302. 被引量：130
5黄凯奇,任伟强,谭铁牛.图像物体分类与检测算法综述[J].计算机学报,2014,37(6):1225-1240. 被引量：195
6王坤峰,苟超,王飞跃.平行视觉:基于ACP的智能视觉计算方法[J].自动化学报,2016,42(10):1490-1500. 被引量：49
7Jeff Dorsch.现场可编程门阵列FPGA芯片及其应用[J].集成电路应用,2018,35(1):77-79. 被引量：9
8孙永杰.地平线:架构创新BPU 算法+芯片+云一体化[J].通信世界,2018,0(13):29-29. 被引量：2
9林向伟,曾焕强,侯进辉,朱建清,蔡灿辉.基于多细节卷积神经网络的单幅图像去雨方法[J].信号处理,2019,35(3):460-465. 被引量：8
10卢海伟,夏海峰,袁晓彤.基于滤波器注意力机制与特征缩放系数的动态网络剪枝[J].小型微型计算机系统,2019,40(9):1832-1838. 被引量：8

共引文献293

1庞宁.基于深度学习的输电线杆塔鸟巢检测与识别[J].自动化与仪器仪表,2020(4):195-198. 被引量：6
2安宝磊.AI芯片的落地场景和关键技术分析[J].微纳电子与智能制造,2021,3(4):87-91.
3尹首一.人工智能芯片概述[J].微纳电子与智能制造,2019,1(2):7-11. 被引量：16
4傅隆生,宋珍珍,Zhang Xin,李瑞,王东,崔永杰.深度学习方法在农业信息中的研究进展与应用现状[J].中国农业大学学报,2020,25(2):105-120. 被引量：53
5潘婷婷,陈文佳,谌凯,仇秋飞.基于专利分析和文献计量的我国神经网络芯片发展研究[J].科技通报,2021,37(10):120-127. 被引量：4
6万士哲.干法造纸纤维空气动力成网过程的研究[J].浙江造纸,2000(1):16-18.
7池美珠,陆中权,除辉.新生儿缺氧缺血性脑病血糖、血皮质醇水平变化及临床意义[J].新生儿科杂志,2000,15(1):12-13. 被引量：10
8H.埃德尼,朱海滨,李显靖.新型矿物分析系统[J].国外金属矿山,2000,25(2):53-54.
9张细莲.例谈线性规划问题的最优解[J].中学数学研究（华南师范大学）（上半月）,2000(4):28-29.
10李美玲.浅谈深度学习在目标检测中的发展[J].科技风,2017(24):237-237. 被引量：5

同被引文献16

1谭常清.轨道车辆走行部故障监测系统可靠性分析与优化建议[J].电力机车与城轨车辆,2022,45(5):104-107. 被引量：1
2Yiming Cheng,Xu Zhang,Tianhe Liu,Changhong Wang.Finite-time Control of Discrete-time Systems With Variable Quantization Density in Networked Channels[J].IEEE/CAA Journal of Automatica Sinica,2020,7(5):1394-1402. 被引量：2
3龚圣斌,王少杰,侯亮,张荣辉,林晓涵,吴彬云.基于Faster-RCNN算法的轻量化改进及其在沙滩废弃物检测中的应用[J].厦门大学学报（自然科学版）,2022,61(2):253-261. 被引量：4
4李宏菱.城市轨道交通车辆网络节点重要性分配优化算法研究[J].电子设计工程,2022,30(9):57-61. 被引量：5
5Yu-Ang Wang,Bo Shen,Lei Zou.Recursive Fault Estimation With Energy Harvesting Sensors and Uniform Quantization Effects[J].IEEE/CAA Journal of Automatica Sinica,2022,9(5):926-929. 被引量：2
6王晞阳,陈继林,李猛,刘首文.FPGA架构上面向稀疏矩阵求解的静态调度算法[J].计算机工程,2022,48(7):199-205. 被引量：5
7谷永立,宗欣欣.基于深度学习的目标检测研究综述[J].现代信息科技,2022,6(11):76-81. 被引量：18
8张丽莹,庞春江,王新颖,李国亮.基于改进YOLOv3的多尺度目标检测算法[J].计算机应用,2022,42(8):2423-2431. 被引量：7
9李屹,魏建国,刘贯伟.模型剪枝算法综述[J].计算机与现代化,2022(9):51-59. 被引量：6
10顾俊杰,白雪丽.基于FPGA的多通道可调增益数据采集系统设计[J].电子设计工程,2022,30(19):44-48. 被引量：4

引证文献2

1毛淑菲,曾志高,张晓丽,袁鑫攀,文志强.低比特量化在目标检测上的研究与应用[J].信息记录材料,2022,23(12):159-161.
2李宁宁,师玲萍.基于时间递归神经网络的轨道车辆自检系统设计[J].工业仪表与自动化装置,2023(4):58-63.

1曾焕强,胡浩麟,林向伟,侯军辉,蔡灿辉.深度神经网络压缩与加速综述[J].信号处理,2022,38(1):183-194. 被引量：13
2张登科,王兴伟,贾杰,李婕.智能网卡研究新进展[J].小型微型计算机系统,2022,43(2):399-405. 被引量：2
3魏正,张兴军,卓志敏,纪泽宇,李泳昊.基于近端策略优化的阻变存储硬件加速器自动量化[J].计算机研究与发展,2022,59(3):518-532. 被引量：1
4夏艳东,戚荣鑫,季赛.工业物联网中基于PUFs轻量级的密钥交换协议研究[J].计算机应用与软件,2022,39(3):316-321. 被引量：5
5刘威,马文平,刘小雪.智能家居场景下基于SM2的门限群签名方案[J].计算机应用与软件,2022,39(3):295-301. 被引量：1
6苟平章,原晨,张芬.基于软件定义的WSNs非均匀分簇QoS路由算法[J].计算机工程与科学,2022,44(2):227-236.

现代计算机

2021年第36期

浏览历史

内容加载中请稍等...

基于AI神经网络加速芯片的模型量化算法被引量：2

参考文献4

二级参考文献11

共引文献293

同被引文献16

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于AI神经网络加速芯片的模型量化算法 被引量：2

参考文献4

二级参考文献11

共引文献293

同被引文献16

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于AI神经网络加速芯片的模型量化算法被引量：2