卷积神经网络低位宽量化推理研究被引量：1

Research on Low Bitwidth Inference of Convolutional Neural Networks

下载PDF

导出

摘要随着深度卷积神经网络对计算量与访存量的需求增加,网络压缩与加速技术成为近几年的研究热点。针对网络架构改进、伪量化等重训练方法在压缩深度卷积神经网络时存在算力要求大、数据集难获得以及部署周期长等缺点,论文提出一种有效利用卷积神经网络数值均衡以及批规范化和ReLU非线性激活组合信息特点的压缩加速方法,只需对预训练网络模型权值进行调整即可达到较好的压缩加速效果。该方法适合在FPGA或ASIC这类定制硬件上实现,并能够实现硬件逻辑资源、能耗、访存带宽以及物体检测精度之间的平衡。最后,在人脸检测任务上验证了该卷积神经网络低位宽量化推理方法的有效性。 With the increasing demand for computational resource and memory access by deep convolutional neural networks,network compression and acceleration technology have become a research hotspot in recent years.The retraining methods such as network architecture improvement and pseudo-quantization have the disadvantages of large computational resource consume,difficult data acquisition and difficult to deployment when compressing deep convolutional neural networks.This paper proposes an acceleration method that effectively utilizes the numerical equilibrium of convolutional neural networks and the combination of batch normalization and ReLU nonlinear activation.Reasonable compression and acceleration effect can be achieved by only adjust the weight of the pre-trained network model.The method is suitable for implementation on custom hardware such as FPGA or ASIC,and can balance between hardware logic resources utilization,power consumption,memory bandwidth and object detection accuracy.Finally,the effectiveness of the proposed method on the face detection task is shown.

作者付强姜晶菲窦勇 FU Qiang;JIANG Jingfei;DOU Yong(School of Computer,National University of Defense Technology,Changsha 410073)

机构地区国防科技大学计算机学院

出处《计算机与数字工程》 2019年第11期2671-2674,共4页 Computer & Digital Engineering

基金核高基国家重大专项(编号:2018ZX01028101) 国家自然科学基金重点项目(编号:61732018)资助

关键词卷积神经网络量化批规范化 convolutional neural network quantification batch normalization

分类号 Q954.52 [生物学—动物学]

引文网络
相关文献

同被引文献10

1赵胜伟,葛仕明,叶奇挺,罗朝,李强.基于增强监督知识蒸馏的交通标识分类[J].中国科技论文,2017,12(20):2355-2360. 被引量：5
2邓棋,雷印杰,田锋.用于肺炎图像分类的优化卷积神经网络方法[J].计算机应用,2020,40(1):71-76. 被引量：21
3姚巍巍,张洁.基于模型剪枝和半精度加速改进YOLOv3-tiny算法的实时司机违章行为检测[J].计算机系统应用,2020,29(4):41-47. 被引量：8
4巩凯强,张春梅,曾光华.卷积神经网络模型剪枝结合张量分解压缩方法[J].计算机应用,2020,40(11):3146-3151. 被引量：7
5雷鸣,王曙光,凌冲,杨传栋,秦杰.基于模型压缩YOLOv4的弹载图像舰船目标实时检测[J].兵器装备工程学报,2021,42(9):225-230. 被引量：3
6张宏丽,白翔宇.利用优化剪枝GoogLeNet的人脸表情识别方法[J].计算机工程与应用,2021,57(19):179-188. 被引量：13
7韦越,陈世超,朱凤华,熊刚.基于稀疏正则化的卷积神经网络模型剪枝方法[J].计算机工程,2021,47(10):61-66. 被引量：14
8金映谷,张涛,杨亚宁,王月,楚艳丽.基于MobileNet V2的口罩佩戴识别研究[J].大连民族大学学报,2021,23(5):404-409. 被引量：6
9张旭,周云成,刘忠颖,李昕泽.基于改进ShuffleNet V2模型的苹果叶部病害识别及应用[J].沈阳农业大学学报,2022,53(1):110-118. 被引量：14
10曹文龙,芮建武,李敏.神经网络模型压缩方法综述[J].计算机应用研究,2019,36(3):649-656. 被引量：12

引证文献1

1单铭琦,文峰,高文印.基于模型压缩算法改进YOLOv4-tiny模型的车辆检测技术研究[J].沈阳理工大学学报,2023,42(2):36-42. 被引量：2

二级引证文献2

1文峰,石明泽,刘思萌,殷向阳.基于教师-学生模型的点云目标检测算法[J].沈阳理工大学学报,2024,43(5):49-56.
2冯晶,符丹丹,刘强,朱克佳.基于YOLOv8的航拍车辆检测技术研究[J].计算机科学与应用,2023,13(12):2399-2407.

1张海涛.大数据背景下的计算机网络信息安全及防护研究[J].新商务周刊,2019,0(16):233-234. 被引量：1
2夏淑钧.个性化护理配合健康教育在小儿手足口病感染防控护理中的应用分析[J].今日健康,2016,15(7):227-227. 被引量：2
3俞庆华.优傲机器人UR+平台首个中国开发者亮相工博会[J].汽车零部件,2017(11):43-43.
4Xilinx专为数据中心加速设计的软件定义开发环境上线AWS[J].单片机与嵌入式系统应用,2017,17(11):59-59.
5任卫欣.基于FPGA的硬件加速系统[J].电子制作,2018,26(23):73-76. 被引量：1
6杨靓,黄蔚,查祝华,张红平.兼顾志愿者地理信息的国家应急测绘公众服务平台设计[J].测绘通报,2019(9):147-151. 被引量：1
7胡博,刘俊.“金融+科技” 焕发银行网点服务新活力[J].中国金融电脑,2019(11):25-28. 被引量：4
8郭语青,王可,沈沐衡,陈晓祺,陈家阳.并行分布式LMS自适应滤波器的FPGA实现[J].信息与电脑,2019,31(22):42-43. 被引量：2
9田剑豪.FPGA在无线电监测中的应用分析与展望[J].中国无线电,2019,0(10):46-48. 被引量：5
10郑子遇,江先阳,汤知日.一种基于忆阻器的可扩展乘法器设计[J].微电子学与计算机,2019,36(11):60-64. 被引量：2

计算机与数字工程

2019年第11期

浏览历史

内容加载中请稍等...

卷积神经网络低位宽量化推理研究被引量：1

同被引文献10

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

卷积神经网络低位宽量化推理研究 被引量：1

同被引文献10

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

卷积神经网络低位宽量化推理研究被引量：1