一种基于数据标准差的卷积神经网络量化方法被引量：3

A Quantification Method of Convolutional Neural Network Based on Data Standard Deviation

下载PDF

导出

摘要当前卷积神经网络模型存在规模过大且运算复杂的问题,难以应用部署在资源受限的计算平台.针对此问题,本文基于数据标准差提出了一种适合部署在现场可编程门阵列(Field Programmable Gate Array, FPGA)上的对数量化方法 .首先,依据FPGA的特性提出对数量化方法,将32 bit浮点乘法运算转换为整数乘法及移位运算,提高了运算效率.然后通过研究数据分布特点,提出基于数据标准差的输入量化及权值混合bit量化方法,能够有效减少量化损失.通过对RepVGG、EfficientNet等网络进行效率与精度对比实验,8 bit量化使得大型神经网络精度仅下降1%左右;输入量化为8 bit,权重量化为10 bit场景下,模型精度损失小于0.2%,达到浮点模型几乎相同的准确率.实验表明,所提量化方法能够使得模型大小减少75%左右,在基本保持原有模型准确率的同时有效地降低功耗损失、提高运算效率. Due to the large scale of the current convolutional neural network model and complex calculations,it is not suitable for deployment on resource-constrained computing platforms.In order to solve this problem,this paper propos⁃es a logarithmic quantization method based on data standard deviation,which is suitable for deployment on FPGA(Field Programmable Gate Array).According to the characteristics of FPGA,this paper proposes a logarithmic quantization meth⁃od to convert the 32 bit floating point multiplication operation into integer multiplication and shift operation,which im⁃proves the efficiency of the operation.By studying the characteristics of data distribution,the input quantization and mixed bit weight quantization methods based on data standard deviation are proposed,which can effectively reduce the quantiza⁃tion loss.The experimental results show that the accuracy of large-scale neural network is only reduced by about 1%due to 8-bit quantization.When the input is quantized to 8 bits and the weight is quantized to 10 bits,the accuracy loss of the mod⁃el is less than 0.2%,which is almost the same as that of the floating-point model.Experimental results show that the pro⁃posed method can reduce the size of the model by about 75%,and effectively reduce the power loss and improve the com⁃puting efficiency while maintaining the accuracy of the original model.

作者黄赟张帆郭威陈立羊光 HUANG Yun;ZHANG Fan;GUO Wei;CHEN Li;YANG Guang(Information Engineering University,Zhengzhou,Hennan 450001,China;National Digital Switching System Engineering Technology Research Center,Zhengzhou,Hennan 450002,China;Henan Administration of Radio and Television Monitoring Center,Zhengzhou,Hennan 450002,China)

机构地区信息工程大学国家数字交换系统工程技术研究中心河南省广播电视监测中心

出处《电子学报》 EI CAS CSCD 北大核心 2023年第3期639-647,共9页 Acta Electronica Sinica

基金国家自然科学基金创新研究群体项目(No.61521003)。

关键词卷积神经网络现场可编程门阵列对数量化数据标准差混合bit convolutional neural networks field programmable gate array(FPGA) logarithmic quantization stan⁃dard deviation of the data mixed bit number

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1蹇强,张培勇,王雪洁.一种可配置的CNN协加速器的FPGA实现方法[J].电子学报,2019,47(7):1525-1531. 被引量：20
2刘杰,葛一凡,田明,马力强.基于ZYNQ的可重构卷积神经网络加速器[J].电子学报,2021,49(4):729-735. 被引量：10
3罗会兰,陈鸿坤.基于深度学习的目标检测研究综述[J].电子学报,2020,48(6):1230-1239. 被引量：152
4李宝奇,贺昱曜,强伟,何灵蛟.基于并行附加特征提取网络的SSD地面小目标检测模型[J].电子学报,2020,48(1):84-91. 被引量：16
5江泽涛,秦嘉奇,张少钦.参数池化卷积神经网络图像分类方法[J].电子学报,2020,48(9):1729-1734. 被引量：17

二级参考文献14

1周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1789
2毕威,黄伟国,张永萍,高冠琪,朱忠奎.基于图像显著轮廓的目标检测[J].电子学报,2017,45(8):1902-1910. 被引量：17
3罗畅,王洁,王鹏飞,肖军,肖红.卷积自编码器中粗粒度池化特征提取研究[J].电子学报,2017,45(10):2390-2401. 被引量：5
4张榜,来金梅.一种基于FPGA的卷积神经网络加速器的设计与实现[J].复旦学报（自然科学版）,2018,57(2):236-242. 被引量：15
5王强,李孝杰,陈俊.Supplement卷积神经网络的图像分类方法[J].计算机辅助设计与图形学学报,2018,30(3):385-391. 被引量：5
6余乐,李任伟,王瑶,李洋洋,吴超,贾瑞.综述:面向SoC-FPGA的开源处理器[J].电子学报,2018,46(4):992-1004. 被引量：8
7陆维娜,胡瑜,叶靖,李晓维.面向卷积神经网络加速器吞吐量优化的FPGA自动化设计方法[J].计算机辅助设计与图形学学报,2018,30(11):2164-2173. 被引量：8
8黄继鹏,史颖欢,高阳.面向小目标的多尺度Faster-RCNN检测算法[J].计算机研究与发展,2019,56(2):319-327. 被引量：91
9裴伟,许晏铭,朱永英,王鹏乾,鲁明羽,李飞.改进的SSD航拍目标检测方法[J].软件学报,2019,30(3):738-758. 被引量：66
10李宝奇,贺昱曜,何灵蛟,强伟.基于全卷积神经网络的非对称并行语义分割模型[J].电子学报,2019,47(5):1058-1064. 被引量：11

共引文献209

1慕君林,马博,王云飞,任卓,刘双喜,王金星.基于深度学习的农作物病虫害检测算法综述[J].农业机械学报,2023,54(S02):301-313. 被引量：21
2侯志斌,朱愿,娄静涛.面向自动驾驶的3D目标检测技术研究综述[J].军事交通学报,2022(8):78-84. 被引量：3
3杨铭.空地一体遥感技术在轨道交通安全保护区巡查中的应用[J].测绘通报,2024(S02):178-181. 被引量：1
4黄戟雄.5G和人工智能技术在光缆巡检中的应用[J].广西通信技术,2023(4):23-28. 被引量：1
5谭瑛,黄彬,关俊波,钟雪飞,陈坚.基于5G消息和深度学习的宽带故障排查方案研究[J].广西通信技术,2022(3):26-29.
6曾永艺.理论与实践结合改善金融监管[J].金融理论与实践,2000(3):7-9.
7张舰.父亲(外一首)[J].岁月,2000(7):60-60.
8杨博文,杨海涛,高浩浩.CNN加速器中卷积计算单元的硬件设计[J].数字技术与应用,2019,37(10):136-137. 被引量：2
9左国渭,应三丛.FPGA的可配置卷积运算单元的设计与实现[J].单片机与嵌入式系统应用,2020,20(11):54-58. 被引量：2
10YUAN Yong,CHEN Chen,HU Xiyuan,PENG Silong.CNQ:Compressor-Based Non-uniform Quantization of Deep Neural Networks[J].Chinese Journal of Electronics,2020,29(6):1126-1133.

同被引文献13

1于浛,魏喜庆,宋申民,刘铭.基于自适应容积卡尔曼滤波的非合作航天器相对运动估计[J].航空学报,2014,35(8):2251-2260. 被引量：14
2王楷,徐世杰,黎康,汤亮.双视线测量相对导航方法误差分析与编队设计[J].航空学报,2018,39(9):147-161. 被引量：6
3杨莉琼,蔡利强,古松.基于机器学习方法的安全帽佩戴行为检测[J].中国安全生产科学技术,2019,15(10):152-157. 被引量：33
4肖余之,靳永强,陈欢龙,顾冬晴,徐峰.在轨服务若干关键技术研究进展[J].上海航天（中英文）,2021,38(3):85-95. 被引量：15
5毛莺池,唐江红,王静,平萍,王龙宝.基于Faster R-CNN的多任务增强裂缝图像检测方法[J].智能系统学报,2021,16(2):286-293. 被引量：17
6徐沁,梁玉莲,王冬越,罗斌.基于SE-Res2Net与多尺度空谱融合注意力机制的高光谱图像分类[J].计算机辅助设计与图形学学报,2021,33(11):1726-1734. 被引量：26
7无.中华人民共和国2021年国民经济和社会发展统计公报[J].新华文摘,2022(9):46-57. 被引量：4
8王梓,孙晓亮,李璋,程子龙,于起峰.基于Transformer模型的卫星单目位姿估计方法[J].航空学报,2022,43(5):485-498. 被引量：2
9王建波,武友新.改进YOLOv4-tiny的安全帽佩戴检测算法[J].计算机工程与应用,2023,59(4):183-190. 被引量：11
10褚晶辉,李梦,吕卫.基于深度学习的自适应动态滤波器剪枝方法[J].激光与光电子学进展,2022,59(24):167-173. 被引量：3

引证文献3

1许荣斌,许智强,王吉祥,谢莹.图神经网络研究与进展[J].莆田学院学报,2023,30(5):1-10.
2李胜利,刘忆宁,高谭芮.基于改进YOLOv7-tiny的安全帽佩戴检测算法[J].电子设计工程,2024,32(20):78-83.
3王梓,王靖皓,李杨,李璋,于起峰.基于轻量级神经网络的非合作目标位姿单目测量[J].航空学报,2024,45(22):189-202.

1邓万宇,赵怡娜,杨婉祯,张博,李昊,叶书齐.基于多尺度融合和投影匹配约束的跨模态哈希方法[J].激光与光电子学进展,2022,59(24):56-65.
2牛德芳.基于整体观念视域下的单元复习教学探索——以苏教版数学四年级下册“三位数乘两位数”单元复习教学为例[J].小学教学研究,2023(7):41-43.
3于飞.以“层”为基统领理法——“三位数乘两位数”教学实践与思考[J].小学数学教师,2023(3):27-30.
4涂灿,王琛,吴志伟.基于5G的MEC应用部署研究和政务园区实践[J].邮电设计技术,2023(3):76-82. 被引量：2
5支文瑜,沈春锋,许晨杰.基于云边协同的钢板表面缺陷检测研究与应用[J].信息技术与标准化,2023(4):89-92.
6殷梓轩,孙涵.基于注意力金字塔与监督哈希的细粒度图像检索[J].计算机技术与发展,2023,33(3):20-26.
7李金臣.“小数乘法”单元整体学习设计[J].中小学数学（小学版）,2023(1):100-102.
8刘鹏,陆璐,李志强.工业互联网技术发展分析及算网融合的趋势思考[J].自动化博览,2023,40(2):29-31. 被引量：2
9杨华.中波发射台数字化监控系统的设计[J].西部广播电视,2023,44(5):237-240. 被引量：5
10蔡全福,贺立红,王志军,姚文达,欧阳帆,廖靖远,吴文浩.基于PLS和BP网络的硅钢铁损预测研究[J].电工钢,2023,5(2):27-30. 被引量：2

电子学报

2023年第3期

浏览历史

内容加载中请稍等...

一种基于数据标准差的卷积神经网络量化方法被引量：3

参考文献5

二级参考文献14

共引文献209

同被引文献13

引证文献3

相关作者

相关机构

相关主题

浏览历史

一种基于数据标准差的卷积神经网络量化方法 被引量：3

参考文献5

二级参考文献14

共引文献209

同被引文献13

引证文献3

相关作者

相关机构

相关主题

浏览历史

一种基于数据标准差的卷积神经网络量化方法被引量：3