基于特征分布调整的深度神经网络二值量化方法

Feature distribution guided binary neural networks

导出

摘要二值卷积神经网络(BNNs)由于其占用空间小、计算效率高而受到关注.但由于量化激活特征的正负部分分布不均等问题,二值网络和浮点深度神经网络(DNNs)之间存在着明显的性能差距,影响了其在资源受限平台上的部署.二值网络性能受限的主要原因是特征离散性造成的信息损失以及分布优化不当造成的语义信息消失.针对此问题,应用特征分布调整引导二值化,通过调整特征的均值方差均衡特征分布,减小离散性造成的信息损失.同时,通过分组激励与特征精调模块设计,调整优化量化零点位置,均衡二值化激活分布,最大程度保留语义信息.实验表明,所提出方法在不同骨干网络、使用不同数据集时均能取得较好效果,其中在CIFAR-10上使用ResNet-18网络量化后网络准确率仅损失0.4%,高于当前主流先进二值量化算法. In recent years,binary neural networks(BNNs)have received attention due to their small memory consumption and high computational efficiency.However,there exists a significant performance gap between BNNs and floating-point deep neural networks(DNNs)due to problems,such as imbalanced distributions of positive and negative parts of quantized activation features,which affects their deployment on resource-constrained platforms.The main reason for the limited accuracy of binary networks is the information loss caused by feature discretization and the disappearance of semantic information caused by improper distribution optimization.To address this problem,this paper applies feature distribution adjustment to guide binarization,which adjusts the mean-variance of features to balance the feature distribution and reduce the information loss caused by discretization.At the same time,through the design of group excitation and feature finetuning module,the quantization zero points are optimized to balance the binarization activation distributions and retain the semantic information to the maximum extent.Experiments show that the proposed method achieves better results on different backbone networks using different datasets,in which only 0.4%of accuracy is lost after binarizing ResNet-18 on CIFAR-10,which surpasses the current mainstream BNNs.

作者刘畅陈莹 LIU Chang;CHEN Ying(Key Laboratory of Advanced Process Control for Light Industry of Ministry of Education,Jiangnan University,Wuxi 214122,China)

机构地区江南大学轻工过程先进控制教育部重点实验室

出处《控制与决策》 EI CSCD 北大核心 2024年第6期1840-1848,共9页 Control and Decision

基金国家自然科学基金项目(62173160)。

关键词特征分布均值方差调整语义信息保留模型压缩二值神经网络模型量化 feature distribution mean and variance adjustment semantic information speicherung model compression binary neural networks neural network quantization

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献4

1郑香平,梁循.基于剪枝优化的深层胶囊网络[J].计算机学报,2022,45(7):1557-1570. 被引量：1
2潘瑞东,孔维健,齐洁.基于预训练模型与知识蒸馏的法律判决预测算法[J].控制与决策,2022,37(1):67-76. 被引量：9
3程旗,李捷,高晓利,唐培人,盛良睿,王维.基于深度稀疏低秩分解的深度神经网络轻量化方法[J].控制与决策,2023,38(3):751-758. 被引量：3
4余文勇,张阳,姚海明,石绘.基于轻量化重构网络的表面缺陷视觉检测[J].自动化学报,2022,48(9):2175-2186. 被引量：12

二级参考文献8

1黄杰贤,李迪,叶峰,张舞杰.挠性印制电路板焊盘表面缺陷的检测[J].光学精密工程,2010,18(11):2443-2453. 被引量：27
2袁静,章毓晋.融合梯度差信息的稀疏去噪自编码网络在异常行为检测中的应用[J].自动化学报,2017,43(4):604-610. 被引量：27
3李良福,马卫飞,李丽,陆铖.基于深度学习的桥梁裂缝检测算法研究[J].自动化学报,2019,45(9):1727-1742. 被引量：109
4金侠挺,王耀南,张辉,刘理,钟杭,贺振东.基于贝叶斯CNN和注意力网络的钢轨表面缺陷检测系统[J].自动化学报,2019,45(12):2312-2327. 被引量：25
5薛俊韬,马若寒,胡超芳.基于MobileNet的多目标跟踪深度学习算法[J].控制与决策,2021,36(8):1991-1996. 被引量：16
6柳长源,王琪,毕晓君.多目标小尺度车辆目标检测方法[J].控制与决策,2021,36(11):2707-2712. 被引量：27
7刘宗林,张梅山,甄冉冉,公佐权,余南,付国宏.融入罪名关键词的法律判决预测多任务学习模型[J].清华大学学报（自然科学版）,2019,59(7):497-504. 被引量：25
8王文广,陈运文,蔡华,曾彦能,杨慧宇.基于混合深度神经网络模型的司法文书智能化处理[J].清华大学学报（自然科学版）,2019,59(7):505-511. 被引量：20

共引文献21

1李泽辉,陈新度,练洋奇.基于卷积自编码网络的瓷砖表面缺陷检测[J].现代计算机,2021,27(24):109-114. 被引量：1
2张怡,孙永荣,赵科东,李华,曾庆化.空中加油场景下的目标联合检测跟踪算法[J].计算机应用,2022,42(9):2893-2899. 被引量：1
3HOU Yupeng,ZHANG Lei,WANG Yuanquan,ZHAO Xiaosong,FENG Guoce,ZHANG Yirui.Field rapid detection method of wind turbine blade fixing bolt defects based on FPGA[J].Optoelectronics Letters,2022,18(9):541-546.
4白昌前,代晓,张岸.基于数据增强和改进BERT的罪名预测[J].电脑与信息技术,2023,31(1):37-40. 被引量：1
5陈文兵,车文刚,蔡小尧,蒋仕飞.基于修复对抗网络的烟包表面缺陷检测方法[J].包装与食品机械,2023,41(2):58-62.
6杨书新,江斌,黄伟东.融合犯罪构成的多任务判决预测[J].赣南师范大学学报,2023,44(3):55-61.
7余传明,江一帆.基于预训练模型的法律文本类案匹配研究[J].科技情报研究,2023,5(3):13-25. 被引量：1
8胡开喜,李琳,吴小华,解庆,袁景凌.一种同伴知识互增强下的序列推荐方法[J].自动化学报,2023,49(7):1456-1470.
9付晗,胡峰,龚杰,余联庆.面向织物疵点检测的缺陷重构方法[J].纺织学报,2023,44(7):103-109. 被引量：2
10代伟,南静.随机权神经网络增量构造学习方法研究进展[J].控制与决策,2023,38(8):2231-2242. 被引量：2

1李良,宁靖.一种基于多分支轻量级神经网络的图像分类方法[J].辽东学院学报（自然科学版）,2024,31(1):54-60.
2陈钰芬,胡思慧.知识复杂性的测度方法综述与比较[J].情报杂志,2024,43(3):165-172. 被引量：1
3施玉倩,巫朝霞.基于Logistic最优化鲁棒性的聚类联邦学习[J].软件工程,2024,27(6):15-20.

控制与决策

2024年第6期

浏览历史

内容加载中请稍等...

基于特征分布调整的深度神经网络二值量化方法

参考文献4

二级参考文献8

共引文献21

相关作者

相关机构

相关主题

浏览历史