基于深度稀疏低秩分解的深度神经网络轻量化方法被引量：1

Lightweight method of deep neural network based on deep sparse low rank decomposition

导出

摘要基于嵌入式平台对深度神经网络轻量化的需求,结合模块化、逐层处理思想,以主流检测识别深度神经网络Faster RCNN轻量化为目标,设计基于深度稀疏低秩分解的轻量化方法.针对Faster RCNN网络架构特点,首先采用深度可分离卷积和稀疏低秩理论对Faster RCNN网络的特征提取主干网络部分进行初始轻量化;其次采用稀疏低秩裁剪对主干网络进行“逐层通道裁剪,逐层重训练,逐层调优”轻量化,采用张量Tensor-Train分解理论,对区域建议网络进行轻量化处理,尽可能保证低性能损失;再次对识别与分类网络进行稀疏低秩分解和通道裁剪,增加模型压缩倍数,减少所需要和所消耗计算资源;最后,基于感兴趣区域定位感知的RPN网络输入特征知识蒸馏,提升检测识别性能.数值实验表明,所提出方法可以实现模型压缩100倍,检测识别率仅下降5%. Based on the requirement of embedded devices for deep neural network lightweight, and combined with the idea of modularization and layer by layer processing, a lightweight method based on deep sparse low rank decomposition is designed to aim at the lightweight of the mainstream detection and recognition network Faster RCNN. In view of characteristics of the Faster RCNN network architecture, firstly, initially lightening the backbone part of the Faster RCNN feature extraction network is realized through the deep separable convolution and the sparse low-rank theory. Secondly,sparse low-rank pruning is used to further lighten the backbone network in the way of“layer by layer channel pruning, layer by layer retraining, and layer by layer tuning”. Then, the region proposal network is lightened based on the Tensor-train decomposition theory, and the performance loss is ensured as low as possible. Sparse low rank decomposition and channel pruning are applied to the recognition and classification network again, which results in more compression times, less memory and less computing resources required. Finally, the input feature knowledge distillation of the RPN network based on region of interest location perception improves the detection and recognition performance. Numerical experiments show that the proposed method can achieve model compression by 100 times, and the detection and recognition rate is only reduced by 5 %.

作者程旗李捷高晓利唐培人盛良睿王维 CHENG Qi;LI Jie;GAO Xiao-li;TANG Pei-ren;SHENG Liang-rui;WANG Wei(Sichuan Jiuzhou Electrical Group Co.Ltd,Mianyang 621000,China)

机构地区四川九洲电器集团有限责任公司

出处《控制与决策》 EI CSCD 北大核心 2023年第3期751-758,共8页 Control and Decision

关键词轻量化深度可分离卷积目标识别稀疏低秩裁剪知识蒸馏区域建议网络 lightweight deep separable convolution target recognition sparse low-rank pruning knowledge distillation region proposal net

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1薛俊韬,马若寒,胡超芳.基于MobileNet的多目标跟踪深度学习算法[J].控制与决策,2021,36(8):1991-1996. 被引量：11
2柳长源,王琪,毕晓君.多目标小尺度车辆目标检测方法[J].控制与决策,2021,36(11):2707-2712. 被引量：24

二级参考文献4

1张富凯,杨峰,李策.基于改进YOLOv3的快速车辆检测方法[J].计算机工程与应用,2019,55(2):12-20. 被引量：96
2王生生,王萌,王光耀.基于深度神经网络剪枝的两阶段遥感图像目标检测[J].东北大学学报（自然科学版）,2019,40(2):174-179. 被引量：12
3李会军,王瀚洋,李杨,叶宾.一种基于视觉特征区域建议的目标检测方法[J].控制与决策,2020,35(6):1323-1328. 被引量：7
4徐子豪,黄伟泉,王胤.基于深度学习的监控视频中多类别车辆检测[J].计算机应用,2019,39(3):700-705. 被引量：23

共引文献33

1李震霄,孙伟,刘明明,郑丽丽,陈劭颖.交通监控场景中的车辆检测与跟踪算法研究[J].计算机工程与应用,2021,57(8):103-111. 被引量：20
2田少兵,朱兴动,范加利,王正.基于检测的舰载机多目标实时跟踪算法[J].航空兵器,2021,28(4):49-55. 被引量：1
3曾庆祝,李新海,尹雁和,夏曼,廖伟全,梁景明.使用深度分离卷积网络实现继保压板状态识别[J].电气开关,2021,59(5):13-17.
4赖泓杰,陈泽佳,吴志安,欧阳纬熹,陈立.某面向深水网箱作业的水下机器人[J].机电设备,2021,38(6):48-54. 被引量：2
5张文龙,南新元.基于改进YOLOv5的道路车辆跟踪算法[J].广西师范大学学报（自然科学版）,2022,40(2):49-57. 被引量：6
6胡漫,曹继华,李士心,彭芙蓉.改进YOLOv3和DeepSort的多目标跟踪算法[J].天津职业技术师范大学学报,2022,32(1):52-57. 被引量：2
7杨超,李佳田,张泽龙,陆大进,张兴忆,杨树青.YOLOv4-tiny算法的融合模块在卷烟小包外观缺失检测中的应用[J].中国烟草学报,2022,28(2):59-64. 被引量：6
8孙东来,王继超,陈科,孙士尉,刘昕彤,周闻天.基于Ghost-YOLOv3-2算法的2尺度猪目标检测[J].江苏农业科学,2022,50(7):189-196. 被引量：3
9熊正午,吴瑞梅,黄俊仕,李霸聪,戴仕明,艾施荣.深度学习结合快速导向滤波识别自然环境下脐橙果实[J].江西农业大学学报,2022,44(3):736-746. 被引量：2
10杨启明,王洪超,刘少柱,温玉芬,魏来.油气管道线路智能监控管理平台设计开发[J].石油化工自动化,2022,58(3):23-26.

同被引文献8

1周平,张丽,李温鹏,戴鹏,柴天佑.集成自编码与PCA的高炉多元铁水质量随机权神经网络建模[J].自动化学报,2018,44(10):1799-1811. 被引量：18
2王前进,杨春雨,马小平,张春富,彭思敏.基于随机配置网络的井下供给风量建模[J].自动化学报,2021,47(8):1963-1975. 被引量：12
3代伟,李德鹏,杨春雨,马小平.一种随机配置网络的模型与数据混合并行学习方法[J].自动化学报,2021,47(10):2427-2437. 被引量：12
4Xiaofei Zhang,Hongbin Ma,Wenchao Zuo,Man Luo.Adaptive Control of Discrete-time Nonlinear Systems Using ITF-ORVFL[J].IEEE/CAA Journal of Automatica Sinica,2022,9(3):556-563. 被引量：3
5王进花,岳亮辉,曹洁,马佳林.基于随机变分推理贝叶斯神经网络的发电机轴承故障诊断[J].控制与决策,2023,38(4):1015-1021. 被引量：3
6南静,代伟,袁冠,周平.一种空间几何角度最大化的随机增量学习模型及应用[J].自动化学报,2023,49(6):1283-1294. 被引量：1
7南静,宁传峰,建中华,代伟.基于随机配置网络的轻量级人体行为识别模型[J].控制与决策,2023,38(6):1541-1550. 被引量：5
8贺敏,汤健,郭旭琦,阎高伟.基于流形正则化域适应随机权神经网络的湿式球磨机负荷参数软测量[J].自动化学报,2019,45(2):398-406. 被引量：15

引证文献1

1代伟,南静.随机权神经网络增量构造学习方法研究进展[J].控制与决策,2023,38(8):2231-2242.

1陈林文.市政道路桥梁工程中的软土地基处理技术[J].中文科技期刊数据库（全文版）工程技术,2023(3):0118-0121.
2井辉,范雨薇.区块链技术在人才评价领域的应用模式研究[J].科技和产业,2023,23(5):31-37.
3蓝开辉.基于机器视觉的乒乓球动作分类研究[J].陇东学院学报,2023,34(2):140-144.
4郑远攀,许博阳,王振宇.改进的YOLOv5烟雾检测模型[J].计算机工程与应用,2023,59(7):214-221. 被引量：4
5尚福瑞,范云飞,郝强,甄志伟.基于深度学习的工程作业智能监控技术的模型优化测试[J].粘接,2023,50(4):182-186. 被引量：3
6旗舰芯片+GT调优加持荣耀X40 GT打造性能铁三角[J].消费电子,2022(10):10-13.
7江党权,徐迅.机械系统运动方案的计算机辅助设计研究[J].中国科技期刊数据库工业A,2021(8):0168-0169.
8高一博,杨传栋,陈栋,凌冲.面向弹载图像的深度学习网络压缩方法研究[J].航空兵器,2023,30(1):95-103.
9阎庆,叶孟孟,张晶晶,刘晓,年福东,李腾.基于预检机制的偏振图像去烟研究[J].大气与环境光学学报,2023,18(2):108-118.
10黄艳国,杨训根,周满国.基于感兴趣区域的改进型LBP手指静脉识别[J].传感器与微系统,2023,42(4):143-147. 被引量：2

控制与决策

2023年第3期

浏览历史

内容加载中请稍等...

基于深度稀疏低秩分解的深度神经网络轻量化方法被引量：1

参考文献2

二级参考文献4

共引文献33

同被引文献8

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于深度稀疏低秩分解的深度神经网络轻量化方法 被引量：1

参考文献2

二级参考文献4

共引文献33

同被引文献8

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于深度稀疏低秩分解的深度神经网络轻量化方法被引量：1