KCPNet:张量分解的轻量卷积模块设计、部署与应用被引量：3

KCPNet:Design,Deployment,and Application of Tensor-Decomposed Lightweight Convolutional Module

下载PDF

导出

摘要为解决现有卷积模块在实际应用中内存消耗高、计算效率低的问题,在Kronecker CANDECOMP/PARAFAC(KCP)张量分解的基础上,提出一种轻量、高效、瓶颈结构的卷积模块(KCPNet)。对普通卷积作2阶KCP分解,生成的因子张量分别映射为两层负责输入输出通道变化的1×1卷积和两层负责特征提取的变通道可分离卷积,再将这4层卷积组成含有瓶颈结构的KCPNet卷积模块。基于OpenCL并行编程框架将KCPNet部署于嵌入式GPU,并围绕pico-flexx深度相机开发了动态手势识别应用。实验结果表明:在ImageNet大规模标准数据集上,相比ResNet、ResNeXt等已有的张量分解卷积模块,KCPNet在准确率相近的情况下能够兼顾空间和计算复杂度的效率;在中等规模标准数据集CIFAR-10上,KCPNet能够在无明显精度损失的前提下将传统的VGG模型压缩至原先的16.1%并节约75.5%的计算量;在面向嵌入式GPU时,并行部署的KCPNet可使CIFAR-10的识别速度达到100帧/s。以KCPNet为核心开发的手势识别应用程序可达到99.5%的准确率和100帧/s以上的运行速度,内存开销为22 MB。 To deal with the issues of high memory consumption and low computation efficiency of the existing convolutional modules in practical application,following the Kronecker CANDECOMP/PARAFAC(KCP)tensor decomposition,a lightweight,efficient,bottleneck-structured convolutional module(KCPNet)is proposed.The normal convolution is firstly decomposed as the 2nd-order KCP,the generated factor tensors are mapped into two 1×1 convolutions to carry out the transformation of input and output channels,and into two depthwise convolutions with changeable channels to perform the feature extraction,respectively.Then,these 4 convolutions are assembled into the KCPNet module with a bottleneck structure.The KCPNet is deployed in the embedded GPU based on the OpenCL parallel programming framework,and the dynamic gesture recognition application is developed around a pico-flexx depth camera.The experimental results show that compared with the existing convolutional modules of tensor decomposition such as ResNet,ResNeXt,etc.,the KCPNet can consider the efficiency of both space and computation complexity with a similar accuracy on the large-scale benchmark dataset ImageNet;the KCPNet can also compress the traditional VGG model to its original 16.1%and save 75.5%of computation without obvious accuracy loss on the medium-scale benchmark dataset CIFAR-10;the parallelly deployed KCPNet can achieve the recognition rate of 100 frames/s for CIFAR-10 when orienting to the embedded GPU.The developed gesture recognition application with the KCPNet as its core can achieve 99.5%accuracy and the running rate beyond 100 frames/s,and the memory cost is 22 MB.

作者王鼎衡赵广社姚满李国齐 WANG Dingheng;ZHAO Guangshe;YAO Man;LI Guoqi(School of Automation Science and Engineering, Xi’an Jiaotong University, Xi’an 710049, China;Department of Precision Instrumentation, Tsinghua University, Beijing 100084, China)

机构地区西安交通大学自动化科学与工程学院清华大学精密仪器系

出处《西安交通大学学报》 EI CAS CSCD 北大核心 2022年第3期135-146,共12页 Journal of Xi'an Jiaotong University

基金国家自然科学基金资助项目(61876215)。

关键词张量分解 Kronecker CANDECOMP/PARAFAC张量分解轻量卷积模块并行部署手势识别 tensor decomposition Kronecker CANDECOMP/PARAFAC tensor decomposition lightweight convolutional module parallel deployment gesture recognition

分类号 TP274.5 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献7

1林景栋,吴欣怡,柴毅,尹宏鹏.卷积神经网络结构优化综述[J].自动化学报,2020,46(1):24-37. 被引量：126
2毛远宏,贺占庄,刘露露.目标跟踪中基于深度可分离卷积的剪枝方法[J].西安交通大学学报,2021,55(1):52-59. 被引量：4
3梁峰,董名,田志超,张国和,成舒婷.面向轻量化神经网络的模型压缩与结构搜索[J].西安交通大学学报,2020,54(11):106-112. 被引量：6
4程士卿,郝问裕,李晨,张茁涵,曹容玮.低秩张量分解的多视角谱聚类算法[J].西安交通大学学报,2020,54(3):119-125. 被引量：6
5王子愉,袁春,黎健成.利用可分离卷积和多级特征的实例分割[J].软件学报,2019,30(4):954-961. 被引量：14
6周云成,许童羽,邓寒冰,苗腾.基于面向通道分组卷积网络的番茄主要器官实时识别[J].农业工程学报,2018,34(10):153-162. 被引量：14
7杨贤志,黄国方,周宁宁.基于分组卷积和特征图级联的轻量级目标检测[J].计算机应用研究,2021,38(5):1590-1594. 被引量：2

二级参考文献24

1葛道辉,李洪升,张亮,刘如意,沈沛意,苗启广.轻量级神经网络架构综述[J].软件学报,2020(9):2627-2653. 被引量：46
2赵杰文,刘木华,杨国彬.基于HIS颜色特征的田间成熟番茄识别技术[J].农业机械学报,2004,35(5):122-124. 被引量：73
3王长耀,刘正军,颜春燕.成像光谱数据特征选择及小麦品种识别实验研究[J].遥感学报,2006,10(2):249-255. 被引量：31
4尹建军,毛罕平,王新忠,沈宝国.自然条件下番茄成熟度机器人判别模型[J].农业机械学报,2009,40(10):146-150. 被引量：9
5贾建华,焦李成,柳炳祥.图像分割的谱聚类集成算法[J].西安交通大学学报,2010,44(6):93-98. 被引量：7
6李寒,王库,曹倩,殷晶晶.基于机器视觉的番茄多目标提取与匹配[J].农业工程学报,2012,28(5):168-172. 被引量：89
7杨清宇,孙凤伟,张曌,张迪,庄健.利用测地线距离的改进谱聚类算法[J].西安交通大学学报,2012,46(8):1-7. 被引量：5
8王新忠,韩旭,毛罕平.基于吊蔓绳的温室番茄主茎秆视觉识别(英文)[J].农业工程学报,2012,28(21):135-141. 被引量：11
9杨金鸿,邓廷权.基于距离度量学习的半监督多视角谱聚类算法[J].四川大学学报（工程科学版）,2016,48(1):146-151. 被引量：2
10张婷,李玉鑑,胡海鹤,张亚红.基于跨连卷积神经网络的性别分类模型[J].自动化学报,2016,42(6):858-865. 被引量：40

共引文献165

1阳雨妍,宋爱国,沈书馨,李会军.基于CNN-GRU的遥操作机器人操作者识别与自适应速度控制方法[J].仪器仪表学报,2021,42(3):123-131. 被引量：16
2何龙健,钟子乐,邹大辉,黄灿斌,邓卓然,梁艳.面向医疗整容的三维人脸重建与编辑系统[J].计算机系统应用,2022,31(12):69-77.
3李小艳,宋亚林,乐飞.残差密集块的卷积神经网络图像去噪[J].计算机系统应用,2022,31(10):166-174. 被引量：2
4傅隆生,宋珍珍,Zhang Xin,李瑞,王东,崔永杰.深度学习方法在农业信息中的研究进展与应用现状[J].中国农业大学学报,2020,25(2):105-120. 被引量：51
5张余冉,段喜萍,李昀松,刘庭圆.基于ResNet-ACmix融合特征的ECO目标跟踪算法改进[J].哈尔滨师范大学自然科学学报,2023,39(1):75-82.
6欧阳勇,李玉晶.牙本质磷蛋白及其功能研究[J].北京口腔医学,2000,8(1):43-46. 被引量：2
7郭荆学.安琪TH-AADY在肖家桥酒厂的应用[J].酿酒科技,2000(3):49-49.
8刘哲,黄文准,王利平.基于改进K-means聚类算法的大田麦穗自动计数[J].农业工程学报,2019,35(3):174-181. 被引量：29
9马永杰,宋晓凤.基于YOLO和嵌入式系统的车流量检测[J].液晶与显示,2019,34(6):613-618. 被引量：16
10陈春玲,杨雪,周云成,王俊,朱浩祎,苑婷,于泳.基于卷积神经网络的绝缘子目标识别方法研究[J].沈阳农业大学学报,2019,50(4):501-506. 被引量：13

同被引文献18

1陈秀秀,叶盛,洪艳艳,潘海龙,冉启华.黄河骨干水库水沙调度的目标函数构建和应用[J].应用基础与工程科学学报,2020(3):727-739. 被引量：11
2赵凌云,路威,秦景,孙庚,高霈生.软土深基坑组合开敞式支护数值模拟与监测分析[J].水利水电技术,2020,51(2):155-161. 被引量：14
3葛道辉,李洪升,张亮,刘如意,沈沛意,苗启广.轻量级神经网络架构综述[J].软件学报,2020(9):2627-2653. 被引量：46
4林景栋,吴欣怡,柴毅,尹宏鹏.卷积神经网络结构优化综述[J].自动化学报,2020,46(1):24-37. 被引量：126
5黄晓程,余地华,邓昌福,黄心颖,张松波.大型深基坑施工内控集约化监测点布设研究[J].施工技术,2020,49(1):41-44. 被引量：15
6杨明辉,吴志勇,赵明华.挡墙后有限宽度土体土拱效应分析及土压力计算方法[J].湖南大学学报（自然科学版）,2020,47(3):19-27. 被引量：14
7李阳阳,王士杰,刘明珠.深窄基坑桩锚撑组合支护结构桩顶侧向位移的解析解[J].河北农业大学学报,2020,43(4):116-120. 被引量：1
8陈保国,闫腾飞,王程鹏,宗秋雷.深基坑地连墙支护体系协调变形规律试验研究[J].岩土力学,2020,41(10):3289-3299. 被引量：37
9罗正东,吴鹏,黄河,尹鸿达.富水砂卵石地层深基坑开挖变形监测与数值分析[J].建筑结构,2020,50(23):128-133. 被引量：23
10高晗,田育龙,许封元,仲盛.深度学习模型压缩与加速综述[J].软件学报,2021,32(1):68-92. 被引量：54

引证文献3

1余海坤,吕志刚,王鹏,李晓艳,王洪喜,李亮亮.CIRBlock:融合低代价卷积的轻量反向残差模块[J].计算机工程与应用,2023,59(20):94-102.
2王鼎衡,刘保荣,杨维,杨朝旭.KCPStack:张量分解的卷积核分层矩阵压缩方法[J].西安交通大学学报,2024,58(3):137-148.
3王贵美,周建亮.高层建筑深基坑支护结构位移动态监测方法[J].哈尔滨工程大学学报,2024,45(4):717-721.

1史晓晨.远程控制终端信号回传系统部署与应用[J].广播电视网络,2021,28(11):77-81.
2陈武.浅析蜜罐在内网中的部署与应用[J].网络安全和信息化,2021(11):132-133.
3杨俊,张献文,阳述辉.智能桌面虚拟化技术在大型灌区的应用[J].四川水利,2021,42(6):138-140. 被引量：1
4时永刚,李祎,周治国,张岳,夏卓岩.基于阶梯结构的U-Net结肠息肉分割算法[J].电子与信息学报,2022,44(1):39-47. 被引量：7
5黄敬频,白瑞,徐云,赵耿威.四元数矩阵的直积分解及最佳逼近[J].西南师范大学学报（自然科学版）,2022,47(2):1-6. 被引量：1
6蒋远辉,刘霆.多业务安全网关部署与应用[J].信息技术,2022,46(1):44-48.
7郭志华,薛晓慧,厉娜,孟祥甫,马晓琴.弱电网条件下并网逆变器阻抗协同稳定域辨识[J].科学技术与工程,2022,22(1):192-201.
8柯耀,王琪,苗育茁,黄浪,陈汉新.基于PARAFAC分析和SVM离心泵故障诊断方法[J].噪声与振动控制,2022,42(1):106-111. 被引量：4
9吴倩,曹春杰.基于k-WTA的对抗样本防御模型研究[J].海南大学学报（自然科学版）,2021,39(4):340-348. 被引量：1
10陈泽轩,于莲芝.融入选择性卷积核的胶囊网络图像分类方法[J].软件导刊,2022,21(1):248-252. 被引量：3

西安交通大学学报

2022年第3期

浏览历史

内容加载中请稍等...

KCPNet:张量分解的轻量卷积模块设计、部署与应用被引量：3

参考文献7

二级参考文献24

共引文献165

同被引文献18

引证文献3

相关作者

相关机构

相关主题

浏览历史

KCPNet:张量分解的轻量卷积模块设计、部署与应用 被引量：3

参考文献7

二级参考文献24

共引文献165

同被引文献18

引证文献3

相关作者

相关机构

相关主题

浏览历史

KCPNet:张量分解的轻量卷积模块设计、部署与应用被引量：3