基于图卷积网络的卷积神经网络耗时预测算法

A graph convolution network based latency prediction algorithm for convolution neural network

下载PDF

导出

摘要通过可学习的预测算法获取卷积神经网络(CNN)在硬件上的推理耗时越来越受到研究者的关注。现有耗时预测算法主要面临2个问题:卷积神经网络设计空间采样复杂度高,数据采集成本高;无法准确预测硬件编译器的算子融合技术对推理耗时的影响。为了解决上述问题,提出了一种基于图卷积网络(GCN)的耗时预测算法,将整体网络耗时看作多节点耗时补偿的累加,并利用图卷积对结构算子融合产生的耗时影响进行建模。同时,提出一种新型差分训练方案,减少采样空间规模,提高算法的泛化能力。在HISI3559硬件平台上对MB-C连续空间采样模型的耗时预测实验表明:所提算法可将耗时估计的平均相对误差从传统算法的302%降低到5.3%。另外,通过将传统耗时预测算法替换成所提算法进行耗时评估,可以使网络结构搜索算法搜索到耗时更加接近目标的高精度网络。 Obtaining the inference latency of a convolution neural network(CNN)via learnable prediction algorithm have attracted more attention.Existing latency predictors suffer from two major problems.First,the high complexity of CNN design space requires tremendous cost of data collection.Second,traditional algorithms fail to accurately model the effect of the hardware complier’s operator fusion on latency.To solve these problems,this paper proposes a latency predictor based on graph convolution network(GCN).This algorithm regards the latency of a complete network as accumulation of multi-node latency compensation,and utilizes graph convolution to model the effect caused by operator fusion.Furthermore,we propose a differential training algorithm to reduce the size of input space and improve the generalization of the algorithm.Experiments on HISI3559 in MB-C continuous search space show that our algorithm can reduce the average relative error from 302%to 5.3%.In addition,replacing the traditional latency predictor with the proposed predictor enables neural architecture search algorithms to find high precision networks with latency closer to the target.

作者李哲暘张如意谭文明任烨雷鸣吴昊 LI Zheyang;ZHANG Ruyi;TAN Wenming;REN Ye;LEI Ming;WU Hao(Hangzhou Hikvision Digital Technology Co.,Ltd.,Hangzhou 310051,China;Hangzhou Hikvision System Technology Co.,Ltd.,Hangzhou 310051,China)

机构地区杭州海康威视数字技术股份有限公司杭州海康威视系统技术有限公司

出处《北京航空航天大学学报》 EI CAS CSCD 北大核心 2022年第12期2450-2459,共10页 Journal of Beijing University of Aeronautics and Astronautics

基金国家重点研发计划(2018YFC0807706)。

关键词耗时预测图卷积网络深度学习网络结构搜索模型部署 latency prediction graph convolution network deep learning neural architecture search model deployment

分类号 TP391.4 [自动化与计算机技术—计算机应用技术] V247.1 [航空宇航科学与技术—飞行器设计]

引文网络
相关文献

参考文献5

1邱博,刘翔,石蕴玉,尚岩峰.一种轻量化的多目标实时检测模型[J].北京航空航天大学学报,2020,46(9):1778-1785. 被引量：5
2陈猛夫.基于迁移学习的暴恐图像自动识别[J].北京航空航天大学学报,2020,46(9):1677-1681. 被引量：3
3张子昊,王蓉.基于MobileFaceNet网络改进的人脸识别方法[J].北京航空航天大学学报,2020,46(9):1756-1762. 被引量：12
4岳邦铮,韩松.基于改进Faster R-CNN的SAR船舶目标检测方法[J].计算机与现代化,2019,0(9):90-95. 被引量：10
5曹帅,张晓伟,马健伟.基于跨尺度特征聚合网络的多尺度行人检测[J].北京航空航天大学学报,2020,46(9):1786-1796. 被引量：10

二级参考文献15

1种衍文,匡湖林,李清泉.一种基于多特征和机器学习的分级行人检测方法[J].自动化学报,2012,38(3):375-381. 被引量：28
2倪叶舟,张鹏,扈翔,屈健,李昊青.大数据背景下涉恐信息挖掘方法综述[J].中国公共安全（学术版）,2018(4):91-95. 被引量：5
3张宁,朱金福.机场区域中人群涉暴恐动作智能识别方法仿真[J].计算机仿真,2015,32(6):67-70. 被引量：3
4王刚,陈永光,杨锁昌,高敏,戴亚平.鲁棒的红外小目标视觉显著性检测方法[J].北京航空航天大学学报,2015,41(12):2309-2318. 被引量：4
5许冰,牛燕雄,吕建明.复杂动态场景下目标检测与分割算法[J].北京航空航天大学学报,2016,42(2):310-317. 被引量：10
6李龙,支庭荣.“算法反恐”:恐怖主义媒介化与人工智能应对[J].现代传播（中国传媒大学学报）,2018,40(9):13-18. 被引量：14
7裴伟,许晏铭,朱永英,王鹏乾,鲁明羽,李飞.改进的SSD航拍目标检测方法[J].软件学报,2019,30(3):738-758. 被引量：66
8谭红臣,李淑华,刘彬,刘秀平.特征增强的SSD算法及其在目标检测中的应用[J].计算机辅助设计与图形学学报,2019,31(4):573-579. 被引量：35
9常思远,李有乘,孙培岩,朱永杰,谢党恩.一种基于MTCNN的视频人脸检测及识别方法[J].许昌学院学报,2019,38(2):149-152. 被引量：6
10李晓光,付陈平,李晓莉,王章辉.面向多尺度目标检测的改进Faster R-CNN算法[J].计算机辅助设计与图形学学报,2019,31(7):1095-1101. 被引量：33

共引文献35

1李圳波,史永存,孙芳芳,靳卫卫.基于GIS的遥感溢油监测系统设计[J].船海工程,2020,49(2):55-59. 被引量：3
2潘卫军,刘皓晨,段英捷.基于YOLO架构的海面目标航空器识别研究[J].电子设计工程,2020,28(23):5-8. 被引量：2
3冉涌.基于百度AI的人流量监测系统[J].黄冈职业技术学院学报,2020,22(6):143-146. 被引量：8
4余久方.卷积神经网络模型应用研究[J].信息技术与标准化,2021(1):34-36. 被引量：1
5李尊,吴豫,张开,张嵩阳,丁子璇,刘镇弢,孙伟.特高压环境评价中的航拍小目标智能识别方法[J].工程技术研究,2020,5(21):31-32. 被引量：1
6柳天滋,陈昕,李想,樊茹,刘逸鹏,李焕菁.基于深度残差神经网络迁移学习的牙形刺图像识别[J].古生物学报,2020,59(4):512-523. 被引量：5
7刘畅,朱卫纲.基于卷积神经网络的SAR图像目标检测综述[J].兵器装备工程学报,2021,42(3):15-21. 被引量：3
8李岩,孟令军.基于多尺度特征融合的行人检测方法[J].微型电脑应用,2021,37(6):117-120. 被引量：1
9田佳鹭,邓立国.基于改进VGG-16神经网络的图像分类方法[J].计算技术与自动化,2021,40(2):131-135. 被引量：10
10王妤,陈秀新,袁和金.基于改进Faster RCNN的变电站红外图像多目标识别[J].传感技术学报,2021,34(4):522-530. 被引量：13

1乔艳琰,魏爽.基于深度学习的多通道光纤数据安全融合方法[J].激光杂志,2022,43(11):99-103. 被引量：1
2吴戴燕,刘世林.基于改进Q学习的机械臂实时障碍规避方法[J].台州学院学报,2022,44(6):13-20.

北京航空航天大学学报

2022年第12期

浏览历史

内容加载中请稍等...

基于图卷积网络的卷积神经网络耗时预测算法

参考文献5

二级参考文献15

共引文献35

相关作者

相关机构

相关主题

浏览历史