QingLong:一种基于常变量异步拷贝的神经网络编程模型被引量：2

QingLong:A Neural Network Programming Model Based on Asynchronous Copy of Constant and Variable

下载PDF

导出

摘要近年来,人工神经网络的研究取得了巨大成就,在图像识别、自然语言处理等领域均有突破性的成果,同时产生了众多商业应用,方便了我们的生活,比如语音助手、辅助驾驶等.由于神经网络算法属于计算密集型和访存密集型的负载,传统CPU处理器已不能满足其大规模商业化应用的需求,因此学术界和产业界试图在GPU、FPGA和ASIC上寻求突破.其中,神经网络加速器作为一种ASIC,它提供了高性能、低功耗的硬件解决方案,相关研究也越来越多.神经网络加速器作为一种协处理器,在其计算前后需要将数据在主机与设备之间进行搬运.特别是对吞吐量要求较高的神经网络前向推理任务,需要将网络模型参数、硬件指令等常量数据和输入、输出等变量数据,分别从主机内存拷入设备内存.如果常量数据在每一份输入数据计算前都拷贝一次,就存在常量数据重复拷贝的问题,浪费了时间与存储资源.如何在神经网络开发工具软件中实现拷贝多次变量数据但只拷贝一次常量数据,如何保证指令在每次计算中都正确寻址常量和变量,如何简化用户编程,提供用户友好的接口,就成为一系列值得研究的问题.在本文中,我们提出了一种基于常变量异步拷贝的神经网络开发工具软件及其编程模型QingLong来解决上述问题.QingLong编程模型包含三个阶段:定义网络、编译网络和计算.在定义网络阶段,用户可以为神经网络的数据节点绑定常量数据;在编译网络阶段,通过REOFF数据包装法将常量数据封装为数据包;在计算网络阶段,用户拷贝一次数据包后即可多次拷入输入数据并计算输出结果.该编程模型具有编译、计算分离,常变量异步拷贝,计算和数据拷贝可切分为三级流水线等优势.实验表明,在连续计算100份输入样本时,QingLong比DLPlib有平均17.48倍的性能提升,且输入样本越多,性能提升的倍数越大. In recent years,the research of artificial neural network has made great achievements in image recognition,natural language processing and other fields.At the same time,it has produced many commercial applications,which is convenient for our life,such as voice assistant,assisted driving and so on.Because the neural network algorithm belongs to the computing intensive and memory intensive application,the traditional CPU processor is not suitable for large-scale commercial applications,so the academia and industry try to seek a breakthrough in GPU,FPGA and ASIC.Neural network accelerator is a kind of ASIC.It provides high-performance,low-power hardware solutions,which has many related research.As a kind of coprocessor,neural network accelerator needs to copy data between the host memory and device memory before and after its calculation.Especially for the neural network inference task with high throughput requirements,constant data such as network model parameters,hardware instructions and variable data such as input and output are copied into device memory from host memory.If constant data is copied once before each input data calculation,there is a problem of repeated copying of constant data,which wastes time and storage resources.There are a series of problems worth studying.How to copy multiple variable data but only one constant data in the neural network development tool software?How to ensure that the instructions address constants and variables correctly in each calculation?How to simplify user programming and provide user-friendly interface?In this paper,we propose neural network development tool based on asynchronous copy of constant and variable and its programming model QingLong to solve the above problems.QingLong programming model consists of three stages:network definition,compilation and computation.In network definition stage,users can bind constant data for data nodes of neural network.In network compilation stage,constant data is packaged into data package by REOFF method.In network computation stage,users can copy input data and calculate output results many times after one data package is copied.The programming model has the advantages of compiling and computing separation,asynchronous copy of constant and variable,calculation and data copy can be cut into three stage pipelines.The experiments show that QingLong has an average performance improvement of 17.48x over DLPlib when calculating 100 input samples continuously.And the more input samples,the greater the performance improvement.

作者杜伟健陈云霁支天吴林阳陈小兵庄毅敏 DU Wei-Jian;CHEN Yun-Ji;ZHI Tian;WU Lin-Yang;CHEN Xiao-Bing;ZHUANG Yi-Min(SKL of Computer Architecture,Institute of Computing Technology,CAS,Beijing 100190;University of Chinese Academy of Sciences,Beijing 100049;Cambricon Technologies,Shanghai 201308;Institute of Brain-Intelligence Technology,Zhangjiang Laboratory,Shanghai 201308;Shanghai Research Center for Brian Science and Brain-Inspired Intelligence,Shanghai 201308;CAS Center for Excellence in Brain Science and Intelligence Technology,Shanghai 201308;Cambricon Technologies,Beijing 100190)

机构地区中国科学院计算技术研究所计算机体系结构国家重点实验室中国科学院大学上海寒武纪信息科技有限公司张江实验室脑与智能科技研究院上海脑科学与类脑研究中心中国科学院脑科学与智能技术卓越创新中心中科寒武纪科技股份有限公司

出处《计算机学报》 EI CSCD 北大核心 2020年第4期587-599,共13页 Chinese Journal of Computers

基金国家重点研发计划(2017YFA0700900,2017YFA0700902,2017YFA0700901,2017YFB1003101,2018AAA0103300) 国家自然科学基金(61432016,61532016,61672491,61602441,61602446,61732002,61702478,61732007,61732020) 北京市自然科学基金(JQ18013)“核心电子器件、高端通用芯片及基础软件产品”科技重大专项(2018ZX01031102) 中国科学院科技成果转移转化重点专项(KFJ-HGZX-013) 中国科学院前沿科学重点研究项目(QYZDBSSW-JSC001) 中国科学院战略性先导科技专项(XDB32050200,XDC01020000) 中科院标准化研究项目(BZ201800001) 北京智源人工智能研究院以及北京市科技新星计划项目(Z191100001119093)的支持.

关键词神经网络编程模型常量和变量异步拷贝软件开发工具 neural network programming model constant and variable asynchronous copy software development kit

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

同被引文献23

1袁良,张云泉,白雪瑞,张广婷.并行程序设计语言中局部性机制的研究[J].计算机科学,2020,47(1):7-16. 被引量：4
2朱苗苗,潘伟杰,刘翔,吕健,赵慧亮.基于BP神经网络代理模型的交互式遗传算法[J].计算机工程与应用,2020,56(2):146-151. 被引量：21
3章蓉,陈谊,张梦录,孟可欣.高维数据聚类可视分析方法综述[J].图学学报,2020,41(1):44-56. 被引量：14
4范兴文,张姝.单片机多字节数值最小组筛选的汇编语言算法[J].辽宁高职学报,2020,22(2):85-88. 被引量：2
5熊菊霞,吴尽昭.异构复杂信息网络敏感数据流动态挖掘[J].计算机工程与科学,2020,42(4):628-633. 被引量：17
6郭维,彭辉,张瑜.传感器数据融合与单一传感器在同步定位与构图中的对比研究[J].计算机应用研究,2020,37(6):1882-1885. 被引量：9
7谢李为,李勇,罗隆福,陈春,曹一家.基于距离矩阵与分支系数的配电网故障定位方法[J].中国电机工程学报,2020,40(7):2180-2191. 被引量：44
8李恒,张黎明,蒋美容,李玉龙.基于监督学习的全卷积神经网络多聚焦图像融合算法[J].激光与光电子学进展,2020,57(8):137-144. 被引量：11
9游凌,李伟浩,张文林,王科人.基于深度神经网络的Morse码自动译码算法[J].电子与信息学报,2020,42(11):2643-2648. 被引量：5
10丁明,虞海彪,刘练,毕锐,张超.基于多变量相空间重构和RBF神经网络的光伏功率预测方法[J].电子测量与仪器学报,2020,32(8):1-7. 被引量：17

引证文献2

1张恒熙,陈灏然,蒋开心,李嘉卿,姚建业.基于神经网络模型的类C算法向C语言程序的自动转换[J].信息与电脑,2022,34(14):76-78. 被引量：1
2郭红建,陈一飞,梅轶群.基于高维聚类的文本大数据挖掘算法仿真[J].计算机仿真,2023,40(6):499-503. 被引量：2

二级引证文献3

1党浩予.基于Python爬虫技术的网页内容文本大数据提取方法研究[J].电脑与电信,2023(8):90-93.
2宁晓虹.传感器网络高维异常数据流动态挖掘算法设计[J].传感器世界,2023,29(11):34-39. 被引量：1
3解丽娜.ST语言向C语言的转换算法探究[J].电脑编程技巧与维护,2024(4):35-37.

1汪林.唯品会宣布与顺丰全面合作专家称“轻装上阵”将1+1>2[J].计算机与网络,2019,45(23):10-11.
22020智能物流硬件解决方案研讨会[J].华东科技,2020,0(2):74-74.
3涂凯杰,朱宜炳,许达文.一种双向脉动数据流的全卷积神经网络加速器[J].微电子学与计算机,2020,37(1):33-37.
4刘春玲,栾良龙.FPGA的发展概况与发展趋势[J].经济技术协作信息,2019,0(34):8-9.
5郭岩.矿用智能喷雾站自动化控制系统的设计研究[J].机械管理开发,2019,34(12):216-218.
6张斌.基于RFID技术的商品防伪溯源系统设计与实现[J].信息周刊,2020,0(4):0427-0427.
7刘云鹏,步雅楠,贺鹏,田源.基于S变换和ELM的变压器绕组应变检测识别[J].高压电器,2020,56(1):9-17. 被引量：8
8王颖.模块化硬件解决方案的市场规模将持续扩大[J].中国电子商情,2020(1):54-56.
9李子军,吴广民.地层三项压力预测技术在希3区块的应用[J].采油工程,2012(1):44-47.
10吴峰华,杨哲海,张玉萍,王昊,刘实,尹竞瑶,金鑫,王承业,盖宇.仿人足球机器人快速多目标识别方法[J].计算机辅助设计与图形学学报,2019,31(12):2152-2165. 被引量：6

计算机学报

2020年第4期

浏览历史

内容加载中请稍等...

QingLong:一种基于常变量异步拷贝的神经网络编程模型被引量：2

同被引文献23

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

QingLong:一种基于常变量异步拷贝的神经网络编程模型 被引量：2

同被引文献23

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

QingLong:一种基于常变量异步拷贝的神经网络编程模型被引量：2