大数据处理系统中面向GPU加速DNN推理的模型共享被引量：4

Model sharing for GPU-accelerated DNN inference in big data processing systems

导出

摘要近年来,学术和工业界广泛利用大数据处理系统来处理视频分析等领域基于深度神经网络(deep neural networks, DNN)的推理负载。在这种场景下,因大数据系统中多个并行推理任务重复加载相同且只读的DNN模型,导致系统无法充分利用GPU资源,成为了推理性能提升的瓶颈。针对该问题,该文提出了一个面向单GPU卡的模型共享技术,在DNN推理任务之间共享同一份模型数据。在此基础上,为了使模型共享技术作用于分布式环境下的每一块GPU,该文还设计了支持多GPU卡模型共享的分配器。将上述优化技术集成到在GPU平台上运行的Spark中,实现了一个支持大规模推理负载的分布式原型系统。实验结果表明,针对基于YOLO-v3的交通视频处理负载,相对于未采用模型共享技术的系统,模型共享技术能够提升系统吞吐量达136%。 Big data processing is being widely used in academia and industry to handle DNN-based inference workloads for fields such as video analyses. In such cases, multiple parallel inference tasks in the big data processing system repeatedly load the same, read-only DNN model so the system does not fully utilize the GPU resources which creates a bottleneck that limits the inference performance. This paper presents a model sharing technique for single GPU cards that enables sharing of the same model among various DNN inference tasks. An allocator is used to make the model sharing technique work for each GPU in the distributed environment. This method was implemented in Spark on a GPU platform in a distributed data processing system that supports large-scale inference workloads. Tests show that for video analyses on the YOLO-v3 model, the model sharing reduces the GPU memory overhead and improves system throughput by up to 136% compared to a system without the model sharing technique.

作者丁光耀陈启航徐辰钱卫宁周傲英 DING Guangyao;CHEN Qihang;XU Chen;QIAN Weining;ZHOU Aoying(School of Data Science and Engineering,East China Normal University,Shanghai 200333,China)

机构地区华东师范大学数据科学与工程学院

出处《清华大学学报（自然科学版）》 EI CAS CSCD 北大核心 2022年第9期1435-1441,共7页 Journal of Tsinghua University(Science and Technology)

基金国家自然科学基金资助项目(61902128)。

关键词大数据处理系统 DNN推理 GPU 显存模型共享 big data processing system DNN inference GPU GPU memory model sharing

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

同被引文献25

1张政馗,庞为光,谢文静,吕鸣松,王义.面向实时应用的深度学习研究综述[J].软件学报,2020(9):2654-2677. 被引量：35
2管皓,薛向阳,安志勇.深度学习在视频目标跟踪中的应用进展与展望[J].自动化学报,2016,42(6):834-847. 被引量：83
3李欢,黄英,张付军,赵宇,葛彦悟.基于软件组件库的柴油机ECU软件设计与实现[J].汽车工程,2016,38(12):1420-1426. 被引量：1
4张慧,王坤峰,王飞跃.深度学习在目标视觉检测中的应用进展与展望[J].自动化学报,2017,43(8):1289-1305. 被引量：244
5叶静然,梁志剑.基于GPU的多维树搜索算法在管道流体仿真中的应用[J].科学技术与工程,2019,19(13):177-180. 被引量：4
6郑远攀,李广阳,李晔.深度学习在图像识别中的应用研究综述[J].计算机工程与应用,2019,55(12):20-36. 被引量：378
7石文君,王登位,刘万锁,蒋大钢.GPU和格子玻尔兹曼方法联合加速的水平集模型及其在图像分割中的应用[J].红外与毫米波学报,2021,40(1):108-121. 被引量：1
8刘玉红,杨亮,朴春慧,张志国.基于区块链的铁路工程施工安全监测数据共享关键技术研究[J].通信学报,2021,42(8):206-216. 被引量：17
9胡蓉,阳王东,王昊天,罗辉章,李肯立.基于GPU加速的并行WMD算法[J].计算机科学,2021,48(12):24-28. 被引量：4
10廉冰,杨振瑜.面向图书馆资源共享与维护的联盟链平台建设与应用研究--基于FISCO BCOS系统架构理念[J].新世纪图书馆,2022(1):53-60. 被引量：4

引证文献4

1王岩.基于混合架构的产学合作资源共享系统设计[J].信息与电脑,2022,34(23):95-97.
2潘明华,王一涵,谷盛民,孙绍华.混沌线程池与GPU优化的批量图像加密算法[J].科学技术与工程,2023,23(34):14618-14626.
3石宝元,赵恺,周杨.电力营销数据的远距离共享模型设计[J].集成电路应用,2023,40(11):347-349.
4刘祥,华蓓,林飞,魏宏原.面向深度学习应用的组件式开发框架的设计实现[J].计算机应用,2024,44(2):526-535. 被引量：1

二级引证文献1

1李虎群,锁志海,张心,张哲,苏磊磊.智慧校园统一运维管理平台设计[J].电脑知识与技术,2024,20(20):50-53.

1张文,林长喜,彭永臻.现代煤化工废水近零排放技术集成与优化建议[J].环境工程,2021,39(11):41-45. 被引量：26
2林立国.从发展学生核心素养之科学精神角度谈高中政治教学[J].高考,2022(17):25-28. 被引量：1
3左玉琦.数字微波通信的优点及其应用研究[J].通信电源技术,2022,39(10):127-129. 被引量：1
4刘燕,刘为民,邓振岗,许红伟,崔向东.咬合桩在深基坑工程中的应用[J].建筑技术开发,2022,49(15):173-175. 被引量：2
5陈永锋,耿德华,陆志红,杨晓华,袁松年.RAP掺量对热再生沥青混合料疲劳性能影响研究[J].建材世界,2022,43(4):34-38. 被引量：4
6LIN Jingjing,YE Zhonglin,ZHAO Haixing,FANG Lusheng.DeepHGNN:A Novel Deep Hypergraph Neural Network[J].Chinese Journal of Electronics,2022,31(5):958-968. 被引量：2

清华大学学报（自然科学版）

2022年第9期

浏览历史

内容加载中请稍等...

大数据处理系统中面向GPU加速DNN推理的模型共享被引量：4

同被引文献25

引证文献4

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

大数据处理系统中面向GPU加速DNN推理的模型共享 被引量：4

同被引文献25

引证文献4

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

大数据处理系统中面向GPU加速DNN推理的模型共享被引量：4