面向两级多中心架构的深度学习平台设计与实现

DESIGN AND IMPLEMENTATION OF DEEP LEARNING PLATFORM FOR TWO LEVEL MULTI CENTER ARCHITECTURE

下载PDF

导出

摘要大型企业的深度学习工作存在管理散乱和大量重复建设的问题。为了支持大规模深度学习的全过程管理和模型成果的高效复用,以国家电网公司的两级多中心部署架构为背景,提出一种深度学习平台。系统将训练、推理、数据和模型的管理工作分布在不同中心完成,彼此间协同完成深度学习的闭环。构建基于Kubernetes的私有云来支撑大批量深度学习应用的并行计算。前端界面采用基于算子的流程编排实现建模可视化和功能的可扩展。实验结果表明系统能够支持多个深度学习任务的并行,且额外的性能开销是可以接受的。 There are some problems in the deep learning work of large enterprises,such as scattered management and a large number of redundant projects.In order to support the whole process management of large-scale deep learning and efficient reuse of model results,a deep learning platform is proposed based on the two level multi center deployment architecture of State Grid Corporation of China.The system distributed the management work of training,inferencing,data and models into different centers,and they cooperated to complete the closed-loop of deep learning.A private cloud based on Kubernetes was used to support the parallel computing of large number of deep learning applications.The front-end interface adopted operator-based flow arrangement to realize modeling visualization and function expansion.The experimental results show that the system can support the parallel execution of multiple deep learning tasks,and the additional performance overhead is acceptable.

作者程仲汉 Cheng Zhonghan(Department of Computer and Information Security Management,Fujian Police College,Fuzhou 350007,Fujian,China)

机构地区福建警察学院计算机与信息安全管理系

出处《计算机应用与软件》北大核心 2024年第3期16-21,48,共7页 Computer Applications and Software

基金福建省中青年教师教育科研项目(JAT200379)。

关键词深度学习平台两级部署多中心 Kubernetes容器云流程编排 Deep learning platform Two level deployment Multi center Kubernetes container cloud Flow arrangement

分类号 TP391.9 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1胡越,罗东阳,花奎,路海明,张学工.关于深度学习的综述与讨论[J].智能系统学报,2019,14(1):1-19. 被引量：144
2高榕,张良,梅魁志.基于Caffe的嵌入式多核处理器深度学习框架并行实现[J].西安交通大学学报,2018,52(6):36-41. 被引量：7
3余昌发,程学林,杨小虎.基于Kubernetes的分布式TensorFlow平台的设计与实现[J].计算机科学,2018,45(B11):527-531. 被引量：12
4朱天放,梁明,王家乐,杨志浩,李亚敏.基于容器云的深度学习平台设计与实现[J].电子设计工程,2019,27(9):21-25. 被引量：11
5彭丽苹,吕晓丹,蒋朝惠,彭成辉.基于Docker的云资源弹性调度策略[J].计算机应用,2018,38(2):557-562. 被引量：32

二级参考文献9

1张学工.关于统计学习理论与支持向量机[J].自动化学报,2000,26(1):32-42. 被引量：2272
2崔继岳,梅魁志,刘冬冬,李博良.面向OpenCL的Mali GPU仿真器构建研究[J].西安交通大学学报,2015,49(2):20-24. 被引量：2
3沈良好,吴庆波,杨沙洲.基于Ceph的分布式存储节能技术研究[J].计算机工程,2015,41(8):13-17. 被引量：7
4刘熙,胡志勇.基于Docker容器的Web集群设计与实现[J].电子设计工程,2016,24(8):117-119. 被引量：34
5陈建娟,刘行行.基于Kubernetes的分布式ELK日志分析系统[J].电子技术与软件工程,2016(15):211-212. 被引量：9
6郝庭毅,吴恒,吴国全,张文博.面向微服务架构的容器级弹性资源供给方法[J].计算机研究与发展,2017,54(3):597-608. 被引量：34
7武志学.云计算虚拟化技术的发展与趋势[J].计算机应用,2017,37(4):915-923. 被引量：142
8李灿彬,甘宏.基于Docker容器的云平台设计与实现[J].科技广场,2017(6):38-41. 被引量：7
9刘思尧,李强,李斌.基于Docker技术的容器隔离性研究[J].软件,2015,36(4):110-113. 被引量：77

共引文献199

1张纯,周宇轩,熊拥军,龚良贵.基于深度神经网络的材料力学虚拟仿真实验教学系统设计与开发[J].西南交通大学学报（社会科学版）,2023,24(S02):58-62. 被引量：2
2傅隆生,宋珍珍,Zhang Xin,李瑞,王东,崔永杰.深度学习方法在农业信息中的研究进展与应用现状[J].中国农业大学学报,2020,25(2):105-120. 被引量：53
3王笑风,毛海臻,杨博,侯明业.基于深度学习LSTM网络的沥青路面性能预测研究[J].公路交通科技（应用技术版）,2020(8):4-7. 被引量：5
4李冬.试论国有企业制度创新的几个问题[J].金山企业管理,2000(1):1619-1619. 被引量：1
5徐正伦,杨鹤标.基于Kubernetes调度器的服务质量优化调度算法研究[J].软件导刊,2018,17(11):73-76. 被引量：2
6张可颖,彭丽苹,吕晓丹,吕尚青.开源云上的Kubernetes弹性调度[J].计算机技术与发展,2019,29(2):109-114. 被引量：9
7李培秀,李致金,韩可,朱超.基于Caffe深度学习框架的标签缺陷检测应用研究[J].中国电子科学研究院学报,2019,14(2):118-122. 被引量：8
8左灿,刘晓洁.一种改进的Kubernetes动态资源调度方法[J].数据通信,2019(2):50-54. 被引量：7
9张皓洋.基于Inception-v3模型的蛇类图像识别[J].电子技术与软件工程,2019(10):58-61. 被引量：2
10吴睿曦,肖秦琨.基于深度网络和数据增强的多物体图像识别[J].国外电子测量技术,2019,38(5):86-90. 被引量：30

1曲贺.光环境对大学生工作绩效及心理感受的影响[J].心理学进展,2024,14(2):705-713.
2张亚楠,秦志远,王会朴.基于微服务架构的企业内部网盘系统研究与应用[J].软件,2024,45(1):70-74.
3林燕珊,曾梓锐,廖振兴,张粤,李欣.基于微服务架构的头盔PaaS平台设计[J].广东石油化工学院学报,2024,34(1):60-64.
4李强,耿克建.基于BIM大数据技术的城市反恐作战研究[J].网络安全与数据治理,2023,42(S01):247-250.
5冯涛,陈艺博.大型水电机组推力轴承油位预警研究与应用[J].人民黄河,2023,45(S02):122-123.
6史佩昌,王怀民,傅翔.云际分布记账模型、机理与关键技术展望[J].电子学报,2024,52(1):19-33.
7陆俊,梁恩民,丁慧霞,龚钢军,高凯强,汪莞乔.新型电力负荷管理系统的多模态通信组网研究[J].电力信息与通信技术,2024,22(3):65-74. 被引量：1

计算机应用与软件

2024年第3期

浏览历史

内容加载中请稍等...

面向两级多中心架构的深度学习平台设计与实现

参考文献5

二级参考文献9

共引文献199

相关作者

相关机构

相关主题

浏览历史