期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
分布式AI训练实践
下载PDF
职称材料
导出
摘要
本文基于主流AI模型分布式训练业务的实际情况,提出了AI训练集群系统的优化方法。应用GPUDirect RDMA、网络计算等技术设计了以业务数据为中心的AI集群架构,并提供了参考实践。
作者
宋庆春
朱朋志
郭亮
机构地区
NVIDIA技术服务(北京)有限公司网络事业部
中国信息通信研究院云计算与大数据研究所
NVIDIA技术服务(北京)有限公司网络事业部HPC-AI实验室
出处
《中国电信业》
2021年第S01期92-100,共9页
China Telecommunications Trade
关键词
分布式AI训练
网络计算
系统级优化
无损网络
GPUDirect
RDMA
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
引文网络
相关文献
节点文献
二级参考文献
0
参考文献
0
共引文献
0
同被引文献
0
引证文献
0
二级引证文献
0
1
李广乾,张学艺,赵建航.
李广乾等:政府数据资源管理体系的优化建议[J]
.机构与行政,2022(10):22-23.
2
吴建刚.
探讨大数据时代如何做好档案信息化管理工作[J]
.中文科技期刊数据库(全文版)社会科学,2021(2):0142-0142.
3
熊刚,蒋天瑜,刘洋,刘丹.
基于人工智能的无人机网络优化计算技术研究[J]
.电子技术与软件工程,2023(5):1-4.
被引量:1
4
刘超,朱波.
融合画像和文本信息的轻量级关系图注意推荐模型[J]
.计算机应用研究,2023,40(4):1037-1043.
被引量:1
5
赵精华,郭亮.
智能无损网络:数据中心网络性能优化策略[J]
.中国电信业,2021(S01):67-72.
被引量:1
6
王一桐,隋成娇.
数字化在企业集团财务共享转型升级中的应用[J]
.中文科技期刊数据库(全文版)经济管理,2022(6):0081-0084.
7
张鹏,文磊.
F-TCKT:融合遗忘因素的深度时序卷积知识追踪模型[J]
.计算机应用研究,2023,40(4):1070-1074.
被引量:1
8
李宜亭,屈丹,杨绪魁,张昊,沈小龙.
一种改进的线性注意力机制语音识别方法[J]
.信号处理,2023,39(3):516-525.
9
媲美人脑能效的类脑突触原型器件问世[J]
.家庭科技,2022(3):4-4.
10
桑永宣,魏江坡,王博,宋莹.
具有边缘缓存机制的混合启发式任务卸载算法[J]
.计算机工程,2023,49(4):149-158.
中国电信业
2021年 第S01期
职称评审材料打包下载
相关作者
内容加载中请稍等...
相关机构
内容加载中请稍等...
相关主题
内容加载中请稍等...
浏览历史
内容加载中请稍等...
;
用户登录
登录
IP登录
使用帮助
返回顶部