期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
分布式AI训练实践
1
作者
宋庆春
朱朋志
郭亮
《中国电信业》
2021年第S01期92-100,共9页
本文基于主流AI模型分布式训练业务的实际情况,提出了AI训练集群系统的优化方法。应用GPUDirect RDMA、网络计算等技术设计了以业务数据为中心的AI集群架构,并提供了参考实践。
关键词
分布式AI训练
网络计算
系统级优化
无损网络
GPUDirect
RDMA
下载PDF
职称材料
题名
分布式AI训练实践
1
作者
宋庆春
朱朋志
郭亮
机构
nvidia
技术
服务
(
北京
)
有限公司
网络
事业
部
中国信息通信研究院云计算与大数据研究所
nvidia
技术
服务
(
北京
)
有限公司
网络
事业
部
HPC-AI实验室
出处
《中国电信业》
2021年第S01期92-100,共9页
文摘
本文基于主流AI模型分布式训练业务的实际情况,提出了AI训练集群系统的优化方法。应用GPUDirect RDMA、网络计算等技术设计了以业务数据为中心的AI集群架构,并提供了参考实践。
关键词
分布式AI训练
网络计算
系统级优化
无损网络
GPUDirect
RDMA
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
分布式AI训练实践
宋庆春
朱朋志
郭亮
《中国电信业》
2021
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部