期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
高效训练百万亿参数预训练模型的系统挑战和对策
被引量:
4
1
作者
马子轩
翟季冬
+2 位作者
韩文弢
陈文光
郑纬民
《中兴通讯技术》
2022年第2期51-58,共8页
随着预训练模型规模的急剧增长,训练此类模型需要海量的计算和存储能力。为此,本工作在新一代国产高性能计算机上训练了一个174万亿参数的超大规模预训练模型,模型参数量可与人脑中的突触数量相媲美。重点讨论在训练这一超大规模预训练...
随着预训练模型规模的急剧增长,训练此类模型需要海量的计算和存储能力。为此,本工作在新一代国产高性能计算机上训练了一个174万亿参数的超大规模预训练模型,模型参数量可与人脑中的突触数量相媲美。重点讨论在训练这一超大规模预训练模型中遇到的几个关键系统挑战:如何选取高效并行策略,如何进行高效数据存储,如何选取合适的数据精度,以及如何实现动态负载均衡,并总结了针对上述挑战的一些解决方法。
展开更多
关键词
人工智能
超级计算机
混合专家
异构系统
下载PDF
职称材料
题名
高效训练百万亿参数预训练模型的系统挑战和对策
被引量:
4
1
作者
马子轩
翟季冬
韩文弢
陈文光
郑纬民
机构
清华大学计算机科学与技术系
清华大学计算机系
出处
《中兴通讯技术》
2022年第2期51-58,共8页
文摘
随着预训练模型规模的急剧增长,训练此类模型需要海量的计算和存储能力。为此,本工作在新一代国产高性能计算机上训练了一个174万亿参数的超大规模预训练模型,模型参数量可与人脑中的突触数量相媲美。重点讨论在训练这一超大规模预训练模型中遇到的几个关键系统挑战:如何选取高效并行策略,如何进行高效数据存储,如何选取合适的数据精度,以及如何实现动态负载均衡,并总结了针对上述挑战的一些解决方法。
关键词
人工智能
超级计算机
混合专家
异构系统
Keywords
artificial intelligence
supercomputer
mixture of experts
heterogeneous architecture
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
TP338.4 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
高效训练百万亿参数预训练模型的系统挑战和对策
马子轩
翟季冬
韩文弢
陈文光
郑纬民
《中兴通讯技术》
2022
4
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部