期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
运营商大模型硬件基础设施创新及RDMA流量控制技术研究
1
作者 车碧瑶 张永航 +4 位作者 廖怡 唐剑 樊小平 赵继壮 陆钢 《信息通信技术与政策》 2024年第2期26-32,共7页
从业界大模型硬件基础设施创新的主要模式出发,论述了电信运营商在该领域自主创新的路线选择考虑。基于实际组网环境和业务场景提出需求,设计了一种支持NO-PFC、交换机免配置的拥塞控制算法,使用RTT作为拥塞感知信号,控制交换机队列长度... 从业界大模型硬件基础设施创新的主要模式出发,论述了电信运营商在该领域自主创新的路线选择考虑。基于实际组网环境和业务场景提出需求,设计了一种支持NO-PFC、交换机免配置的拥塞控制算法,使用RTT作为拥塞感知信号,控制交换机队列长度,实现低延迟。 展开更多
关键词 RDMA拥塞控制 大模型基础设施创新 运营商数据中心网络
下载PDF
构建支持大模型训练的计算机系统需要考虑的4个问题 被引量:1
2
作者 郑纬民 《大数据》 2024年第1期1-8,共8页
支持大模型训练的计算机系统有3种类型,其中基于国产AI芯片系统的生态系统不是很好,要想改变这个局面,需要做好AI编译器、并行加速等10个关键软件;基于超级计算机的系统需要做好软硬件协同设计,从而更好地服务于大模型训练。针对如何搭... 支持大模型训练的计算机系统有3种类型,其中基于国产AI芯片系统的生态系统不是很好,要想改变这个局面,需要做好AI编译器、并行加速等10个关键软件;基于超级计算机的系统需要做好软硬件协同设计,从而更好地服务于大模型训练。针对如何搭建大模型的基础设施,提出4点平衡设计,以确保系统的性能、可靠性和可扩展性。 展开更多
关键词 大模型训练 计算机系统 超算系统 大模型基础设施
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部