期刊文献+

大模型时代网络基础设施的机遇与挑战

Opportunities and Challenges of Network Infrastructure in the Era of Large Language Models
下载PDF
导出
摘要 大模型训练已经成为推动人工智能(AI)和云计算发展的核心驱动力之一,其底层基础设施的性能直接影响训练效率和模型表现.随着大模型规模的不断扩大,数据中心网络的性能需求也在持续提升,尤其是在支持大规模AI模型训练方面,成为未来云计算网络架构演进的重要研究对象.阿里云团队通过深入分析大模型训练中的网络瓶颈和技术挑战,从“网络架构设计、通信感知调度、故障分析定位”3个关键维度进行研究,提出了专为大模型训练设计的网络架构优化方案,实现了大规模训练任务的高效调度和网络传输优化,并在实际系统中取得了显著的性能提升.
作者 过敏意 Guo Minyi
出处 《计算机研究与发展》 EI CSCD 北大核心 2024年第11期3663-3663,共1页 Journal of Computer Research and Development
  • 相关文献

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部