大模型时代网络基础设施的机遇与挑战

Opportunities and Challenges of Network Infrastructure in the Era of Large Language Models

下载PDF

导出

摘要大模型训练已经成为推动人工智能(AI)和云计算发展的核心驱动力之一,其底层基础设施的性能直接影响训练效率和模型表现.随着大模型规模的不断扩大,数据中心网络的性能需求也在持续提升,尤其是在支持大规模AI模型训练方面,成为未来云计算网络架构演进的重要研究对象.阿里云团队通过深入分析大模型训练中的网络瓶颈和技术挑战,从“网络架构设计、通信感知调度、故障分析定位”3个关键维度进行研究,提出了专为大模型训练设计的网络架构优化方案,实现了大规模训练任务的高效调度和网络传输优化,并在实际系统中取得了显著的性能提升.

作者过敏意 Guo Minyi

机构地区上海交通大学计算机科学与工程系

出处《计算机研究与发展》 EI CSCD 北大核心 2024年第11期3663-3663,共1页 Journal of Computer Research and Development

关键词网络基础设施模型训练数据中心网络阿里云云计算网络瓶颈高效调度重要研究对象

分类号 TP18 [自动化与计算机技术—控制理论与控制工程] TP393.0 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

1陆静方.结合研学活动的初中语文写作训练设计方案与实施策略[J].中学生作文指导,2024(19):58-61.
2卢骧,郑祥意,肖惜明.输电线路状态监测通信传输优化技术研究[J].通信电源技术,2024,41(20):68-70.
3周璐.基于IP技术的电视通讯网络架构设计与优化策略[J].卫星电视与宽带多媒体,2024(20):116-118.
4郭雷,荆山,魏亮,赵川.基于软件定义网络的Crossfire攻击防御方法[J].计算机工程,2024,50(10):216-227.
5高鹏.5G技术在电子信息工程信息传输优化的研究[J].中国宽带,2024,20(10):34-36.
6黄志波,文旗,覃英文.无线充电技术在电动汽车电池包中的应用与电气设计[J].汽车知识,2024,24(10):1-3.
7蒋兴宇,黄娟,顾寄南,范天浩,王化佳.基于YOLOv7-tiny的轻量级苹果实时检测算法[J].中国农机化学报,2024,45(11):228-233.
8周巧玲.精读、巧思、善达:小学语文高效课堂教学新样态[J].学苑教育,2024(30):19-21.
9李鑫尧,李晶晶,朱磊,申恒涛.资源受限的大模型高效迁移学习算法研究综述[J].计算机学报,2024,47(11):2491-2521.
10崔家乐,曾祥峰,任政威,孙健,汤晨,杨万能,宋鹏.基于轻量化Ghost-YOLOv8和智能手机的田间水稻有效分蘖检测方法[J].智慧农业（中英文）,2024,6(5):98-107.

计算机研究与发展

2024年第11期

浏览历史

内容加载中请稍等...

大模型时代网络基础设施的机遇与挑战

相关作者

相关机构

相关主题

浏览历史