期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
面向算力中心的大模型推理优化技术
1
作者 毛秋力 沈庆飞 李秀红 《质量与认证》 2024年第9期40-44,共5页
随着人工智能技术的飞速发展,大型语言模型在自然语言处理、代码生成、多模态交互等领域展现出强大的能力。然而,大模型的高算力需求成为其在实际应用中广泛部署的主要瓶颈。本文聚焦于算力中心的大语言模型推理服务的优化技术,通过静... 随着人工智能技术的飞速发展,大型语言模型在自然语言处理、代码生成、多模态交互等领域展现出强大的能力。然而,大模型的高算力需求成为其在实际应用中广泛部署的主要瓶颈。本文聚焦于算力中心的大语言模型推理服务的优化技术,通过静态推理和推理服务的协同优化,使算力中心的大语言模型推理服务的整体性能得到显著提升。 展开更多
关键词 大语言模型 推理 算子 调度 算力效率
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部