期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
面向算力中心的大模型推理优化技术
1
作者
毛秋力
沈庆飞
李秀红
《质量与认证》
2024年第9期40-44,共5页
随着人工智能技术的飞速发展,大型语言模型在自然语言处理、代码生成、多模态交互等领域展现出强大的能力。然而,大模型的高算力需求成为其在实际应用中广泛部署的主要瓶颈。本文聚焦于算力中心的大语言模型推理服务的优化技术,通过静...
随着人工智能技术的飞速发展,大型语言模型在自然语言处理、代码生成、多模态交互等领域展现出强大的能力。然而,大模型的高算力需求成为其在实际应用中广泛部署的主要瓶颈。本文聚焦于算力中心的大语言模型推理服务的优化技术,通过静态推理和推理服务的协同优化,使算力中心的大语言模型推理服务的整体性能得到显著提升。
展开更多
关键词
大语言模型
推理
算子
调度
算力效率
下载PDF
职称材料
题名
面向算力中心的大模型推理优化技术
1
作者
毛秋力
沈庆飞
李秀红
机构
上海市无问芯穹智能科技有限公司
中国计量科学研究院
出处
《质量与认证》
2024年第9期40-44,共5页
文摘
随着人工智能技术的飞速发展,大型语言模型在自然语言处理、代码生成、多模态交互等领域展现出强大的能力。然而,大模型的高算力需求成为其在实际应用中广泛部署的主要瓶颈。本文聚焦于算力中心的大语言模型推理服务的优化技术,通过静态推理和推理服务的协同优化,使算力中心的大语言模型推理服务的整体性能得到显著提升。
关键词
大语言模型
推理
算子
调度
算力效率
分类号
TP319 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
面向算力中心的大模型推理优化技术
毛秋力
沈庆飞
李秀红
《质量与认证》
2024
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部