期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于云原生的人工智能训练业务监控系统设计
1
作者
孙辽东
王超
+5 位作者
陈培
王德奎
李世刚
张书博
荆荣讯
王文潇
《信息技术与信息化》
2024年第1期188-192,共5页
近年来,人工智能技术不断发展,已经在各个领域得到了广泛的应用和推广,成为推动社会进步和经济发展的重要引擎。但如何有效地对训练过程进行全程监控,保持系统稳定可靠,提高开发效率和效果,是人工智能技术开发应用过程中的关键问题。通...
近年来,人工智能技术不断发展,已经在各个领域得到了广泛的应用和推广,成为推动社会进步和经济发展的重要引擎。但如何有效地对训练过程进行全程监控,保持系统稳定可靠,提高开发效率和效果,是人工智能技术开发应用过程中的关键问题。通过构建一种针对云原生人工智能业务的监控报警系统,实现全流程的监控,解决当前人工智能开发过程中由于硬件故障、网络通信故障、软件故障导致训练中断的问题,提高系统的灵活性、可靠性和效率。从云原生人工智能业务监控系统的现状和问题出发,提出了包括监控/报警管理、数据采集、数据存储、数据分析、报警引擎等关键环节在内的基于人工智能业务负载的全流程监控技术实现方案。实验结果表明,所提出的基于全流程监控的云原生人工智能业务监控系统方案具有较高的实用性和可行性,可以有效地提高算法人员模型训练效率、提升系统可靠性和稳定性。所提出的研究成果为人工智能开发领域的监控问题提供了一种解决方案,具有一定的借鉴意义和推广价值。
展开更多
关键词
人工智能
训练全流程监控
监控
模块
报警模块
云原生
下载PDF
职称材料
题名
基于云原生的人工智能训练业务监控系统设计
1
作者
孙辽东
王超
陈培
王德奎
李世刚
张书博
荆荣讯
王文潇
机构
浪潮电子信息产业股份有限公司
出处
《信息技术与信息化》
2024年第1期188-192,共5页
文摘
近年来,人工智能技术不断发展,已经在各个领域得到了广泛的应用和推广,成为推动社会进步和经济发展的重要引擎。但如何有效地对训练过程进行全程监控,保持系统稳定可靠,提高开发效率和效果,是人工智能技术开发应用过程中的关键问题。通过构建一种针对云原生人工智能业务的监控报警系统,实现全流程的监控,解决当前人工智能开发过程中由于硬件故障、网络通信故障、软件故障导致训练中断的问题,提高系统的灵活性、可靠性和效率。从云原生人工智能业务监控系统的现状和问题出发,提出了包括监控/报警管理、数据采集、数据存储、数据分析、报警引擎等关键环节在内的基于人工智能业务负载的全流程监控技术实现方案。实验结果表明,所提出的基于全流程监控的云原生人工智能业务监控系统方案具有较高的实用性和可行性,可以有效地提高算法人员模型训练效率、提升系统可靠性和稳定性。所提出的研究成果为人工智能开发领域的监控问题提供了一种解决方案,具有一定的借鉴意义和推广价值。
关键词
人工智能
训练全流程监控
监控
模块
报警模块
云原生
分类号
TP277 [自动化与计算机技术—检测技术与自动化装置]
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于云原生的人工智能训练业务监控系统设计
孙辽东
王超
陈培
王德奎
李世刚
张书博
荆荣讯
王文潇
《信息技术与信息化》
2024
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部