未来6G网络将内生支持通信和AI一体化服务,赋能丰富多彩的新业务,支撑社会高效可持续发展。为此,借鉴了IT行业AI Agent的应用范式,基于电信应用场景创新地提出了6G AI Agent技术框架的三大设计理念,包括多模型融合、定制化Agent和插件...未来6G网络将内生支持通信和AI一体化服务,赋能丰富多彩的新业务,支撑社会高效可持续发展。为此,借鉴了IT行业AI Agent的应用范式,基于电信应用场景创新地提出了6G AI Agent技术框架的三大设计理念,包括多模型融合、定制化Agent和插件式环境交互,并基于该理念构建了6G AI Agent技术框架。通过环境交互层、Agent引擎层、模型调度层、模型基座层交互协同,实现了自主环境感知、自主任务生成和自主执行任务的能力。此外,以移动网络的智能感知任务为例,探索了AI Agent的使用场景及价值,为AI新技术在电信领域发展提供了新的思路和技术支撑。展开更多
目前深度强化学习算法在不同应用领域中已经取得诸多成果,然而在多智能体任务领域中,往往面临大规模的具有稀疏奖励的非稳态环境,低探索效率问题仍是一大挑战。由于智能规划能够根据任务的初始状态和目标状态快速制定出决策方案,该方案...目前深度强化学习算法在不同应用领域中已经取得诸多成果,然而在多智能体任务领域中,往往面临大规模的具有稀疏奖励的非稳态环境,低探索效率问题仍是一大挑战。由于智能规划能够根据任务的初始状态和目标状态快速制定出决策方案,该方案能够作为各智能体的初始策略,并为其探索过程提供有效指导,因此尝试将智能规划与多智能体强化学习进行结合求解,并且提出统一模型UniMP(a Unified model for Multi-agent Reinforcement Learning and AI Planning)。在此基础上,设计并建立相应的问题求解机制。首先,将多智能体强化学习任务转化为智能决策任务;其次,对其执行启发式搜索,以得到一组宏观目标,进而指导强化学习的训练,使得各智能体能够进行更加高效的探索。在多智能体即时战略对抗场景StarCraftⅡ的各地图以及RMAICS战车模拟对战环境下进行实验,结果表明累计奖励值和胜率均有显著提升,从而验证了统一模型的可行性、求解机制的有效性以及所提算法灵活应对强化学习环境突发情况的能力。展开更多
文摘未来6G网络将内生支持通信和AI一体化服务,赋能丰富多彩的新业务,支撑社会高效可持续发展。为此,借鉴了IT行业AI Agent的应用范式,基于电信应用场景创新地提出了6G AI Agent技术框架的三大设计理念,包括多模型融合、定制化Agent和插件式环境交互,并基于该理念构建了6G AI Agent技术框架。通过环境交互层、Agent引擎层、模型调度层、模型基座层交互协同,实现了自主环境感知、自主任务生成和自主执行任务的能力。此外,以移动网络的智能感知任务为例,探索了AI Agent的使用场景及价值,为AI新技术在电信领域发展提供了新的思路和技术支撑。
文摘目前深度强化学习算法在不同应用领域中已经取得诸多成果,然而在多智能体任务领域中,往往面临大规模的具有稀疏奖励的非稳态环境,低探索效率问题仍是一大挑战。由于智能规划能够根据任务的初始状态和目标状态快速制定出决策方案,该方案能够作为各智能体的初始策略,并为其探索过程提供有效指导,因此尝试将智能规划与多智能体强化学习进行结合求解,并且提出统一模型UniMP(a Unified model for Multi-agent Reinforcement Learning and AI Planning)。在此基础上,设计并建立相应的问题求解机制。首先,将多智能体强化学习任务转化为智能决策任务;其次,对其执行启发式搜索,以得到一组宏观目标,进而指导强化学习的训练,使得各智能体能够进行更加高效的探索。在多智能体即时战略对抗场景StarCraftⅡ的各地图以及RMAICS战车模拟对战环境下进行实验,结果表明累计奖励值和胜率均有显著提升,从而验证了统一模型的可行性、求解机制的有效性以及所提算法灵活应对强化学习环境突发情况的能力。