-
题名智能集群系统的强化学习方法综述
被引量:2
- 1
-
-
作者
李璐璐
朱睿杰
隋璐瑶
李亚飞
徐明亮
樊会涛
-
机构
郑州大学计算机与人工智能学院
智能集群系统教育部工程研究中心
国家超级计算郑州中心
-
出处
《计算机学报》
EI
CAS
CSCD
北大核心
2023年第12期2573-2596,共24页
-
基金
国家自然科学基金重点项目(62036010)
国家自然科学基金青年项目(62001422)
+1 种基金
国家自然科学基金面上项目(61972362,62372416)
国家重点研发计划课题(2021YFB3301504)资助。
-
文摘
智能集群系统是人工智能的重要分支,所涌现出的智能形态被称为集群智能,具有个体激发时的自组织性和群体汇聚时的强鲁棒性等特征.智能集群系统的协同决策过程是融合人-机-物,覆盖多元空间,囊括感知-决策-反馈-优化的复杂非线性问题,具有开放的决策模型和庞大的解空间.然而,传统的算法依赖大量的知识与经验,使其难以支持系统的持续演化.强化学习是一类兼具感知决策的端到端方法,其通过试错的方式不断迭代优化,具有强大的自主学习能力.近些年来,受生物群体和人工智能的启发,强化学习算法已由求解个体的决策问题,向优化集群的联合协同问题演进,为增强集群智能的汇聚和涌现注入了新动能.但是,强化学习在处理集群任务时面临感知环境时空敏感、群内个体高度自治、群间关系复杂多变、任务目标多维等挑战.本文立足于智能集群系统的协同决策过程与强化学习运行机理,从联合通信、协同决策、奖励反馈与策略优化四个方面梳理了强化学习算法应对挑战的方法,论述了面向智能集群系统的强化学习算法的典型应用,列举了相关开源平台及其适用算法.最后,从实际需求出发,讨论总结了今后的研究方向.
-
关键词
智能集群系统
集群智能
群体智能
强化学习
感知决策
-
Keywords
intelligent collective system
collective intelligence
swarm intelligence;reinforcement learning;perception and decision-making
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-