-
题名基于群体熵的机器人群体智能汇聚度量
被引量:1
- 1
-
-
作者
冯埔
吴文峻
罗杰
于鑫
田雍恺
-
机构
北京航空航天大学计算机学院
北京航空航天大学人工智能研究院
-
出处
《智能科学与技术学报》
2022年第1期65-74,共10页
-
基金
科技创新2030—“新一代人工智能”重大项目(No.2018AAA0102300)。
-
文摘
群体行为往往能产生远超个体行为的价值和复杂度。为了在个体智能的基础上更有效地衍生出群体智能,需要基于群体熵来科学地衡量群体智能水平,并以群体熵为引导目标,推动群体智能的增强和演进。针对这个重要的科学问题,以无人小车群体为研究对象,提出基于参数共享和群体策略熵的多智能体soft Q learning算法,通过共享智能体的观测信息,并结合最大熵强化学习方法,实现探索型任务中群体策略的持续学习更新。同时,通过将群体熵定义为度量工具,刻画群体学习中熵变化模式,实现对群智汇聚过程的定量分析。
-
关键词
群体熵
群体智能
深度强化学习
-
Keywords
swarm entropy
swarm intelligence
deep reinforcement learning
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-