-
题名基于后悔值的多蚁协作关联强化学习模型
被引量:1
- 1
-
-
作者
柴毅
利节
王嘉骐
-
机构
重庆大学自动化学院
-
出处
《系统工程》
CSSCI
CSCD
北大核心
2010年第4期64-67,共4页
-
文摘
自适应蚁群算法是蚁群算法的衍生,并成功有效地解决了许多路径优化问题,但随着问题规模增大,自适应蚁群算法已不能有效快速地得到我们期盼的结果。对于大规模的路径优化问题,根据分布式的思想,引入关联强化学习和后悔值以最大限度降低每一步决策对全局解的坏影响,实现多蚁之间的协作来提高解的质量,并缩短寻优时间,并加入2-opt算法避免陷入局部最优。以TSP为例,对比了不同规模的TSP的仿真结果,并加以分析得出结论。
-
关键词
多蚁协作
后悔值
关联强化学习
-
Keywords
Multi-ant Cooperation
Regret Values
Relative Reinforcement Learning
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-