-
题名基于博弈强化学习的多智能体协作行为寻优
被引量:3
- 1
-
-
作者
张捍东
暴伟
王丽华
-
机构
安徽工业大学电气信息学院
安徽工业大学管理科学与工程学院
安徽工业大学机械工程学院
-
出处
《自动化与仪表》
北大核心
2009年第1期1-4,共4页
-
基金
国家自然科学基金项目(50407017)
安徽省教育厅自然科学基金项目(2004KJ058
2006KJ019A)
-
文摘
针对非监督多Agent系统协作行为的动态优化中存在难以使行动序列收敛到Pareto最优问题,提出一种一般和博弈框架下改进Pareto-Q算法,将全局目标作为局部Pareto最优联合行为强化学习目标,并提出基于可接受度分配共同收益,将全局意义下的最优行为通过迭代学习转化为局部Pareto行为,以多机器人行为协调为模型,仿真验证了算法的可行性和实用性。
-
关键词
多Agent博弈
动态协作寻优
改进Pareto-Q
收益分配
-
Keywords
multi-agent games
dynamic collaborative optimization
improved pareto-Q
profit-allocation
-
分类号
TP242.6
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名基于核模糊聚类的动态多子群协作骨干粒子群优化
被引量:1
- 2
-
-
作者
杨国锋
戴家才
刘向君
吴晓龙
田延妮
-
机构
西南石油大学地球科学与技术学院
油气藏地质及开发工程国家重点实验室(西南石油大学)
-
出处
《计算机应用》
CSCD
北大核心
2018年第9期2568-2574,2609,共8页
-
基金
国家自然科学基金资助项目(41474115)
中国石油天然气集团公司重大科技专项(2016D-3802)~~
-
文摘
针对骨干粒子群优化(BBPSO)算法易陷入局部最优、收敛速度低等问题,提出了基于核模糊聚类的动态多子群协作骨干粒子群优化(KFC-MSBPSO)算法。该算法在标准骨干粒子群算法的基础上,首先,采用核模糊聚类方法将主群分割为多个子群,令各个子群协同寻优,提高了算法的搜索效率。然后,引入非线性动态变异因子,根据子群内粒子数以及收敛情况动态调节子群粒子变异概率,通过变异的方式使子群粒子重新回到主群,提高了算法的探索能力;进一步采用主群粒子吸收策略与子群合并策略加强了主群与子群之间、子群与子群之间的信息交流,提高了算法的稳定性。最后,利用子群重建策略,结合主群与子群搜索到的最优解,调节子群重建的间隔代数。通过Sphere等6个标准测试函数进行对比实验,结果表明,KFC-MSBPSO算法和经典BBPSO算法以及反向骨干粒子群优化(OBBPSO)算法等改进算法相比寻优准确率至少提高了约11.1%,在高维解空间内测试结果的最佳均值占到83.33%并且具有更高的收敛速度。这说明KFC-MSBPSO算法具有良好的搜索性能与鲁棒性,可应用于高维复杂函数的优化问题中。
-
关键词
骨干粒子群优化
核模糊聚类
多子群
协作寻优
动态重组
-
Keywords
BareBones Particle Swarm Optimization(BBPSO)
kernel fuzzy clustering
multi-subgroup
collaborative optimization
dynamic restructuring
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-