期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于博弈强化学习的多智能体协作行为寻优 被引量:3
1
作者 张捍东 暴伟 王丽华 《自动化与仪表》 北大核心 2009年第1期1-4,共4页
针对非监督多Agent系统协作行为的动态优化中存在难以使行动序列收敛到Pareto最优问题,提出一种一般和博弈框架下改进Pareto-Q算法,将全局目标作为局部Pareto最优联合行为强化学习目标,并提出基于可接受度分配共同收益,将全局意义下的... 针对非监督多Agent系统协作行为的动态优化中存在难以使行动序列收敛到Pareto最优问题,提出一种一般和博弈框架下改进Pareto-Q算法,将全局目标作为局部Pareto最优联合行为强化学习目标,并提出基于可接受度分配共同收益,将全局意义下的最优行为通过迭代学习转化为局部Pareto行为,以多机器人行为协调为模型,仿真验证了算法的可行性和实用性。 展开更多
关键词 多Agent博弈 动态协作寻优 改进Pareto-Q 收益分配
下载PDF
基于核模糊聚类的动态多子群协作骨干粒子群优化 被引量:1
2
作者 杨国锋 戴家才 +2 位作者 刘向君 吴晓龙 田延妮 《计算机应用》 CSCD 北大核心 2018年第9期2568-2574,2609,共8页
针对骨干粒子群优化(BBPSO)算法易陷入局部最优、收敛速度低等问题,提出了基于核模糊聚类的动态多子群协作骨干粒子群优化(KFC-MSBPSO)算法。该算法在标准骨干粒子群算法的基础上,首先,采用核模糊聚类方法将主群分割为多个子群,令各个... 针对骨干粒子群优化(BBPSO)算法易陷入局部最优、收敛速度低等问题,提出了基于核模糊聚类的动态多子群协作骨干粒子群优化(KFC-MSBPSO)算法。该算法在标准骨干粒子群算法的基础上,首先,采用核模糊聚类方法将主群分割为多个子群,令各个子群协同寻优,提高了算法的搜索效率。然后,引入非线性动态变异因子,根据子群内粒子数以及收敛情况动态调节子群粒子变异概率,通过变异的方式使子群粒子重新回到主群,提高了算法的探索能力;进一步采用主群粒子吸收策略与子群合并策略加强了主群与子群之间、子群与子群之间的信息交流,提高了算法的稳定性。最后,利用子群重建策略,结合主群与子群搜索到的最优解,调节子群重建的间隔代数。通过Sphere等6个标准测试函数进行对比实验,结果表明,KFC-MSBPSO算法和经典BBPSO算法以及反向骨干粒子群优化(OBBPSO)算法等改进算法相比寻优准确率至少提高了约11.1%,在高维解空间内测试结果的最佳均值占到83.33%并且具有更高的收敛速度。这说明KFC-MSBPSO算法具有良好的搜索性能与鲁棒性,可应用于高维复杂函数的优化问题中。 展开更多
关键词 骨干粒子群优化 核模糊聚类 多子群 协作寻优 动态重组
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部