-
题名粒子群算法求解混合战略近似纳什均衡
被引量:9
- 1
-
-
作者
伍文
孟相如
康巧燕
李巧丽
-
机构
空军工程大学信息与导航学院
[
[
-
出处
《计算机应用研究》
CSCD
北大核心
2014年第8期2299-2302,共4页
-
基金
国家自然科学基金资助项目(61003252
61201209)
-
文摘
为了有效降低纳什均衡求解的复杂度并提高其计算效率,提出了一种粒子群算法近似求解混合战略纳什均衡的新方法。在介绍混合战略纳什均衡理论的基础上,提出了混合战略纳什均衡定义的计算形式,并据此提出了混合战略近似纳什均衡的概念,给出了粒子群算法求解混合战略近似纳什均衡的方法步骤。通过仿真验证了近似纳什均衡理论及粒子群求解过程的正确性,与原粒子群算法进行比较,得到新粒子群算法时效性更强的结论。
-
关键词
博弈论
近似纳什均衡
粒子群算法
混合战略
-
Keywords
game theory
approximate Nash equilibrium
particle swarm algorithm
mixed strategy
-
分类号
O225
[理学—运筹学与控制论]
-
-
题名布洛托上校博弈模型及求解方法研究进展
- 2
-
-
作者
罗俊仁
邹明我
陈少飞
张万鹏
陈璟
-
机构
国防科技大学智能科学学院
-
出处
《计算机科学》
CSCD
北大核心
2024年第1期84-98,共15页
-
基金
国家自然科学基金(61806212)
湖南省研究生创新项目(CX20210011)。
-
文摘
信息的传播扩散可以建模为在潜在传播网络上发生的随机过程。由于在实际应用场景中,潜在的传播网络拓扑结构和清晰的传播过程往往是不可见的,因此根据观测到的传播结果,如节点感染时间、状态等信息,推断传播网络拓扑结构,对于分析与理解传播过程、跟踪传播路径以及预测未来传播事件起着重要作用。近年来,传播网络推断问题吸引了众多研究者的目光。文中对近年来的信息传播网络推断工作进行系统性的介绍和总结,为传播网络推断提供一个新视角。
-
关键词
资源分配
布洛托上校博弈
近似纳什均衡
在线凸优化
期望遗憾
高概率遗憾
-
Keywords
Resource allocation
Colonel Blotto game
Approximate Nash equilibrium
Online convex optimization
Expected regret
High-probability regret
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名两方零和马尔科夫博弈下的策略梯度算法
- 3
-
-
作者
李永强
周键
冯宇
冯远静
-
机构
浙江工业大学信息工程学院
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2023年第1期81-91,共11页
-
基金
国家自然科学基金面上项目(No.62073294)
浙江省自然科学基金重点项目(No.LZ21F030003)资助。
-
文摘
在两方零和马尔科夫博弈中,由于玩家策略会受到另一个玩家策略的影响,传统的策略梯度定理只适用于交替训练两个玩家的策略.为了实现同时训练两个玩家的策略,文中给出两方零和马尔科夫博弈下的策略梯度定理.然后,基于该策略梯度定理,提出基于额外梯度的REINFORCE算法,可使玩家的联合策略收敛到近似纳什均衡.文中从多个维度分析算法的优越性.首先,在同时移动博弈游戏上的对比实验表明,文中算法的收敛性和收敛速度较优.其次,分析文中算法得到的联合策略的特点,并验证这些联合策略达到近似纳什均衡.最后,在不同难度等级的同时移动博弈游戏上的对比实验表明,文中算法在更大的难度等级下仍能保持不错的收敛速度.
-
关键词
马尔科夫博弈
零和博弈
策略梯度定理
近似纳什均衡
-
Keywords
Markov Game
Zero-Sum Game
Policy Gradient Theorem
Approximate Nash Equilibrium
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-