期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
粒子群算法求解混合战略近似纳什均衡 被引量:9
1
作者 伍文 孟相如 +1 位作者 康巧燕 李巧丽 《计算机应用研究》 CSCD 北大核心 2014年第8期2299-2302,共4页
为了有效降低纳什均衡求解的复杂度并提高其计算效率,提出了一种粒子群算法近似求解混合战略纳什均衡的新方法。在介绍混合战略纳什均衡理论的基础上,提出了混合战略纳什均衡定义的计算形式,并据此提出了混合战略近似纳什均衡的概念,给... 为了有效降低纳什均衡求解的复杂度并提高其计算效率,提出了一种粒子群算法近似求解混合战略纳什均衡的新方法。在介绍混合战略纳什均衡理论的基础上,提出了混合战略纳什均衡定义的计算形式,并据此提出了混合战略近似纳什均衡的概念,给出了粒子群算法求解混合战略近似纳什均衡的方法步骤。通过仿真验证了近似纳什均衡理论及粒子群求解过程的正确性,与原粒子群算法进行比较,得到新粒子群算法时效性更强的结论。 展开更多
关键词 博弈论 近似纳什均衡 粒子群算法 混合战略
下载PDF
布洛托上校博弈模型及求解方法研究进展
2
作者 罗俊仁 邹明我 +2 位作者 陈少飞 张万鹏 陈璟 《计算机科学》 CSCD 北大核心 2024年第1期84-98,共15页
信息的传播扩散可以建模为在潜在传播网络上发生的随机过程。由于在实际应用场景中,潜在的传播网络拓扑结构和清晰的传播过程往往是不可见的,因此根据观测到的传播结果,如节点感染时间、状态等信息,推断传播网络拓扑结构,对于分析与理... 信息的传播扩散可以建模为在潜在传播网络上发生的随机过程。由于在实际应用场景中,潜在的传播网络拓扑结构和清晰的传播过程往往是不可见的,因此根据观测到的传播结果,如节点感染时间、状态等信息,推断传播网络拓扑结构,对于分析与理解传播过程、跟踪传播路径以及预测未来传播事件起着重要作用。近年来,传播网络推断问题吸引了众多研究者的目光。文中对近年来的信息传播网络推断工作进行系统性的介绍和总结,为传播网络推断提供一个新视角。 展开更多
关键词 资源分配 布洛托上校博弈 近似纳什均衡 在线凸优化 期望遗憾 高概率遗憾
下载PDF
两方零和马尔科夫博弈下的策略梯度算法
3
作者 李永强 周键 +1 位作者 冯宇 冯远静 《模式识别与人工智能》 EI CSCD 北大核心 2023年第1期81-91,共11页
在两方零和马尔科夫博弈中,由于玩家策略会受到另一个玩家策略的影响,传统的策略梯度定理只适用于交替训练两个玩家的策略.为了实现同时训练两个玩家的策略,文中给出两方零和马尔科夫博弈下的策略梯度定理.然后,基于该策略梯度定理,提... 在两方零和马尔科夫博弈中,由于玩家策略会受到另一个玩家策略的影响,传统的策略梯度定理只适用于交替训练两个玩家的策略.为了实现同时训练两个玩家的策略,文中给出两方零和马尔科夫博弈下的策略梯度定理.然后,基于该策略梯度定理,提出基于额外梯度的REINFORCE算法,可使玩家的联合策略收敛到近似纳什均衡.文中从多个维度分析算法的优越性.首先,在同时移动博弈游戏上的对比实验表明,文中算法的收敛性和收敛速度较优.其次,分析文中算法得到的联合策略的特点,并验证这些联合策略达到近似纳什均衡.最后,在不同难度等级的同时移动博弈游戏上的对比实验表明,文中算法在更大的难度等级下仍能保持不错的收敛速度. 展开更多
关键词 马尔科夫博弈 零和博弈 策略梯度定理 近似纳什均衡
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部