期刊文献+
共找到39篇文章
< 1 2 >
每页显示 20 50 100
Nash Equilibrium of a Fixed-Sum Two-Player Game
1
作者 Yoshihiro Tanaka 《American Journal of Computational Mathematics》 2024年第3期346-357,共12页
It is well established that Nash equilibrium exists within the framework of mixed strategies in strategic-form non-cooperative games. However, finding the Nash equilibrium generally belongs to the class of problems kn... It is well established that Nash equilibrium exists within the framework of mixed strategies in strategic-form non-cooperative games. However, finding the Nash equilibrium generally belongs to the class of problems known as PPAD (Polynomial Parity Argument on Directed graphs), for which no polynomial-time solution methods are known, even for two-player games. This paper demonstrates that in fixed-sum two-player games (including zero-sum games), the Nash equilibrium forms a convex set, and has a unique expected payoff. Furthermore, these equilibria are Pareto optimal. Additionally, it is shown that the Nash equilibrium of fixed-sum two-player games can theoretically be found in polynomial time using the principal-dual interior point method, a solution method of linear programming. 展开更多
关键词 Nash Equilibrium Fixed-Sum two-player Game Principal-Dual Interior Point Method
下载PDF
Effects of the planarity and heterogeneity of networks on evolutionary two-player games 被引量:1
2
作者 Xu-Sheng Liu Zhi-Xi Wu Jian-Yue Guan 《Chinese Physics B》 SCIE EI CAS CSCD 2018年第12期164-171,共8页
We study the effects of the planarity and heterogeneity of networks on evolutionary two-player symmetric games by considering four different kinds of networks, including two types of heterogeneous networks: the weight... We study the effects of the planarity and heterogeneity of networks on evolutionary two-player symmetric games by considering four different kinds of networks, including two types of heterogeneous networks: the weighted planar stochastic lattice(a planar scale-free network) and the random uncorrelated scale-free network with the same degree distribution as the weighted planar stochastic lattice; and two types of homogeneous networks: the hexagonal lattice and the random regular network with the same degree k_0= 6 as the hexagonal lattice. Using extensive computer simulations, we found that both the planarity and heterogeneity of the network have a significant influence on the evolution of cooperation, either promotion or inhibition, depending not only on the specific kind of game(the Harmony, Snowdrift, Stag Hunt or Prisoner's Dilemma games), but also on the update rule(the Fermi, replicator or unconditional imitation rules). 展开更多
关键词 evolutionary two-player games PLANARITY HETEROGENEITY
下载PDF
两方零和马尔科夫博弈策略梯度算法及收敛性分析
3
作者 王卓 李永强 +1 位作者 冯宇 冯远静 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2024年第3期480-491,共12页
为了解决基于策略的强化学习方法在两方零和马尔科夫博弈中学习效率低下的问题,提出同时更新双方玩家策略的近似纳什均衡策略优化算法.将两方零和马尔科夫博弈问题描述为最大最小优化问题,针对参数化策略,给出马尔科夫博弈的策略梯度定... 为了解决基于策略的强化学习方法在两方零和马尔科夫博弈中学习效率低下的问题,提出同时更新双方玩家策略的近似纳什均衡策略优化算法.将两方零和马尔科夫博弈问题描述为最大最小优化问题,针对参数化策略,给出马尔科夫博弈的策略梯度定理,并通过近似随机策略梯度的推导,为算法实施提供可行性基础.通过比较分析不同的最大最小问题梯度更新方法,发现额外梯度相较于其他方法具有更好的收敛性能.基于这一发现,提出基于额外梯度的近似纳什均衡策略优化算法,并给出算法的收敛性证明.在Oshi-Zumo游戏上,使用表格式softmax参数化策略以及神经网络作为参数化策略,验证不同游戏规模场景下算法的有效性.通过对比实验,验证算法相对于其他方法的收敛性和优越性. 展开更多
关键词 两方零和马尔科夫博弈 强化学习 策略优化 额外梯度 纳什均衡 神经网络
下载PDF
基于强化学习的双人博弈差分隐私保护研究
4
作者 马明扬 杨洪勇 刘飞 《复杂系统与复杂性科学》 CAS CSCD 北大核心 2024年第4期107-114,共8页
针对双人博弈问题,在学习Q-learning算法的基础上,利用神经网络参数逼近的方式更新状态值函数,选取自适应梯度优化算法进行参数更新,并通过纳什均衡思想调节两个智能体的行为。同时为提高模型的保护效果,对结果添加差分隐私保护,保证智... 针对双人博弈问题,在学习Q-learning算法的基础上,利用神经网络参数逼近的方式更新状态值函数,选取自适应梯度优化算法进行参数更新,并通过纳什均衡思想调节两个智能体的行为。同时为提高模型的保护效果,对结果添加差分隐私保护,保证智能体博弈过程中数据的安全性。最后,实验结果验证了算法的可用性,其能够训练两个智能体在多回合之后稳定抵达各自目标点。 展开更多
关键词 强化学习 差分隐私 双人博弈
下载PDF
双人合作游戏背景下的玩家幸福感设计策略探究
5
作者 曹凯怡 吴明 《设计》 2024年第23期30-33,共4页
本研究探讨了双人合作游戏中玩家幸福感的增强策略,重点关注情感体验、交互叙事和审美体验如何共同作用以提升玩家的幸福感。文章采用扎根理论,将《It takes two》游戏的玩家在线评论作为主要数据源,使用Nvivo 12进行质性分析,以构建理... 本研究探讨了双人合作游戏中玩家幸福感的增强策略,重点关注情感体验、交互叙事和审美体验如何共同作用以提升玩家的幸福感。文章采用扎根理论,将《It takes two》游戏的玩家在线评论作为主要数据源,使用Nvivo 12进行质性分析,以构建理论模型。研究揭示了3个主要影响玩家幸福感的因素:交互叙事、审美体验和情感体验。这些因素相互作用,促进了玩家情绪的积极变化和幸福感的提升,进而建立了玩家幸福感模型(IAE模型)。研究结果为游戏设计提供了以玩家为中心的幸福感增强策略,以提升用户体验和满意度。 展开更多
关键词 扎根理论 幸福感 双人合作游戏 设计策略 用户体验
下载PDF
对手类型未知情况下的两人零和马尔科夫博弈决策
6
作者 王成意 朱进 赵云波 《控制理论与应用》 EI CAS CSCD 北大核心 2024年第11期2131-2138,共8页
本文研究一类典型的非完全信息博弈问题—-对手类型未知的两人零和马尔科夫博弈,其中对手类型多样且每次博弈开始前无法得知对手类型.文中提出了一种基于模型的多智能体强化学习算法—-对手辨识的极大极小Q学习(DOMQ).该算法首先建立对... 本文研究一类典型的非完全信息博弈问题—-对手类型未知的两人零和马尔科夫博弈,其中对手类型多样且每次博弈开始前无法得知对手类型.文中提出了一种基于模型的多智能体强化学习算法—-对手辨识的极大极小Q学习(DOMQ).该算法首先建立对手相关环境的经验模型,再使用经验模型学习纳什均衡策略,己方智能体在实际博弈中根据经验模型判断对手类型,从而使用相应的纳什均衡策略,以保证收益下限.本文所提的DOMQ算法只需要在采样阶段的每轮博弈结束后得知对手的类型,除此之外无需知道任何环境的信息.仿真实验验证了所提算法的有效性. 展开更多
关键词 两人零和马尔科夫博弈 非完全信息 极大极小Q学习 纳什均衡 多智能体强化学习
下载PDF
基于不完全信息演化博弈模型的网络舆情传播羊群行为 被引量:28
7
作者 刘锦德 刘咏梅 《国防科技大学学报》 EI CAS CSCD 北大核心 2013年第5期96-101,共6页
以网络舆情传播过程中大部分人对事实不了解为前提,在这部分群体内构建基于不完全信息环境的两人对称演化博弈模型。提出了两人对称博弈矩阵来决定个体策略的选择,建立了复制动态方程说明不同策略群体比例的演化方向,演化时引入个体的... 以网络舆情传播过程中大部分人对事实不了解为前提,在这部分群体内构建基于不完全信息环境的两人对称演化博弈模型。提出了两人对称博弈矩阵来决定个体策略的选择,建立了复制动态方程说明不同策略群体比例的演化方向,演化时引入个体的记忆长度,根据设定的交互规则更新各自的观点值及记忆列表。仿真分析模型表明,在此环境中很容易产生羊群行为,群体内的个体都选择盲从并且观点保持一致。此外,羊群行为的集聚产生受多种因素影响,主要与采取分析策略的交互利益、成本系数以及记忆长度有关。本文对科学分析引导网络舆情的传播有一定实际意义。 展开更多
关键词 两人对称演化博弈 复制动态方程 网络舆情 羊群行为
下载PDF
一种求解二人序贯博弈均衡的新算法 被引量:1
8
作者 黄武军 吴启迪 +2 位作者 杨继君 冯云生 许维胜 《计算机工程与应用》 CSCD 北大核心 2009年第27期39-42,共4页
虽然线性规划方法处理正规型零和博弈均衡问题有其独特的优点,但对零和序贯博弈均衡问题的求解却无能为力,而常用的逆向归纳法求解该类问题也有其固有的不足。鉴于上述原因,首先在序贯型博弈中定义了行动序列和实现概率等概念并给出相... 虽然线性规划方法处理正规型零和博弈均衡问题有其独特的优点,但对零和序贯博弈均衡问题的求解却无能为力,而常用的逆向归纳法求解该类问题也有其固有的不足。鉴于上述原因,首先在序贯型博弈中定义了行动序列和实现概率等概念并给出相关定理。在此基础上,结合线性规划的思想,推出了求解二人零和序贯博弈均衡的新算法。该算法的目的是把序贯型博弈纳什均衡求解问题转化为线性规划问题,然后通过使用现成的线性规划软件(比如LINDO/LINGO软件)进行求解。该算法对解决该类问题提供了新的途径,具有一定的理论价值和实用价值。最后的算例对比分析说明了算法的可行性和有效性。 展开更多
关键词 二人序贯博弈 行动序列 实现概率 线性规划
下载PDF
MP4播放器双色外壳的注塑模设计 被引量:6
9
作者 匡唐清 阎智 付伟 《中国塑料》 CAS CSCD 北大核心 2012年第6期117-122,共6页
针对MP4双色外壳内外层包覆的特点,确定采用转盘式双色注塑机成型,浇注系统为热流道与冷流道相结合的方式,内外层分别采用潜伏浇口和扇形浇口。借助Moldflow软件,首先基于熔接痕结果优化了进胶位置,而后通过双色成型分析预测了其充填状... 针对MP4双色外壳内外层包覆的特点,确定采用转盘式双色注塑机成型,浇注系统为热流道与冷流道相结合的方式,内外层分别采用潜伏浇口和扇形浇口。借助Moldflow软件,首先基于熔接痕结果优化了进胶位置,而后通过双色成型分析预测了其充填状况、气穴分布、注射压力及锁模力、顶出时间等,为双色模具的设计及注塑机规格选择提供了依据。最后详细阐述了该转盘式双色注塑模的结构及工作原理。 展开更多
关键词 播放器 双色外壳 模具设计 模流分析
下载PDF
二人博弈问题中单一纳什均衡的搜索算法 被引量:1
10
作者 孙舒杨 刘大有 孙成敏 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2006年第3期418-420,共3页
给出计算二人博弈问题中单一纳什均衡的一种搜索算法,用支付矩阵的秩数和条件占优行的个数限定待搜索策略对空间,将该空间按一定规则排序,通过对有序有限策略对空间进行搜索得到一个简单的纳什均衡.
关键词 二人博弈 纳什均衡 支撑集 条件占优策略
下载PDF
具有未知动态的线性系统二人零和博弈问题在线学习方案 被引量:2
11
作者 富月 柴天佑 《控制理论与应用》 EI CAS CSCD 北大核心 2015年第2期196-201,共6页
针对具有未知动态线性系统的二人零和博弈问题,本文提出了一种新的基于单环迭代方法的在线学习方案.为保证单环迭代方法的收敛性,给出了一种新的分析方法.在系统内部矩阵A,控制输入矩阵B以及干扰输入矩阵D均未知的情况下,通过在线迭代策... 针对具有未知动态线性系统的二人零和博弈问题,本文提出了一种新的基于单环迭代方法的在线学习方案.为保证单环迭代方法的收敛性,给出了一种新的分析方法.在系统内部矩阵A,控制输入矩阵B以及干扰输入矩阵D均未知的情况下,通过在线迭代策略,同步得到了博弈代数黎卡提方程的近似解,以及控制和干扰策略.仿真结果表明了所提方法的有效性. 展开更多
关键词 二人零和博弈 策略迭代 博弈代数黎卡提方程
下载PDF
乒乓球弧圈打法对不同性能球拍削球打法的训练方法研究 被引量:2
12
作者 周映春 丁玲玲 《沈阳体育学院学报》 2005年第4期89-91,共3页
结合江苏科技大学高水平乒乓球队实例,对高校高水平乒乓球队中弧圈类打法运动员对付两面不同性能球拍削球手的训练方法进行了研究,这将有利于人们更加重视如何对付削球打法和促进普通高校高水平乒乓球队的发展。
关键词 普通高校 高水平乒乓球队 两面不同性能球拍削球打法运动员 弧圈类打法运动员 训练方法
下载PDF
赛程安排中的数学问题 被引量:10
13
作者 姜启源 《工程数学学报》 CSCD 北大核心 2003年第5期130-133,共4页
本文结合论文评阅中发现的问题,对赛程安排这道题目给出了一般性结果,并提出可进一步研究的问题。
关键词 数学模型 单循环 评价指标 赛程安排
下载PDF
严格鞍点的查找算法 被引量:1
14
作者 徐子珊 《重庆工商大学学报(自然科学版)》 2004年第5期477-479,共3页
对两人有限零和对策,可以通过搜索其赢得矩阵的鞍点来求得其优化解,对搜索赢得矩阵中的严格鞍点提出了一个快速算法,并对其进行了时间复杂度的分析。
关键词 鞍点 矩阵 优化解 有限 快速算法 搜索 时间复杂度 查找算法
下载PDF
钢琴集体课中的重奏教学探究 被引量:4
15
作者 唐馨 《科教文汇》 2014年第35期127-128,共2页
钢琴集体课是上世纪90代年开始在我国高等师范院校和综合性大学音乐学院中逐渐开展起来的钢琴教学新模式,经过近20年的发展,得以日益普及和重视。钢琴集体课打破了传统的"一对一"钢琴教学模式,是一门综合性的全新钢琴课程。... 钢琴集体课是上世纪90代年开始在我国高等师范院校和综合性大学音乐学院中逐渐开展起来的钢琴教学新模式,经过近20年的发展,得以日益普及和重视。钢琴集体课打破了传统的"一对一"钢琴教学模式,是一门综合性的全新钢琴课程。本论文主要针对钢琴集体课中的重奏教学进行研究分析。 展开更多
关键词 钢琴集体课 钢琴二重奏 四手联弹 双钢琴
下载PDF
五子棋游戏双人对决的设计与实现 被引量:1
16
作者 吕橙 《现代计算机》 2021年第3期94-100,共7页
运用C语言在DEV C++平台上设计开发一款能够实现双人对决模式五子棋游戏,通过游戏的开发,达到学习C语言和熟悉软件开发流程的目的。
关键词 DEV C++ 五子棋游戏 双人对战
下载PDF
求解两人博弈纳什平衡问题的定制临近点算法
17
作者 彭拯 江彬倩 庄杰鹏 《福州大学学报(自然科学版)》 CAS 北大核心 2018年第1期1-7,共7页
针对一类不允许校正的两人轮流博弈纳什平衡问题,提出一种定制临近点分裂算法.该算法可用于模拟一种实际博弈活动:参与博弈的两个局中人轮流决策,且在一轮博弈中,每位局中人综合考虑对手上一轮与本轮所给出的决策,根据最优响应规则做出... 针对一类不允许校正的两人轮流博弈纳什平衡问题,提出一种定制临近点分裂算法.该算法可用于模拟一种实际博弈活动:参与博弈的两个局中人轮流决策,且在一轮博弈中,每位局中人综合考虑对手上一轮与本轮所给出的决策,根据最优响应规则做出自己的相应决策.在一定假设条件下证明定制临近点算法全局地收敛到所考虑博弈的纳什平衡,数值算例验证了算法的有效性. 展开更多
关键词 两人轮流博弈 纳什平衡 定制临近点算法 不允许校正 分裂算法
下载PDF
基于带模糊信息的两人一般和有限可信性博弈
18
作者 张倩 陈诚 程玲华 《合肥学院学报(自然科学版)》 2008年第3期10-12,共3页
高金伍等提出了可信性博弈的谱,通过可信性方法把不完全信息看作模糊变量来处理.在此基础上,对带模糊收益的两人一般和有限博弈进行讨论,提出可信性均衡的3种类型,并给出了它们的存在性定理.
关键词 模糊变量 可信性均衡 两人一般和有限可信性博弈
下载PDF
二人减数博弈的取胜策略
19
作者 李超 《湘南学院学报》 2012年第5期19-20,共2页
给出了二人减数博弈的取胜策略及其证明.
关键词 二人博弈 胜局向量 胜局矩阵 证明
下载PDF
“双向串连”教学模式在体育专业排球普修课扣球教学中的实验研究 被引量:1
20
作者 孙天明 《山东体育科技》 2007年第2期59-61,共3页
根据多年的教学实践,结合前人的研究成果,把排球正面扣球动作排列成相互串连的单元序列,运用“排球正面扣球双向串连教学模式”,突出初学者在学习排球正面扣球技术过程中,以“保持良好的人与球关系”为学习重点,建立具有“共同要素”的... 根据多年的教学实践,结合前人的研究成果,把排球正面扣球动作排列成相互串连的单元序列,运用“排球正面扣球双向串连教学模式”,突出初学者在学习排球正面扣球技术过程中,以“保持良好的人与球关系”为学习重点,建立具有“共同要素”的单元序列,体现扣球技术的完整性和连惯性。通过教学实验,收到了良好的效果。 展开更多
关键词 扣球 双向串连 助跑起跳 人球关系 排球教学
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部