期刊文献+
共找到41篇文章
< 1 2 3 >
每页显示 20 50 100
一种基于不完美信息博弈的多冲突域信道分配算法 被引量:2
1
作者 戴昊峰 何世彪 +2 位作者 谭冕 郑鹏宇 张晖 《电信科学》 北大核心 2014年第5期112-119,共8页
无线网络中信道分配的好坏将极大地影响网络整体性能,为了解决和优化此问题,提出了一种基于不完美信息博弈的信道分配算法。假设网络场景为多跳Ad Hoc网络,因此对其采用多冲突域建模更符合实际。算法通过不断循环改变各用户无线电的信... 无线网络中信道分配的好坏将极大地影响网络整体性能,为了解决和优化此问题,提出了一种基于不完美信息博弈的信道分配算法。假设网络场景为多跳Ad Hoc网络,因此对其采用多冲突域建模更符合实际。算法通过不断循环改变各用户无线电的信道试图接近纳什均衡点,仿真结果表明算法能够使信道分配策略接近纳什均衡信道分配,同时相比单冲突域情况在多冲突域中更能最大化信道使用率。 展开更多
关键词 无线AD HOC网络 信道分配 多冲突域 完美信息博弈
下载PDF
基于完美信息博弈的多无线电信道分配算法 被引量:1
2
作者 戴昊峰 何世彪 +2 位作者 韩辉 张晖 谭冕 《电视技术》 北大核心 2014年第13期103-107,共5页
无线网络的信道分配博弈分析,可分为单冲突域和多冲突域建模。在ad hoc网络中,采用多冲突域建模更符合实际。将ad hoc网络建模为多冲突域模型,提出一种基于完美信息的非合作信道分配算法,验证了算法的收敛性,仿真结果表明该算法相比其... 无线网络的信道分配博弈分析,可分为单冲突域和多冲突域建模。在ad hoc网络中,采用多冲突域建模更符合实际。将ad hoc网络建模为多冲突域模型,提出一种基于完美信息的非合作信道分配算法,验证了算法的收敛性,仿真结果表明该算法相比其他算法在多冲突域中更能最大化信道使用率。 展开更多
关键词 无线AD HOC网络 信道分配 多冲突域 完美信息博弈
下载PDF
基于完美信息博弈的第三方支付机构定价分析 被引量:2
3
作者 栾福茂 谢瑶华 卜庆军 《财会月刊(下)》 北大核心 2016年第11期97-100,共4页
第三方支付机构向消费者收取费用是大势所趋。本文将先采用Hotelling模型来分析不同双边用户的效用函数,并运用完美信息动态博弈——斯坦克尔伯格模型来分析第三方支付机构和银行之间的定价决策。研究结果表明,作为垄断方的银行有优先... 第三方支付机构向消费者收取费用是大势所趋。本文将先采用Hotelling模型来分析不同双边用户的效用函数,并运用完美信息动态博弈——斯坦克尔伯格模型来分析第三方支付机构和银行之间的定价决策。研究结果表明,作为垄断方的银行有优先定价权,但是也需要考虑到第三方支付机构处于一个不亏损的情况之下,而第三方支付机构收取的费用和消费者的价格弹性、商户的价格弹性及整个第三方支付平台的价格弹性有关,而且与银行对第三方支付机构收取的费用有关。 展开更多
关键词 完美信息博弈 第三方支付定价 第三方支付机构 银行
下载PDF
不完美信息博弈中对手模型的研究 被引量:2
4
作者 吴天栋 石英 《河南科技大学学报(自然科学版)》 CAS 北大核心 2019年第1期54-59,109,共7页
针对传统的显式建模方法依赖大量数据样本的问题,提出了策略自扩展算法,通过样本数据的自扩展来提高建模效率。同时,为了提高对手模型的准确度,结合隐式建模和隐式子策略建模的方法,提出了子策略发现算法。以勒杜克(Leduc)扑克博弈为实... 针对传统的显式建模方法依赖大量数据样本的问题,提出了策略自扩展算法,通过样本数据的自扩展来提高建模效率。同时,为了提高对手模型的准确度,结合隐式建模和隐式子策略建模的方法,提出了子策略发现算法。以勒杜克(Leduc)扑克博弈为实验对象,对比研究了2种传统方法和本文提出的2种算法。实验结果表明:策略自扩展算法提高了显式建模的效率和模型准确性。在利用对手弱点获取收益方面,策略自扩展算法比显式建模方法提升了84. 4%,子策略发现算法比隐式建模方法提升了128. 6%。 展开更多
关键词 完美信息博弈 对手模型 策略自扩展 隐式建模
下载PDF
有限完美信息博弈的一个应用
5
作者 曹晓云 《闽西职业大学学报》 2002年第3期79-80,共2页
应用有限完美信息博弈理论,分析了新技术新产品开发者与仿冒盗用新技术新产品的侵权者之间的动态博弈。
关键词 应用 有限完美信息博弈 动态博弈 逆向归纳法 NASH均衡解 数学模型 信息经济学
下载PDF
基于不完美信息博弈的网上购物信任问题分析 被引量:7
6
作者 王俊逸 曹立明 《计算机与数字工程》 2008年第1期70-73,共4页
随着网上购物在中国的快速发展,越来越多的网上欺诈和交易纠纷也不断发生。结合完全但不完美信息动态博弈和重复博弈的思想,通过博弈模型对网上欺诈产生的原因、条件、制约因素以及治理的途径作一些解释和探讨,并对我国健全网上信用机... 随着网上购物在中国的快速发展,越来越多的网上欺诈和交易纠纷也不断发生。结合完全但不完美信息动态博弈和重复博弈的思想,通过博弈模型对网上欺诈产生的原因、条件、制约因素以及治理的途径作一些解释和探讨,并对我国健全网上信用机制提出一些建议。 展开更多
关键词 网上购物 完全但不完美信息动态博弈 重复博弈 计算机仿真
下载PDF
非完美信息博弈综述:对抗求解方法与对比分析
7
作者 余超 刘宗凯 +2 位作者 胡超豪 黄凯奇 张俊格 《计算机学报》 EI CAS 2024年第9期2211-2246,共36页
当前,人工智能成为经济发展的新引擎,是新一轮产业变革的核心驱动力.结合人工智能与博弈论形成的新兴研究领域“博弈智能”吸引了越来越多学者的研究兴趣,并在现实生活中得到了广泛应用.作为一类典型的博弈智能,非完美信息博弈通过建模... 当前,人工智能成为经济发展的新引擎,是新一轮产业变革的核心驱动力.结合人工智能与博弈论形成的新兴研究领域“博弈智能”吸引了越来越多学者的研究兴趣,并在现实生活中得到了广泛应用.作为一类典型的博弈智能,非完美信息博弈通过建模多智能体在私有信息下的博弈行为,能够刻画相较完美信息博弈更广泛的决策过程,在现实世界中具有广泛应用,例如金融贸易、商业谈判、军事对抗等.近年来,非完美信息博弈求解研究取得了突破性进展,涌现出以遗憾最小化(Regret Minimization)和最佳响应(Best Response)为核心技术的两大类离线求解方法.前者通过反省智能体过往决策以使自身策略向均衡点改进,成功解决了以德州扑克为代表的经典非完美信息博弈.后者通过特定应对方式针对对手决策以使自身策略向均衡点改进,在例如星际争霸、DOTA等大型实时战略游戏AI训练中发挥着关键作用.此外,一系列在线求解方法能够进一步实时优化离线算法求解所得的蓝图策略,使其在实时对局中得到进一步改进,成为求解非完美信息博弈的关键技术.本文将从非完美信息博弈的概念和特点切入,全面介绍这三类方法的基本原理、发展脉络和改进技巧,深入对比不同方法间的优缺点并展望未来研究方向.希望通过对非完美信息博弈求解这一研究领域的全方位细致梳理,能够进一步推动博弈智能技术向前发展,为迈向通用人工智能赋能. 展开更多
关键词 完美信息博弈 遗憾最小化 最佳响应 在线求解 强化学习
下载PDF
计算机博弈中序贯不完美信息博弈求解研究进展 被引量:2
8
作者 罗俊仁 张万鹏 +2 位作者 苏炯铭 魏婷婷 陈璟 《控制与决策》 EI CSCD 北大核心 2023年第10期2721-2748,共28页
计算机博弈是人工智能的果蝇和通用测试基准.近年来,序贯不完美信息博弈求解一直是计算机博弈研究领域的前沿课题.围绕计算机博弈中不完美信息博弈求解问题展开综述分析.首先,梳理计算机博弈领域标志性突破的里程碑事件,简要介绍4类新... 计算机博弈是人工智能的果蝇和通用测试基准.近年来,序贯不完美信息博弈求解一直是计算机博弈研究领域的前沿课题.围绕计算机博弈中不完美信息博弈求解问题展开综述分析.首先,梳理计算机博弈领域标志性突破的里程碑事件,简要介绍4类新评估基准,归纳3种研究范式,提出序贯不完美信息博弈求解研究框架;然后,着重对序贯不完美信息博弈的博弈模型和解概念进行调研,从博弈构建、子博弈和元博弈、解概念以及评估3方面进行简要介绍;接着,围绕离线策略求解,系统梳理算法博弈论、优化理论和博弈学习3大类方法,围绕在线策略求解,系统梳理对手近似式学习、对手判别式适变和对手生成式搜索3大类方法;最后,从环境、智能体(对手)和策略求解3个角度分析面临的挑战,从博弈动力学和策略空间理论、多模态对抗博弈和序贯建模、通用策略学习和离线预训练、对手建模(剥削)和反剥削、临机组队和零样本协调5方面展望未来研究前沿课题.对于当前不完美信息博弈求解问题进行全面概述,期望能够为人工智能和博弈论领域相关研究带来启发. 展开更多
关键词 计算机博弈 完美信息博弈 扩展式博弈 反事实后悔最小化 在线凸优化 无悔学习 对手建模
原文传递
一种大众麻将计算机博弈的快速出牌方法
9
作者 张小川 严明珠 +2 位作者 涂飞 陈俊宇 魏乐天 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第5期102-107,共6页
麻将是一种典型的不完美信息博弈的项目,目前对于麻将问题的解决方法大多朝着深度强化学习方向进行研究,也取得了非常好的效果。但是,此类麻将AI都是建立在有高质量数据集基础上的,而大众麻将缺少关键的大量有效标注的数据集,因此,如何... 麻将是一种典型的不完美信息博弈的项目,目前对于麻将问题的解决方法大多朝着深度强化学习方向进行研究,也取得了非常好的效果。但是,此类麻将AI都是建立在有高质量数据集基础上的,而大众麻将缺少关键的大量有效标注的数据集,因此,如何在对弈中快速出牌就成为主要问题。针对以上问题,对出牌动作进行研究,以启发式快速出牌为思路,提出了面向敌方胡牌牌张的蒙特卡洛评估法,将启发式快速出牌方法和蒙特卡洛评估法相结合,对每张手牌进行估值计算,通过估值分数决定每轮出牌牌张。以历史出牌次数为分界点,以此分界将博弈过程时序化为前后2个决策时段,前段采用启发式快速出牌方法,后段采用蒙特卡洛评估法。通过前后时段法分层递进决策处理过程,给出最佳出牌着法,能有效减少出牌的决策时间并降低点炮率。采用所提方法的程序在中国计算机博弈锦标赛中获得了一等奖,证明了该方法的有效性。 展开更多
关键词 计算机博弈 完美信息博弈 麻将 启发式快速出牌 蒙特卡洛评估法
下载PDF
遏制投保人逆向选择的不完美信息动态博弈分析
10
作者 范广慧 马艳芬 《黑龙江工程学院学报》 CAS 2009年第3期78-80,共3页
以投保人在购买低风险保单过程中投保人与保险公司之间的博弈过程为研究对象,首先建立两者之间的三阶段不完美信息动态博弈模型;然后以命题形式给出该博弈模型的完美贝叶斯均衡,并用逆推归纳法对命题进行详细证明;最后通过对完美贝叶斯... 以投保人在购买低风险保单过程中投保人与保险公司之间的博弈过程为研究对象,首先建立两者之间的三阶段不完美信息动态博弈模型;然后以命题形式给出该博弈模型的完美贝叶斯均衡,并用逆推归纳法对命题进行详细证明;最后通过对完美贝叶斯均衡点的定量分析,找出遏制投保人逆向选择的方法。 展开更多
关键词 逆向选择 完美信息动态博弈 完美贝叶斯均衡
下载PDF
预测信息披露制度的有效性及其选择:基于博弈的视角 被引量:5
11
作者 谢仍明 唐跃军 《南开经济研究》 CSSCI 北大核心 2013年第4期42-58,共17页
预测信息所起的作用要远远大于历史信息,而对预测信息实行强制性披露还是自愿性披露决定着企业管理层的披露行为,从而决定了投资者所获预测信息的数量和质量,最终将影响证券市场的效率。本文在对博弈报酬进行严格论证的基础上,分别建立... 预测信息所起的作用要远远大于历史信息,而对预测信息实行强制性披露还是自愿性披露决定着企业管理层的披露行为,从而决定了投资者所获预测信息的数量和质量,最终将影响证券市场的效率。本文在对博弈报酬进行严格论证的基础上,分别建立并求解了强制性预测信息披露制度和自愿性预测信息披露制度下的不完美信息博弈模型,计算并比较了两种信息披露制度下的弱完美贝叶斯纳什均衡所对应的社会福利值,从而找出了较为有效的信息披露制度。研究结果表明,强制性预测信息披露制度能打破由信息不对称所导致的恶性循环,并能对管理者构成有效的威慑。因此,强制性预测信息披露制度比自愿性预测信息披露制度更能增进社会福利,因而更为可取。 展开更多
关键词 预测信息披露 完美信息博弈 完美贝叶斯纳什均衡 社会福利
下载PDF
最优关税与补贴决策——一个完全非完美信息两阶段博弈模型
12
作者 张滢 江涛 《商场现代化》 2009年第6期14-15,共2页
本文从关税与补贴的最优均衡的角度出发,引入完全非完美信息两阶段博弈对其进行博弈分析和评价。在子博弈精炼解中得出最优关税为正,最优补贴为负,前者符合现有讨论的一般结论,而后者在贸易领域中具有新的现实意义。最后,本文对资源型... 本文从关税与补贴的最优均衡的角度出发,引入完全非完美信息两阶段博弈对其进行博弈分析和评价。在子博弈精炼解中得出最优关税为正,最优补贴为负,前者符合现有讨论的一般结论,而后者在贸易领域中具有新的现实意义。最后,本文对资源型行业进行实证分析来证实上述结论。 展开更多
关键词 关税 补贴 完全非完美信息两阶段博弈
下载PDF
大学生消费信贷市场的完全但不完美信息动态博弈分析 被引量:1
13
作者 李根 《广西质量监督导报》 2019年第3期113-114,共2页
近年来,大学生消费信贷市场在以互联网为依托的大背景之下迅速发展,但大学生这个特殊的群体有其特殊性,正是其自身的特殊性使得大学生消费信贷市场风险陡然增加,本文将从大学消费信贷市场对大学生消费信贷市场的完全但不完美信息动态博... 近年来,大学生消费信贷市场在以互联网为依托的大背景之下迅速发展,但大学生这个特殊的群体有其特殊性,正是其自身的特殊性使得大学生消费信贷市场风险陡然增加,本文将从大学消费信贷市场对大学生消费信贷市场的完全但不完美信息动态博弈进行分析。分析表明,大学生消费信贷市场缺乏有效的约束机制。 展开更多
关键词 大学生消费信贷市场 完全但不完美信息动态博弈 约束机制
下载PDF
大学生消费信贷市场的完全完美信息动态博弈分析
14
作者 李根 《广西质量监督导报》 2019年第4期212-213,共2页
大学生消费信贷作为消费信贷市场的重要组成部分近年来在网络购物的大背景下刺激了大学生群体的超前消费。然而由于我国大学生消费信贷市场征信体系的不完善以及消费信贷平台的约束成本过高,使得我国大学生消费信贷市场的信贷违约风险... 大学生消费信贷作为消费信贷市场的重要组成部分近年来在网络购物的大背景下刺激了大学生群体的超前消费。然而由于我国大学生消费信贷市场征信体系的不完善以及消费信贷平台的约束成本过高,使得我国大学生消费信贷市场的信贷违约风险陡然增加。本文主要对大学生消费信贷市场的完全完美信息动态博弈进行分析。 展开更多
关键词 大学生消费信贷市场 征信体系 完全完美信息动态博弈
下载PDF
浅谈海萨尼的不完全信息博弈——来自迈尔森(Myerson)对海萨尼不完全信息博弈的梳理 被引量:1
15
作者 朱丹 《信息系统工程》 2020年第4期140-142,共3页
海萨尼(Harsanyi)关于"贝叶斯行为人行动下不完全信息博弈"的阐述可以说是奠基现代信息经济学的伟大著作之一。他所提出的"海萨尼转换"更是为将不完全信息静态博弈转化为完全但不完美信息动态博弈提供了分析的思路... 海萨尼(Harsanyi)关于"贝叶斯行为人行动下不完全信息博弈"的阐述可以说是奠基现代信息经济学的伟大著作之一。他所提出的"海萨尼转换"更是为将不完全信息静态博弈转化为完全但不完美信息动态博弈提供了分析的思路。有了海萨尼转换,不完全信息和不完美信息之间的区别就变得不那么重要。海萨尼转换已经成为处理不完全信息博弈的一种标准方法。 展开更多
关键词 完美信息动态博弈 一致先验 海萨尼学说
下载PDF
从信息不对称条件下的房地产市场博弈看政府的调控决策 被引量:2
16
作者 刘红军 贾玉福 陈峰云 《统计与决策》 CSSCI 北大核心 2008年第24期52-53,共2页
房地产市场的发展是一个动态变化的过程,国家政策的调控也随市场的变化而变化,文章针对房地产市场中的交易主体——开发商与购房者之间的博弈建立完全但不完美信息动态博弈模型,分析影响房地产市场健康发展的主要因素,洞悉房地产市场发... 房地产市场的发展是一个动态变化的过程,国家政策的调控也随市场的变化而变化,文章针对房地产市场中的交易主体——开发商与购房者之间的博弈建立完全但不完美信息动态博弈模型,分析影响房地产市场健康发展的主要因素,洞悉房地产市场发展的当前状态,从政府发挥调控职能的角度提出了对房地产市场健康发展的调控决策的一些建议。 展开更多
关键词 信息不对称 完美信息动态博弈 贝叶斯均衡 调控决策
下载PDF
改进深度神经网络在爱恩斯坦棋中的应用研究
17
作者 蔡彪 徐昕怡 +1 位作者 谢婷 胡洋成 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第5期108-114,共7页
爱恩斯坦棋作为一种附带随机性的完美信息博弈,其难度在于每次投掷骰子导致的结果不确定性,这增加了策略设计和局面的评估难度。针对爱恩斯坦棋的游戏规则,提出了一种改进的深度学习方法。对Alpha(go)Zero神经网络模型进行改进和设计,... 爱恩斯坦棋作为一种附带随机性的完美信息博弈,其难度在于每次投掷骰子导致的结果不确定性,这增加了策略设计和局面的评估难度。针对爱恩斯坦棋的游戏规则,提出了一种改进的深度学习方法。对Alpha(go)Zero神经网络模型进行改进和设计,使其能精确地评估各种棋盘状态,生成有效的游戏策略。通过结合改进的残差神经网络和蒙特卡洛树搜索,提取棋局特征并进行局面评估,动态生成策略和进行决策。结合强化学习,以期望胜率为准则,通过自我对弈不断优化权重,改进策略生成效果。实验结果表明:改进的深度学习方法优于全国计算机博弈大赛冠军组算法,进一步验证了深度学习方法在爱恩斯坦棋随机性完美信息博弈中的有效性和可行性。 展开更多
关键词 计算机博弈 完美信息博弈 爱恩斯坦棋 深度神经网络
下载PDF
期货市场的简单博弈分析 被引量:3
18
作者 刘慧宏 糜仲春 赵亚彬 《运筹与管理》 CSCD 2003年第5期85-88,共4页
本文是对多空双方各存在一个大户的简单期货市场进行博弈分析,讨论了大户和散户的博弈行为,得出在完全信息、不完全信息和不完美信息条件下的博弈情况及其均衡结果,以此为基础推出期货市场投资者结成联盟,成立投资基金是一种趋向。
关键词 期货市场 博弈分析 博弈均衡 完全信息博弈 不完全信息博弈 完美信息博弈 Harsanyi转换
下载PDF
期房交易中房地产开发商和业主的动态博弈 被引量:2
19
作者 易江 李先玲 《经济师》 2005年第7期29-30,共2页
中国房地产市场上期房交易频繁,开发商的诚信问题是广大消费者关注的重点。文章通过建立一个两阶段完全非完美信息博弈模型,对期房交易合同签订以后开发商和消费者的行为进行分析,并评价了政府在抑制房地产开发商不诚信行为中所起的作用。
关键词 完全非完美信息博弈 逆向归纳 房地产 期房
下载PDF
一种基于重复博弈的可容错的ad hoc网络节点合作策略 被引量:5
20
作者 谭冕 何世彪 +2 位作者 宋波 杨刚 张晖 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2016年第3期342-348,共7页
针对无线ad hoc网络中节点在数据转发阶段可能的自私行为,利用博弈理论从静态进行分析,以相邻节点对为研究对象,在重复博弈的情况下分析了针锋相对策略的脆弱性,提出了一种改进的针锋相对策略,在理论上证明了改进策略的激励性。改进策... 针对无线ad hoc网络中节点在数据转发阶段可能的自私行为,利用博弈理论从静态进行分析,以相邻节点对为研究对象,在重复博弈的情况下分析了针锋相对策略的脆弱性,提出了一种改进的针锋相对策略,在理论上证明了改进策略的激励性。改进策略可以容忍一定程度的网络故障,并在故障发生后使节点重新回到合作状态。仿真结果证明,改进策略对网络故障的容忍度较好,有效地促使节点合作,得到较高的网络收益,同时也降低了自私节点的收益。 展开更多
关键词 无线AD HOC网络 完美信息博弈 针锋相对 自私节点 网络故障
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部