期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于Expectimax搜索与Double DQN的非完备信息博弈算法 被引量:7
1
作者 雷捷维 王嘉旸 +2 位作者 任航 闫天伟 黄伟 《计算机工程》 CAS CSCD 北大核心 2021年第3期304-310,320,共8页
麻将作为典型的非完备信息博弈游戏主要通过传统Expectimax搜索算法实现,其剪枝策略与估值函数基于人工先验知识设计,存在假设不合理等问题。提出一种结合Expectimax搜索与Double DQN强化学习算法的非完备信息博弈算法。在Expectimax搜... 麻将作为典型的非完备信息博弈游戏主要通过传统Expectimax搜索算法实现,其剪枝策略与估值函数基于人工先验知识设计,存在假设不合理等问题。提出一种结合Expectimax搜索与Double DQN强化学习算法的非完备信息博弈算法。在Expectimax搜索树扩展过程中,采用Double DQN输出的估值设计估值函数并在限定搜索层数内获得分支估值,同时设计剪枝策略对打牌动作进行排序与部分扩展实现搜索树剪枝。在Double DQN模型训练过程中,将麻将信息编码为特征数据输入神经网络获得估值,使用Expectimax搜索算法得到最优动作以改进探索策略。实验结果表明,与Expectimax搜索算法、Double DQN算法等监督学习算法相比,该算法在麻将游戏上胜率与得分更高,具有更优异的博弈性能。 展开更多
关键词 double DQN算法 Expectimax搜索 非完备信息博弈 麻将 强化学习
下载PDF
完全开放的双边电力市场中供需双方叫价拍卖的贝叶斯博弈模型 被引量:25
2
作者 方德斌 王先甲 +3 位作者 张玉新 刘坤 王平 朱中云 《电网技术》 EI CSCD 北大核心 2003年第12期1-5,共5页
随着我国进行电力体制改革和建立发电侧竞争市场,需求方很快也会引入竞争,并建立完全开放的双边电力市场。研究供给侧和需求侧如何建立有效的报价策略具有十分重要的理论和实践价值。作者将所有发电公司看成供给方,把所有买电代理商看... 随着我国进行电力体制改革和建立发电侧竞争市场,需求方很快也会引入竞争,并建立完全开放的双边电力市场。研究供给侧和需求侧如何建立有效的报价策略具有十分重要的理论和实践价值。作者将所有发电公司看成供给方,把所有买电代理商看成需求方,将供给方和需求方的报价问题看成是他们向市场的投标问题,并根据市场确定的规则,总需求电量将在某一价格下完成交易,因而它是供给方和需求方的双方叫价拍卖问题。通过对双方叫价拍卖的交易规则进行描述,针对供给方的生产成本和需求方的估价是私有信息的情况,建立了完全开放的双边电力市场中供给和需求双方叫价拍卖的不完全信息贝叶斯博弈模型,并求解贝叶斯纳什均衡,给出供给方和需求方的均衡报价策略。 展开更多
关键词 电力工业 市场化改革 电力体制改革 电力市场 拍卖 贝叶斯博弈模型 发电侧竞争市场 报价策略
下载PDF
基于双向拍卖机制的供应链回购契约研究 被引量:13
3
作者 姚珣 唐小我 潘景铭 《管理学报》 CSSCI 2009年第11期1444-1448,共5页
在非对称信息下,对报童问题进行了一定的拓展,并应用静态贝叶斯博弈的方法刻画了供应链中双方的价格制定过程;给出交易双方的线性策略空间,并从供应链利润最大化的角度,运用回购契约,实现供应链的协调。
关键词 供应链协调 不完全信息静态博弈 双向拍卖机制 静态贝叶斯博弈 回购契约
下载PDF
在线双向拍卖中的不完全信息博弈仿真研究 被引量:6
4
作者 付静 邵培基 杨小平 《管理学报》 2006年第6期673-676,682,共5页
双向拍卖机制能较好地解决在线拍卖中如何有效利用网络资源、减轻网络负荷的问题,而构造双向拍卖的报价模型和策略是其重要内容之一。从实验经济学方法的角度,构造了在线双向拍卖中不完全信息博弈下存在的贝叶斯—纳什均衡并求解,通过... 双向拍卖机制能较好地解决在线拍卖中如何有效利用网络资源、减轻网络负荷的问题,而构造双向拍卖的报价模型和策略是其重要内容之一。从实验经济学方法的角度,构造了在线双向拍卖中不完全信息博弈下存在的贝叶斯—纳什均衡并求解,通过计算机仿真详细分析了该模型的特点和可行性,为高效利用网络资源、提高在线拍卖效率提供了可行的思路。 展开更多
关键词 在线双向拍卖 不完全信息博弈 贝叶斯-纳什均衡 仿真
下载PDF
非正式契约与正式契约交互关系研究——基于随机匹配博弈的分析 被引量:22
5
作者 吴德胜 李维安 《管理科学学报》 CSSCI 北大核心 2010年第12期76-85,共10页
在商业交易中,正式契约安排与非正式契约安排往往是同时使用的,对这两类契约交互作用的分析是契约理论研究的一个新领域.运用随机匹配博弈建立一个契约成本影响契约选择和契约交互关系的模型,将契约交互关系研究从双边重复博弈框架扩展... 在商业交易中,正式契约安排与非正式契约安排往往是同时使用的,对这两类契约交互作用的分析是契约理论研究的一个新领域.运用随机匹配博弈建立一个契约成本影响契约选择和契约交互关系的模型,将契约交互关系研究从双边重复博弈框架扩展到随机匹配博弈框架下,从而可用其来分析非频繁交易.结论是:当契约成本较低时,正式契约的引入替代了非正式契约;当契约成本处于中间水平时,正式契约补充了非正式契约;当契约成本很高时,正式契约的引入不影响交易方对非正式契约的选择.最后,运用上述模型分析了网上拍卖中第三方执行中介的介入对契约交互关系的影响. 展开更多
关键词 随机匹配博弈 正式契约 非正式契约 契约成本 网上拍卖
下载PDF
不完全信息下发电企业竞价的贝叶斯博弈模型研究 被引量:1
6
作者 杨珊珊 王宇奇 《科技与管理》 2014年第5期71-74,83,共5页
电力工业改革在发电领域引入竞争,目的在于提高电力生产效率,促进电力工业的发展。发电企业竞价是一个不完全信息下的静态博弈问题,在深入分析不完全信息市场环境下发电企业竞价过程的基础上,运用博弈论中的暗标拍卖原理构建发电企业竞... 电力工业改革在发电领域引入竞争,目的在于提高电力生产效率,促进电力工业的发展。发电企业竞价是一个不完全信息下的静态博弈问题,在深入分析不完全信息市场环境下发电企业竞价过程的基础上,运用博弈论中的暗标拍卖原理构建发电企业竞价的暗标拍卖贝叶斯博弈模型,并通过求解贝叶斯纳什均衡得出发电企业的最优竞价模型,从而为发电企业建立有效的竞价策略提供决策参考。 展开更多
关键词 发电企业 不完全信息 暗标拍卖 贝叶斯博弈模型
下载PDF
突发公共卫生事件网络谣言网格化预警模型研究 被引量:1
7
作者 张桂蓉 董志香 夏霆 《中国管理科学》 CSCD 北大核心 2024年第2期298-306,共9页
为提高现阶段网络谣言预警效率和可靠性,建立突发公共卫生事件网络谣言网格化预警模型。首先,量化网络谣言基础特征,运用灰色加权关联度分析法,纵向识别网络谣言对受众个体的迷惑性程度;其次,基于不完全信息动态博弈,结合仿真,横向预测... 为提高现阶段网络谣言预警效率和可靠性,建立突发公共卫生事件网络谣言网格化预警模型。首先,量化网络谣言基础特征,运用灰色加权关联度分析法,纵向识别网络谣言对受众个体的迷惑性程度;其次,基于不完全信息动态博弈,结合仿真,横向预测网络谣言在受众群体中的流传广度;最后,综合纵横两个维度的评估结果,界定网络谣言的整体社会影响力,依据该模型预警网络谣言等级,提出网络谣言分级应急管控策略。以“双黄连可预防新型冠状病毒”的网络谣言为例,验证网络谣言网格化预警模型及其扼止策略的有效性,可为公共部门分级分步管控网络谣言提供信息支撑和决策支持。 展开更多
关键词 突发公共卫生事件 网络谣言 预警模型 灰色加权关联度 不完全信息动态博弈
原文传递
不完全信息下的价格信号博弈:来自淘宝网的证据 被引量:16
8
作者 周耿 《当代财经》 CSSCI 北大核心 2014年第4期14-23,共10页
利用淘宝网的交易数据,对网上购物过程进行两阶段分解,证实了我国网上交易市场的价格信号博弈收敛于分离均衡。这表明价格在信息不确定的环境下代理了商品的质量信息,对需求有着正面的影响。这种正面影响主要发生在购物初级搜索阶段,而... 利用淘宝网的交易数据,对网上购物过程进行两阶段分解,证实了我国网上交易市场的价格信号博弈收敛于分离均衡。这表明价格在信息不确定的环境下代理了商品的质量信息,对需求有着正面的影响。这种正面影响主要发生在购物初级搜索阶段,而在最终决策阶段,需求法则仍然有效,从而导致价格对需求的总体影响是负面的。区别于拍卖市场直接提高价格的机制,信誉在明码标价市场能间接促进产品的销售,强化价格的信号传递,而羊群效应对价格的信号传递有一定的削弱作用。 展开更多
关键词 不完全信息 信号博弈 两阶段决策 网上购物 淘宝网
原文传递
双支柱调控框架视域下多国政策国际协调研究 被引量:2
9
作者 严佳佳 许莉莉 《经济学动态》 CSSCI 北大核心 2021年第3期113-125,共13页
多国政策国际协调是维护全球经济稳定和金融安全的必然要求,也是构建更加开放、团结、普惠性全球经济金融系统的客观要求。本文以双支柱调控框架为切入点,创新性地突破货币政策与宏观审慎政策的独立分析边界,通过构建一个嵌套着两国不... 多国政策国际协调是维护全球经济稳定和金融安全的必然要求,也是构建更加开放、团结、普惠性全球经济金融系统的客观要求。本文以双支柱调控框架为切入点,创新性地突破货币政策与宏观审慎政策的独立分析边界,通过构建一个嵌套着两国不完全信息静态博弈模型的三国不完全信息动态博弈,以及结合2013年之后美国退出量化宽松货币政策与采取紧缩性宏观审慎政策引发的国际协调经典案例,论证了只有主导国、中间国和追随国共同实行对称性国际协调才能实现共赢协调解。基于此,本文亦探讨双支柱调控框架视域下多国政策国际协调的政策建议。 展开更多
关键词 国际协调 双支柱调控框架 不完全信息动态模型
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部