期刊文献+

基于重复博弈的最佳响应策略分析 被引量:4

下载PDF
导出
摘要 文章在分析国内外研究成果的基础上,引入收益函数r(i,j)和持续时间函数τ(i,j)对重复博弈的模型Γ(r,τ)进行论述,并结合不确定决策分析方法和算例对重复博弈的响应策略进行了分析。探讨了在未知局中人P_2策略的情况下P_1的最佳响应策略。结果表明,局中人P_1的行动策略X对P_2的行动策略Y的最佳响应策略为X~*(y)=argmaxρ(x,y)。
出处 《统计与决策》 CSSCI 北大核心 2015年第20期19-22,共4页 Statistics & Decision
基金 国家自然科学基金面上项目(71372061) 湖南省自然科学基金资助项目(14JJ2017)
  • 相关文献

参考文献6

  • 1Hannan J. Approximation to Bayes Risk in Repeated Play [M]. In: Dresher Met al (eds) Contributions to The Theory of Games III. Princ- eton University Press, Princeton, 1957.
  • 2Auer P, Cesa-Bianchi N, Freund Y, et al. The Nonstochastic Multi- armed Bandit Problem [J]. SIAM J.Comput, 2002, 32 (1).
  • 3Fudenberg D, Levine D K. Conditional Universal Consistency [J]. Games Econ. Behav, 1999,(29).
  • 4Fudenberg D, Levine D K. An Easier Way to Calibrate. Games Econ [J]. Games Econ. Behav, 1999,(29).
  • 5于雪泳,吴超.不确定情况下的决策分析方法[J].四川兵工学报,2011,32(3):114-115. 被引量:1
  • 6Nahum-Shimkin. Regret Minimization in Repeated Matrix Games With Variable Stage Duration [J]. Games and Economic Behavior, 2008 (63).

二级参考文献1

  • 1张最良.军事运筹学[M].北京:军事科学出版社,1993.

同被引文献16

引证文献4

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部