摘要
文章在分析国内外研究成果的基础上,引入收益函数r(i,j)和持续时间函数τ(i,j)对重复博弈的模型Γ(r,τ)进行论述,并结合不确定决策分析方法和算例对重复博弈的响应策略进行了分析。探讨了在未知局中人P_2策略的情况下P_1的最佳响应策略。结果表明,局中人P_1的行动策略X对P_2的行动策略Y的最佳响应策略为X~*(y)=argmaxρ(x,y)。
出处
《统计与决策》
CSSCI
北大核心
2015年第20期19-22,共4页
Statistics & Decision
基金
国家自然科学基金面上项目(71372061)
湖南省自然科学基金资助项目(14JJ2017)