期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于增强学习的代理谈判模型 被引量:7
1
作者 张化祥 黄上腾 《计算机工程》 CAS CSCD 北大核心 2004年第10期137-139,共3页
利用增强学习的Q-learning理论,构造了一个基于时间信念、价格信念和状态期望Q值的代理谈判模型。将代理交互报价的过程看成代理选择报价行动,实现状态的迁移,可以计算出代理在不同状态采取行动的Q值。代理可以通过修改信念函数及时... 利用增强学习的Q-learning理论,构造了一个基于时间信念、价格信念和状态期望Q值的代理谈判模型。将代理交互报价的过程看成代理选择报价行动,实现状态的迁移,可以计算出代理在不同状态采取行动的Q值。代理可以通过修改信念函数及时间贴现率来调整报价。该文实现了谈判模型的报价算法,并从理论和实验数据两方面进行了分析比较。 展开更多
关键词 代理 增强学习 报价 时间信念 价格信念
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部