期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于Bayesian学习的适应性优化协商模型 被引量:5
1
作者 侯薇 董红斌 印桂生 《计算机研究与发展》 EI CSCD 北大核心 2014年第4期721-730,共10页
在复杂的自动协商环境中,设计能够处理不完全信息和动态情形的协商agent有效学习机制正成为具有挑战性的议题.提出了一种基于Bayesian学习的时间依赖的双边多议题协商优化模型(BLMSEAN).通过只观察对手的历史报价,将Bayesian学习和基于... 在复杂的自动协商环境中,设计能够处理不完全信息和动态情形的协商agent有效学习机制正成为具有挑战性的议题.提出了一种基于Bayesian学习的时间依赖的双边多议题协商优化模型(BLMSEAN).通过只观察对手的历史报价,将Bayesian学习和基于混合策略的演化算法相结合,所提模型使得协商agent能够对于对手协商参数的概率分布有更精确的估计(如期限、保留报价和议题权重等),能够适应性地调整让步策略使协商双方都受益,提高了协商的成功率和效用.通过实验可以显示所提的模型学习对手私有信息和适应性调整让步策略的有效性. 展开更多
关键词 自动协商 让步策略 bayesian学习 回归分析 演化算法
下载PDF
基于TD3算法的自动协商策略
2
作者 陈佐明 詹捷宇 《计算机系统应用》 2023年第3期15-24,共10页
协商是人们就某些议题进行交流寻求一致协议的过程.而自动协商旨在通过协商智能体的使用降低协商成本、提高协商效率并且优化协商结果.近年来深度强化学习技术开始被运用于自动协商领域并取得了良好的效果,然而依然存在智能体训练时间... 协商是人们就某些议题进行交流寻求一致协议的过程.而自动协商旨在通过协商智能体的使用降低协商成本、提高协商效率并且优化协商结果.近年来深度强化学习技术开始被运用于自动协商领域并取得了良好的效果,然而依然存在智能体训练时间较长、特定协商领域依赖、协商信息利用不充分等问题.为此,本文提出了一种基于TD3深度强化学习算法的协商策略,通过预训练降低训练过程的探索成本,通过优化状态和动作定义提高协商策略的鲁棒性从而适应不同的协商场景,通过多头语义神经网络和对手偏好预测模块充分利用协商的交互信息.实验结果表明,该策略在不同协商环境下都可以很好地完成协商任务. 展开更多
关键词 自动协商 协商策略 深度强化学习 TD3算法 偏好预测
下载PDF
基于偏好的双边多议题协商优化 被引量:3
3
作者 王永强 刘胜全 曹冠平 《计算机应用与软件》 CSCD 北大核心 2012年第3期175-178,共4页
提出一种优化的自动协商模型。Agent在信知不完全的情况下通过学习交互历史和在线协商信息获取对手的偏好,结合贝叶斯方法和支持向量机学习对手偏好,基于保留值和权重提出一种决策模型。通过实验比较和分析,该模型能有效降低协商次数,... 提出一种优化的自动协商模型。Agent在信知不完全的情况下通过学习交互历史和在线协商信息获取对手的偏好,结合贝叶斯方法和支持向量机学习对手偏好,基于保留值和权重提出一种决策模型。通过实验比较和分析,该模型能有效降低协商次数,提高协商双方的联合效用。在信息保密和先验知识未知的环境下,该模型仍然表现出了较高的效用和效率。 展开更多
关键词 自治协商 偏好 协商策略 贝叶斯学习 jade
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部