-
题名基于Bayesian学习的适应性优化协商模型
被引量:5
- 1
-
-
作者
侯薇
董红斌
印桂生
-
机构
哈尔滨工程大学计算机科学与技术学院
东北农业大学电气与信息学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2014年第4期721-730,共10页
-
基金
国家自然科学基金项目(60973075
61272186)
工信部基础科研计划基金项目(B0720110002)
-
文摘
在复杂的自动协商环境中,设计能够处理不完全信息和动态情形的协商agent有效学习机制正成为具有挑战性的议题.提出了一种基于Bayesian学习的时间依赖的双边多议题协商优化模型(BLMSEAN).通过只观察对手的历史报价,将Bayesian学习和基于混合策略的演化算法相结合,所提模型使得协商agent能够对于对手协商参数的概率分布有更精确的估计(如期限、保留报价和议题权重等),能够适应性地调整让步策略使协商双方都受益,提高了协商的成功率和效用.通过实验可以显示所提的模型学习对手私有信息和适应性调整让步策略的有效性.
-
关键词
自动协商
让步策略
bayesian学习
回归分析
演化算法
-
Keywords
automated negotiation
concession strategy
bayesian learning
regression analysis
evolutionary algorithm
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于TD3算法的自动协商策略
- 2
-
-
作者
陈佐明
詹捷宇
-
机构
华南师范大学计算机学院
-
出处
《计算机系统应用》
2023年第3期15-24,共10页
-
基金
国家自然科学基金青年基金(62006085)。
-
文摘
协商是人们就某些议题进行交流寻求一致协议的过程.而自动协商旨在通过协商智能体的使用降低协商成本、提高协商效率并且优化协商结果.近年来深度强化学习技术开始被运用于自动协商领域并取得了良好的效果,然而依然存在智能体训练时间较长、特定协商领域依赖、协商信息利用不充分等问题.为此,本文提出了一种基于TD3深度强化学习算法的协商策略,通过预训练降低训练过程的探索成本,通过优化状态和动作定义提高协商策略的鲁棒性从而适应不同的协商场景,通过多头语义神经网络和对手偏好预测模块充分利用协商的交互信息.实验结果表明,该策略在不同协商环境下都可以很好地完成协商任务.
-
关键词
自动协商
协商策略
深度强化学习
TD3算法
偏好预测
-
Keywords
automated negotiation
negotiation strategy
deep reinforcement learning
TD3 algorithm
preference prediction
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于偏好的双边多议题协商优化
被引量:3
- 3
-
-
作者
王永强
刘胜全
曹冠平
-
机构
新疆大学信息科学与工程学院
新疆大学现代教育技术中心
-
出处
《计算机应用与软件》
CSCD
北大核心
2012年第3期175-178,共4页
-
基金
新疆维吾尔自治区科技攻关项目(200931103)
-
文摘
提出一种优化的自动协商模型。Agent在信知不完全的情况下通过学习交互历史和在线协商信息获取对手的偏好,结合贝叶斯方法和支持向量机学习对手偏好,基于保留值和权重提出一种决策模型。通过实验比较和分析,该模型能有效降低协商次数,提高协商双方的联合效用。在信息保密和先验知识未知的环境下,该模型仍然表现出了较高的效用和效率。
-
关键词
自治协商
偏好
协商策略
贝叶斯学习
jade
-
Keywords
automated negotiation preference negotiation strategy bayesian learning jade
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-