期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于信任和K臂赌博机问题选择多问题协商对象 被引量:14
1
作者 王黎明 黄厚宽 柴玉梅 《软件学报》 EI CSCD 北大核心 2006年第12期2537-2546,共10页
Agent之间的多问题协商(multi-issuenegotiation)是一个复杂的动态交互过程.解决协商之前的对象选择问题在电子商务中有着重要的应用价值.为了提高多问题协商的准确性和购物Agent的效用,主要解决协商前的销售Agent的选择问题.为了充分... Agent之间的多问题协商(multi-issuenegotiation)是一个复杂的动态交互过程.解决协商之前的对象选择问题在电子商务中有着重要的应用价值.为了提高多问题协商的准确性和购物Agent的效用,主要解决协商前的销售Agent的选择问题.为了充分利用协商历史,实现探索(exploration)和利用(exploitation)的折衷,把销售Agent的选择问题转变成K臂赌博机问题(K-armedbanditproblem)来求解.提出了信任和声誉的度量模型,结合K臂赌博机问题的求解技术,采用学习机制,提出了几个确定奖励分布的改进算法.最后,以模拟协商过程为基础,将改进算法、信任和声誉有机地结合起来,提高了选择销售Agent的准确性和实用性.几个实验都说明了该工作在应用中的有效性. 展开更多
关键词 AGENT 协商水臂赌博机问题 信任 声誉 效用
下载PDF
基于鲁棒Restless Bandits模型的多水下自主航行器任务分配策略 被引量:2
2
作者 李鑫滨 章寿涛 +1 位作者 闫磊 韩松 《计算机应用》 CSCD 北大核心 2019年第10期2795-2801,共7页
针对水下监测网络中多自主航行器(AUV)协同信息采集任务分配问题进行了研究。首先,为了同时考虑系统中目标传感器的节点状态与声学信道状态对AUV任务分配问题的影响,构建了水声监测网络系统的综合模型;其次,针对水下存在的多未知干扰因... 针对水下监测网络中多自主航行器(AUV)协同信息采集任务分配问题进行了研究。首先,为了同时考虑系统中目标传感器的节点状态与声学信道状态对AUV任务分配问题的影响,构建了水声监测网络系统的综合模型;其次,针对水下存在的多未知干扰因素并考虑了模型产生不精确的情况,基于强化学习理论将多AUV任务分配系统建模为鲁棒无休止赌博机问题(RBP)。最后,提出鲁棒Whittle算法求解所建立的RBP,从而求解得出多AUV的任务分配策略。仿真结果表明,在干扰环境下与未考虑干扰因素的分配策略相比,在系统分别选择1、2、3个目标时,鲁棒AUV分配策略对应的系统累计回报值参数的性能分别提升了5.5%、12.3%和9.6%,验证了所提方法的有效性。 展开更多
关键词 水声监测网络 水下自主航行器任务分配 鲁棒控制 不确定模型 无休止赌博机问题
下载PDF
最佳的分类器链局部检测与挖掘算法
3
作者 李哲 周油胜 +1 位作者 龙洋 黄益华 《计算机工程与设计》 北大核心 2017年第11期3056-3060,3079,共6页
为在先验信息不足以及数据动态变化时,从大数据中检测各种概念并提取有用的信息,提出一种局部检测与挖掘算法,构建最佳分类器链。采用多臂赌博机对分类器进行学习,构建的分类器在运行时不需要通过分布式局部分类器中央单元进行任何信息... 为在先验信息不足以及数据动态变化时,从大数据中检测各种概念并提取有用的信息,提出一种局部检测与挖掘算法,构建最佳分类器链。采用多臂赌博机对分类器进行学习,构建的分类器在运行时不需要通过分布式局部分类器中央单元进行任何信息的交换,只需反馈有限的挖掘效果,确保最佳分类器链的学习;无需任何先验信息,学习的后悔值随分类函数个数的增加呈线性增长。数值模拟实验结果表明,与经典相关方法相比,该方法在分类器数量增加时性能更优,收敛速度更快。 展开更多
关键词 分类器链 检测与挖掘 赌博机问题 后悔值 局部学习算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部