期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
交互式检索的用户模拟器研究综述 被引量:4
1
作者 刘阳 林民 李艳玲 《计算机工程与应用》 CSCD 北大核心 2020年第10期1-9,共9页
随着检索技术的发展,交互式检索在信息检索领域中变得尤为重要。交互式检索在传统检索模式下增加了捕捉用户细粒度行为的功能,以便通过用户模拟器提升检索引擎性能。基于规则的用户模拟器缺乏个性化用户特征,适应性较差。基于模型的用... 随着检索技术的发展,交互式检索在信息检索领域中变得尤为重要。交互式检索在传统检索模式下增加了捕捉用户细粒度行为的功能,以便通过用户模拟器提升检索引擎性能。基于规则的用户模拟器缺乏个性化用户特征,适应性较差。基于模型的用户模拟器能够学习到更多的用户个性化行为特征,可以有效提升交互式检索引擎的性能。阐述了用户模拟器与检索引擎的交互过程,对基于规则的用户模拟器和基于模型的用户模拟器的构建方法以及近年来用户模拟器的评价方法进行了归纳总结,并重点介绍了基于模型的用户模拟器。最后对比了面向交互式检索的用户模拟器和传统的用户模拟器的差异,并以交互式学位论文检索场景为例,通过此检索场景对用户模拟器的应用进行了展望。 展开更多
关键词 用户模拟器 交互式检索 强化学习 人工智能 用户个性化特征
下载PDF
改进判别式深度Dyna-Q的任务对话策略学习方法 被引量:1
2
作者 戴彬 曾碧 +1 位作者 魏鹏飞 黄永健 《广东工业大学学报》 CAS 2023年第4期9-17,23,共10页
作为任务型对话系统中的关键一环,对话策略可以通过判别式深度Dyna-Q框架训练得到。然而,该框架在直接强化学习阶段采用原始的深度Q网络方法学习对话策略,在世界模型方面采用多层感知机作为模型的基本结构,导致对话策略的训练效率、性... 作为任务型对话系统中的关键一环,对话策略可以通过判别式深度Dyna-Q框架训练得到。然而,该框架在直接强化学习阶段采用原始的深度Q网络方法学习对话策略,在世界模型方面采用多层感知机作为模型的基本结构,导致对话策略的训练效率、性能和稳定性降低。本文提出了一种改进判别式深度Dyna-Q的任务对话策略学习方法。在改进后的直接强化学习阶段,利用噪声网络改进了智能体的探索方式,同时将竞争网络的双流架构、双Q网络与n步自举法三者相结合,优化了Q值的计算过程。在世界模型方面,设计了一种基于软注意力的模型替代多层感知机结构。实验结果表明,本文提出的方法在对话成功率、平均对话轮数以及平均奖励3个指标上均优于现有的最佳结果,最后本文通过消融分析和鲁棒性分析,进一步验证了方法的有效性。 展开更多
关键词 任务型对话系统 对话策略学习 强化学习 用户模拟器
下载PDF
改进的DDPG对话策略优化算法 被引量:2
3
作者 赵崟江 李艳玲 林民 《计算机工程与设计》 北大核心 2021年第2期411-418,共8页
针对任务型对话系统缺少大规模真实训练数据的问题,提出一种结合规划的离散深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法来优化对话策略。在代理方面,改进经典DDPG训练算法中actor网络的输出结构和损失函数,使其... 针对任务型对话系统缺少大规模真实训练数据的问题,提出一种结合规划的离散深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法来优化对话策略。在代理方面,改进经典DDPG训练算法中actor网络的输出结构和损失函数,使其适用于离散动作空间任务;在环境方面,引入一个环境模型(又称世界模型)来模拟真实用户提问;在整个训练过程中,代理分别与用户模拟器和世界模型交互,结合规划交替使用真实用户经验和模拟用户经验,改进对话策略。实验结果表明,该方法能够加快模型的收敛速度,提升任务成功率。 展开更多
关键词 对话策略优化 代理 DDPG算法 世界模型 用户模拟器 规划
下载PDF
Planning Movement of a Robotic Arm for Assembly of Products
4
作者 Jose Ismael Ojeda Campana 《Journal of Mechanics Engineering and Automation》 2015年第4期257-262,共6页
This paper presents an algorithmic proposal of a movements' planner for a robotic manipulator. Its application is the planning of trajectories from wooden cuttings in a band saw. This algorithm is based on heuristics... This paper presents an algorithmic proposal of a movements' planner for a robotic manipulator. Its application is the planning of trajectories from wooden cuttings in a band saw. This algorithm is based on heuristics. A simulator was developed in order to allow the user to define the table's shape and figure that you want to trim. The simulator was developed in Java from Sun Microsystems, and next it will be applied in TM Cyberbotics Webots. 展开更多
关键词 Electronic planner robotic arm heuristics.
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部