期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
改进的DDPG对话策略优化算法
被引量:
2
1
作者
赵崟江
李艳玲
林民
《计算机工程与设计》
北大核心
2021年第2期411-418,共8页
针对任务型对话系统缺少大规模真实训练数据的问题,提出一种结合规划的离散深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法来优化对话策略。在代理方面,改进经典DDPG训练算法中actor网络的输出结构和损失函数,使其...
针对任务型对话系统缺少大规模真实训练数据的问题,提出一种结合规划的离散深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法来优化对话策略。在代理方面,改进经典DDPG训练算法中actor网络的输出结构和损失函数,使其适用于离散动作空间任务;在环境方面,引入一个环境模型(又称世界模型)来模拟真实用户提问;在整个训练过程中,代理分别与用户模拟器和世界模型交互,结合规划交替使用真实用户经验和模拟用户经验,改进对话策略。实验结果表明,该方法能够加快模型的收敛速度,提升任务成功率。
展开更多
关键词
对话策略优化
代理
DDPG算法
世界模型
用户模拟器
规划
下载PDF
职称材料
基于小样本机器学习的跨任务对话系统
被引量:
4
2
作者
刘继明
孟亚磊
万晓榆
《重庆邮电大学学报(自然科学版)》
CSCD
北大核心
2019年第3期299-304,共6页
对话系统效果主要取决于自然语言理解与对话管理组件的表现。在构建特定领域的对话系统时,标注数据和语料不足、面临多轮对话中不合作对话的干扰,而且很难将一个构建完的系统扩展到新的领域。在少量特定领域样本的基础上,将来自机器翻...
对话系统效果主要取决于自然语言理解与对话管理组件的表现。在构建特定领域的对话系统时,标注数据和语料不足、面临多轮对话中不合作对话的干扰,而且很难将一个构建完的系统扩展到新的领域。在少量特定领域样本的基础上,将来自机器翻译模型的双向编码表征预训练模型应用到意图识别模块,在对话管理组件提出了基于神经图灵机的循环嵌入对话策略,使系统具备了更强的特征抽取能力,并初步具备了跨任务对话能力。该对话策略通过神经图灵机对历史对话和系统行为给予了特别关注,在用户和系统记忆中使用了不同的注意力机制,有效地学习了对话状态与系统行为的向量嵌入。实验结果表明,在样本不足的垂直领域对话测试中更好地完成了意图识别与槽位填充,基本避免不合作对话导致的对话状态错乱,同时能够将学到的对话控制策略迁移到另一领域。
展开更多
关键词
人工智能
自然语言处理
对话
系统
对话策略优化
下载PDF
职称材料
题名
改进的DDPG对话策略优化算法
被引量:
2
1
作者
赵崟江
李艳玲
林民
机构
内蒙古师范大学计算机科学技术学院
出处
《计算机工程与设计》
北大核心
2021年第2期411-418,共8页
基金
国家自然科学基金项目(61562068、61806103)
内蒙古自然科学基金项目(2017MS0607)
内蒙古民委蒙古文信息化专项扶持子基金项目(MW-2014-MGYWXXH-01)。
文摘
针对任务型对话系统缺少大规模真实训练数据的问题,提出一种结合规划的离散深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法来优化对话策略。在代理方面,改进经典DDPG训练算法中actor网络的输出结构和损失函数,使其适用于离散动作空间任务;在环境方面,引入一个环境模型(又称世界模型)来模拟真实用户提问;在整个训练过程中,代理分别与用户模拟器和世界模型交互,结合规划交替使用真实用户经验和模拟用户经验,改进对话策略。实验结果表明,该方法能够加快模型的收敛速度,提升任务成功率。
关键词
对话策略优化
代理
DDPG算法
世界模型
用户模拟器
规划
Keywords
dialogue strategy optimization
agent
DDPG algorithm
world model
user simulator
planning
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于小样本机器学习的跨任务对话系统
被引量:
4
2
作者
刘继明
孟亚磊
万晓榆
机构
网经科技(苏州)有限公司
重庆邮电大学经济管理学院
出处
《重庆邮电大学学报(自然科学版)》
CSCD
北大核心
2019年第3期299-304,共6页
文摘
对话系统效果主要取决于自然语言理解与对话管理组件的表现。在构建特定领域的对话系统时,标注数据和语料不足、面临多轮对话中不合作对话的干扰,而且很难将一个构建完的系统扩展到新的领域。在少量特定领域样本的基础上,将来自机器翻译模型的双向编码表征预训练模型应用到意图识别模块,在对话管理组件提出了基于神经图灵机的循环嵌入对话策略,使系统具备了更强的特征抽取能力,并初步具备了跨任务对话能力。该对话策略通过神经图灵机对历史对话和系统行为给予了特别关注,在用户和系统记忆中使用了不同的注意力机制,有效地学习了对话状态与系统行为的向量嵌入。实验结果表明,在样本不足的垂直领域对话测试中更好地完成了意图识别与槽位填充,基本避免不合作对话导致的对话状态错乱,同时能够将学到的对话控制策略迁移到另一领域。
关键词
人工智能
自然语言处理
对话
系统
对话策略优化
Keywords
artificial intelligence
natural language processing
dialog system
dialogue strategy optimization
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
改进的DDPG对话策略优化算法
赵崟江
李艳玲
林民
《计算机工程与设计》
北大核心
2021
2
下载PDF
职称材料
2
基于小样本机器学习的跨任务对话系统
刘继明
孟亚磊
万晓榆
《重庆邮电大学学报(自然科学版)》
CSCD
北大核心
2019
4
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部