-
题名基于深度学习的回复类型预测聊天机器人
- 1
-
-
作者
徐畅
周志平
赵卫东
-
机构
同济大学电子与信息工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2020年第S01期213-214,206,共3页
-
基金
国家重点研发计划资助项目(2017YFB1401600)
-
文摘
聊天机器人分为很多种,在深度学习越来越火热的当下,生成式聊天机器人通常是Seq2Seq(sequence-tosequence)模型进行训练,通过神经网络将输入数据编码成隐藏层向量并进行解码。尽管深度学习生成式模型的学习能力很强,但是对于很对具体需要切合场景需求的工作条件下,该模型常常获得的回复不够切合具体实际任务需求,因此首先对具体要执行的任务进行了有监督分类,再将分类结果加入到聊天机器人模型中进行监督训练,同时对于原始sequence-to-sequence模型进行了预训练判别器添加来进行模型优化。实验表明,对于加入了分类结果的监督训练和增添预训练判别器的模型能有效提升模型回复质量,在BELU得分上提升了约0.0116。
-
关键词
聊天机器人
深度生成模型
文本分类预测器
-
分类号
TP242
[自动化与计算机技术—检测技术与自动化装置]
TP18
[自动化与计算机技术—控制理论与控制工程]
-