面向任务型对话机器人的多任务联合模型研究被引量：1

Research on Multi-task Jointing Model for Task Chat Robot

下载PDF

导出

摘要在任务型对话机器人的搭建过程中,一般需要执行多个自然语言处理的子任务。目前传统的训练方式是将每个子任务独立训练后再进行整合,这样忽视了不同子任务之间的关联性,限制了模型的预测能力。现提出一种Joint-RoBERTa-WWM-of-Theseus压缩联合模型,一方面通过多任务联合学习训练的方式对意图识别、行业识别和语义槽填充3个子任务进行联合训练,并在多分类的子任务中引入Focal loss机制来解决数据分布不平衡的问题;另一方面,模型通过Theseus方法进行压缩,在略微损失精度的前提下,大幅提高模型预测速度,提高模型在生产环境中的实时性与实用性。 In the process of building a task-oriented chatbot,it is generally necessary to execute several subtasks of Natural Language Processing.And the traditional training method is to integrate each subtask after training independently,which will ignore the relevance between different subtasks and limit the predictive power of the model.This paper proposes a compressed jointed model,i.e.,Joint-RoBERTa-WWM-of-Theseus.On the one hand,intention classification,domain classification and semantic slot filling are jointly trained through multi-task joint learning and training.And the focal loss mechanism is introduced to the multi-class classification subtask to solve the problem of data distribution imbalance.On the other hand,the model is compressed by means of Theseus compression method,which greatly improves the prediction speed of the model and improves the applicability and the real-time in the production environment with a slight loss of accuracy.

作者高作缘陶宏才 GAO Zuoyuan;TAO Hongcai(School of Computing&Artificial Intelligence,Southwest Jiaotong University,Chengdu 611756,China)

机构地区西南交通大学计算机与人工智能学院

出处《成都信息工程大学学报》 2023年第3期251-257,共7页 Journal of Chengdu University of Information Technology

基金国家自然科学基金资助项目(61806170)。

关键词 RoBERTa-WWM模型多任务联合学习 Theseus压缩 Focal loss RoBERTa-WWM model multi-task joint learning Theseus compression Focal loss

分类号 TP391.12 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1于丹,闫晓宇,王艳秋,来关军,肖鹏,王宇.任务型对话机器人的设计及其应用[J].软件工程,2021,24(2):55-59. 被引量：11
2柏兵,侯霞,石松.基于CRF和BI-LSTM的命名实体识别方法[J].北京信息科技大学学报（自然科学版）,2018,33(6):27-33. 被引量：16
3赵京胜,宋梦雪,高祥.自然语言处理发展及应用综述[J].信息技术与信息化,2019(7):142-145. 被引量：77
4俞凯,陈露,陈博,孙锴,朱苏.任务型人机对话系统中的认知技术——概念、进展及其未来[J].计算机学报,2015,38(12):2333-2348. 被引量：39
5陈龙,孙泽健.面向任务的对话系统现状研究[J].电子技术与软件工程,2017(23):172-173. 被引量：3

二级参考文献113

1黄波,刘传才.基于加权TextRank的中文自动文本摘要[J].计算机应用研究,2020,37(2):407-410. 被引量：21
2余伶俐,蔡自兴,陈明义.语音信号的情感特征分析与识别研究综述[J].电路与系统学报,2007,12(4):76-84. 被引量：27
3董士海,王横.人机交互.北京:北京大学出版社,2003.
4Dahland G E, Yu Dong, Deng u, Acero A. Context?dependent pre- trained deep neural networks for large?vocabulary speech recognition. IEEE Transactions on Audio, Speech & Language Processing, 2012, 200): 30-42.
5Federico M, Bertoldi N, Cettolo M. Irstlm , An open source toolkit for handling large scale language models/ /Proceedings of the Annual Conference of the International Speech Communication Association (Interopeech), Brisbane, Australia, 2008: 1618-1621.
6Mohri M, Pereira F, Riley M. Weighted finite-state trans?ducers in speech recognition. Computer Speech &. Language, 2002, 16(1): 69-88.
7Senior A, Lei Xin. Fine context, low-rank, softplus deep neural networks for mobile speech recognition/ /Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal ProcessingCICASSP). Florence, Italy, 2014.
8Zen Hei-Ga, Tokuda K, Black A W. Statistical parametric speech synthesis. Speech Communication, 2009, 51(11): 1039-1064.
9WU Y J, Wang R H. Minimum generation error training for hmm-based speech synthesis/ /Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing (lCASSP). Toulouse, France, 2006.
10Yu K, Young S. Continuous FO modelling for HMM based statistical speech synthesis. IEEE Transactions on Audio, Speech and Language Processing, 2011,19(5): 1071-1079.

共引文献141

1彭骁男,周兰江,张建安,周枫.融合多特征的老挝语人名地名命名实体识别[J].中国水运（下半月）,2020,20(3):74-77. 被引量：1
2何宇虹,黄沛杰,杜泽峰,刘威,朱建恺,章锦川.结合特殊领域实体识别的远监督话语领域分类[J].中文信息学报,2020(5):10-18. 被引量：1
3王卫红,冯倩,吕红燕,曹玉辉.基于Seq2Seq模型的命名实体识别方法[J].智能计算机与应用,2020(7):141-146.
4苏晓红.建立统一的国债回购市场[J].金融理论与实践,2000(3):18-19.
5庞亮,兰艳艳,徐君,郭嘉丰,万圣贤,程学旗.深度文本匹配综述[J].计算机学报,2017,40(4):985-1003. 被引量：65
6付祥,陈汉君.安防领域人机交互技术发展研究[J].科技创新与应用,2017,7(14):85-85.
7李京忠,唐燕,王苹.国家医师资格考试人机对话系统的安全性研究[J].中国医药导报,2017,14(13):132-135. 被引量：2
8任宗强,刘冉.人机交互模式下企业知识管理平台研究[J].技术与创新管理,2017,38(5):526-529. 被引量：4
9赵博轩,房宁,赵群飞,张朋柱.利用拼音特征的深度学习文本分类模型[J].高技术通讯,2017,27(7):596-603. 被引量：8
10王秋惠,张一凡,刘力蒙.老龄服务机器人人机界面设计研究进展[J].机械设计,2018,35(9):105-113. 被引量：21

同被引文献6

1马骋乾,谢伟,孙伟杰.强化学习研究综述[J].指挥控制与仿真,2018,40(6):68-72. 被引量：41
2王堃,林民,李艳玲.端到端对话系统意图语义槽联合识别研究综述[J].计算机工程与应用,2020,56(14):14-25. 被引量：14
3叶铱雷,曹斌,范菁,王俊,陈江斌.面向任务型多轮对话的粗粒度意图识别方法[J].小型微型计算机系统,2020,41(8):1620-1626. 被引量：10
4赵阳洋,王振宇,王佩,杨添,张睿,尹凯.任务型对话系统研究综述[J].计算机学报,2020,43(10):1862-1896. 被引量：43
5于丹,闫晓宇,王艳秋,来关军,肖鹏,王宇.任务型对话机器人的设计及其应用[J].软件工程,2021,24(2):55-59. 被引量：11
6王明虎,石智奎,苏佳,张新生.基于RoBERTa和图增强Transformer的序列推荐方法[J].计算机工程,2024,50(4):121-131. 被引量：2

引证文献1

1李昱珩,朱彦霞.基于监督学习与深度强化学习的任务型对话模型设计与实现[J].河南科技,2024,51(6):20-24.

1薛颖萍.忒修斯之船[J].健康之友,2021(23):30-31.
2日本开发小型盾构常压机械换刀技术[J].隧道建设（中英文）,2021,41(4):578-578.
3资讯快递[J].时尚北京,2023(6):142-142.
4鲍轶欣.找准机关事务工作的特色[J].中国机关后勤,2023(1):30-32.
5马志程,李丹,张宝龙.基于改进Mask R-CNN的光学元件划痕缺陷检测研究[J].电子测量与仪器学报,2023,37(4):231-239. 被引量：5
6张潮,宋亚林,袁明阳.基于MultiResUNet-SMIS的皮肤黑色素瘤图像分割[J].计算机系统应用,2023,32(6):221-230. 被引量：1
7Brett Z.Fite,James Wang,Pejman Ghanouni,Katherine W.Ferrara.A Review of Imaging Methods to Assess Ultrasound-Mediated Ablation[J].Biomedical Engineering Frontiers,2022,3(1):171-187. 被引量：1
8罗会兰,叶桔.联合语义分割和深度估计的多任务学习研究[J].计算机科学,2023,50(S01):171-180.
9姚珺.基于GAN的多变量时间序列异常检测方法[J].安庆师范大学学报（自然科学版）,2023,29(2):68-74.
10Hedyeh Bagherzadeh,Qinglei Meng,Hanbing Lu,Elliott Hong,Yihong Yang,Fow-Sen Choa.High-Performance Magnetic-core Coils for Targeted Rodent Brain Stimulations[J].Biomedical Engineering Frontiers,2022,3(1):82-92.

成都信息工程大学学报

2023年第3期

浏览历史

内容加载中请稍等...

面向任务型对话机器人的多任务联合模型研究被引量：1

参考文献5

二级参考文献113

共引文献141

同被引文献6

引证文献1

相关作者

相关机构

相关主题

浏览历史

面向任务型对话机器人的多任务联合模型研究 被引量：1

参考文献5

二级参考文献113

共引文献141

同被引文献6

引证文献1

相关作者

相关机构

相关主题

浏览历史

面向任务型对话机器人的多任务联合模型研究被引量：1