基于隐含主题协同注意力网络的领域分类方法被引量：1

Latent Topic-Enriched Co-Attention Networks for Domain Classification

下载PDF

导出

摘要基于注意力机制的神经网络模型在文本分类任务中显示出了很好的效果。然而当训练数据的规模有限,或者测试数据与训练数据的分布有较大差异时,一些有价值的信息词很难在训练中被模型捕捉到。为此,该文提出了一种新的基于协同注意力(co-attention)网络的领域分类方法。该文利用隐含主题模型学习隐含主题注意力,并将其引入到文本分类常用的双向长短时记忆网络(BiLSTM)中,与软或硬注意力(soft-or hard-attention)机制一起构成协同注意力。在中文话语领域分类基准语料SMP-ECDT上的实验结果表明,隐含主题协同注意力网络取得了显著优于注意力机制的领域分类效果,比基线注意力机制Soft att、Hard att以及单独的隐含主题注意力机制BTM att分别提高了2.85%、1.86%和1.74%的分类正确率。此外,实验结果还验证了,在额外的未标记数据上训练隐含主题,可以进一步提高该文方法的领域分类性能。 Attention-based bidirectional long short-term memory network(BiLSTM) models have recently shown promising results in text classification tasks.However, when the amount of training data is restricted, or the distribution of the test data is quite different from the training data, some potential informative words are hard to be captured in training.In this work, we propose a new method to learn co-attention for domain classification.Unlike the past attention mechanism guided only by domain tags of training data, we leveroge using the latent topics in the data set to learn topic attention mechanism, and employ it for BiLSTM.Then the co-attention is obtained by combining the topic attention and the network attention.Experiments on the SMP-ECDT benchmark corpus show that the proposed co-attention mechanism outperforms the state-of-the-art soft mechanism, hard attention mechanism and topic attention mechanism in domain classification, by 2.85%, 1.86% and 1.74% accuracy improvement, respectively.

作者黄培松黄沛杰丁健德艾文程章锦川 HUANG Peisong;HUANG Peijie;DING Jiande;AI Wencheng;ZHANG Jinchuan(College of Mathematics and Informatics,South China Agricultural University,G uangzhou,Guangdong 510642,China)

机构地区华南农业大学数学与信息学院

出处《中文信息学报》 CSCD 北大核心 2020年第2期73-79,共7页 Journal of Chinese Information Processing

基金国家自然科学基金(71472068) 广东省大学生创新训练计划(201810564094)。

关键词领域分类协同注意力隐含主题 BiLSTM domain classification co-attention latent topic BiLSTM

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1俞凯,陈露,陈博,孙锴,朱苏.任务型人机对话系统中的认知技术——概念、进展及其未来[J].计算机学报,2015,38(12):2333-2348. 被引量：39
2柯子烜,黄沛杰,曾真.基于优化“未定义”类话语检测的话语领域分类[J].中文信息学报,2018,32(4):105-113. 被引量：2

二级参考文献93

1余伶俐,蔡自兴,陈明义.语音信号的情感特征分析与识别研究综述[J].电路与系统学报,2007,12(4):76-84. 被引量：27
2董士海,王横.人机交互.北京:北京大学出版社,2003.
3Dahland G E, Yu Dong, Deng u, Acero A. Context?dependent pre- trained deep neural networks for large?vocabulary speech recognition. IEEE Transactions on Audio, Speech & Language Processing, 2012, 200): 30-42.
4Federico M, Bertoldi N, Cettolo M. Irstlm , An open source toolkit for handling large scale language models/ /Proceedings of the Annual Conference of the International Speech Communication Association (Interopeech), Brisbane, Australia, 2008: 1618-1621.
5Mohri M, Pereira F, Riley M. Weighted finite-state trans?ducers in speech recognition. Computer Speech &. Language, 2002, 16(1): 69-88.
6Senior A, Lei Xin. Fine context, low-rank, softplus deep neural networks for mobile speech recognition/ /Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal ProcessingCICASSP). Florence, Italy, 2014.
7Zen Hei-Ga, Tokuda K, Black A W. Statistical parametric speech synthesis. Speech Communication, 2009, 51(11): 1039-1064.
8WU Y J, Wang R H. Minimum generation error training for hmm-based speech synthesis/ /Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing (lCASSP). Toulouse, France, 2006.
9Yu K, Young S. Continuous FO modelling for HMM based statistical speech synthesis. IEEE Transactions on Audio, Speech and Language Processing, 2011,19(5): 1071-1079.
10Zen H, Senior A, Schuster M. Statistical parametric speech synthesis using deep neural networks/ /Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal ProcessingCICASSP). Vancouver, Canada, 2013.

共引文献38

1何宇虹,黄沛杰,杜泽峰,刘威,朱建恺,章锦川.结合特殊领域实体识别的远监督话语领域分类[J].中文信息学报,2020(5):10-18. 被引量：1
2庞亮,兰艳艳,徐君,郭嘉丰,万圣贤,程学旗.深度文本匹配综述[J].计算机学报,2017,40(4):985-1003. 被引量：65
3付祥,陈汉君.安防领域人机交互技术发展研究[J].科技创新与应用,2017,7(14):85-85.
4李京忠,唐燕,王苹.国家医师资格考试人机对话系统的安全性研究[J].中国医药导报,2017,14(13):132-135. 被引量：2
5任宗强,刘冉.人机交互模式下企业知识管理平台研究[J].技术与创新管理,2017,38(5):526-529. 被引量：4
6赵博轩,房宁,赵群飞,张朋柱.利用拼音特征的深度学习文本分类模型[J].高技术通讯,2017,27(7):596-603. 被引量：8
7王秋惠,张一凡,刘力蒙.老龄服务机器人人机界面设计研究进展[J].机械设计,2018,35(9):105-113. 被引量：21
8王小捷.关于人机对话系统的思考[J].中兴通讯技术,2017,23(4):47-50. 被引量：1
9张晶晶,黄浩,胡英,吾守尔.斯拉木.循环神经网络中基于特征融合的口语理解[J].现代电子技术,2018,41(20):157-160.
10黄寅.任务型人机对话系统开发平台研究[J].信息与电脑,2020,32(6):115-117. 被引量：3

同被引文献2

1万圣贤,兰艳艳,郭嘉丰,徐君,庞亮,程学旗.用于文本分类的局部化双向长短时记忆[J].中文信息学报,2017,31(3):62-68. 被引量：17
2汪嘉伟,杨煦晨,琚生根,袁宵,谢正文.基于卷积神经网络和自注意力机制的文本分类模型[J].四川大学学报（自然科学版）,2020,57(3):469-475. 被引量：26

引证文献1

1马子晨,张顺香,刘云朵,王星光,张友强.CCM-MF:基于多维度特征融合的中文文本分类模型[J].广西科学,2023,30(1):35-42. 被引量：1

二级引证文献1

1侯震,童惟依,邓靖飞,李扬.融合深度学习模型和上下文特征的健康话题短文本分类[J].电视技术,2023,47(7):18-23. 被引量：1

1纪泽宇,张兴军,付哲,高柏松,李靖波.分布式深度学习框架下基于性能感知的DBS-SGD算法[J].计算机研究与发展,2019,56(11):2396-2409. 被引量：11
2魏署光,杜鑫,陈敏.研究型大学本科生就读经验及学习效果差异的类型学分析——以H大学为例[J].中国高教研究,2020,0(1):49-56. 被引量：22
3吴美玲,金迪,徐楚臻,何颖俞.基于ID3算法的决策机场出租车去留问题[J].科技创新与应用,2020(18):127-129.
4姜红,马枭,杜岩.基于判别分析与K近邻算法对塑料吸管的红外光谱分析[J].塑料工业,2020,48(5):112-116. 被引量：5
5李康宁,李明钰,李萌,杜若瑜.视觉刺激下基于“是-否”状态的脑电信号分类研究[J].北京生物医学工程,2020,39(3):257-263.
6邹臣嵩,段桂芹,欧阳明星,刘锋.基于改进近邻传播算法的聚类质量评价模型[J].西南师范大学学报（自然科学版）,2020,45(6):97-106. 被引量：4
7何群,邵丹丹,王煜文,张园园,谢平.基于多特征卷积神经网路的运动想象脑电信号分析及意图识别[J].仪器仪表学报,2020,41(1):138-146. 被引量：16
8张微,解承军.基于复杂网络技术的异步脑-机接口分类系统[J].科学技术与工程,2020,20(11):4383-4388. 被引量：1

中文信息学报

2020年第2期

浏览历史

内容加载中请稍等...

基于隐含主题协同注意力网络的领域分类方法被引量：1

参考文献2

二级参考文献93

共引文献38

同被引文献2

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于隐含主题协同注意力网络的领域分类方法 被引量：1

参考文献2

二级参考文献93

共引文献38

同被引文献2

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于隐含主题协同注意力网络的领域分类方法被引量：1