基于自注意力机制的双向分层语义模型被引量：1

Bi-directional hierarchical semantic representation model based on self-attention mechanism

下载PDF

导出

摘要针对以文本词向量作为输入的神经网络无法充分利用文本语义结构特征信息、难以有效表示每个词语在句子中的重要程度等问题,提出一种基于自注意力机制的双向分层语义模型Satt-BiHSNN。通过双层双向LSTM将文本词向量进行训练得到文本表示,解决长距离依赖问题;通过自注意力机制从多个视角有效获取每个词语在句子中的重要程度,减少噪音词语权重并获取更多隐藏信息;使用softmax分类器进行文本分类。在IMDB和20Newsgroup数据集上的实验结果表明,该方法在文本分类任务中,较之前基于传统注意力机制的文本分类模型在准确率和收敛速度上有了进一步的提高。 To address the problem that the neural network with word vector as input cannot make full use of text semantic structure feature information and it is difficult to effectively represent the importance of each word in sentences,a hierarchical semantic representation model called bi-directional hierarchical semantic neural network based on self-attention(Satt-BiHSNN)was proposed.The text word vector was trained using double-layer bidirectional LSTM to obtain the text representation and solve the problem of long-distance dependence.The importance of each word in the sentence was effectively obtained through the self-attention from multiple aspects,and the weight of the noise words was reduced and more hidden information was got.The softmax classifier was used for text categorization.Experimental results on IMDB and 20Newsgroup datasets show that,compared to the traditional attention mechanism,the proposed model further improves the accuracy and convergence speed of the text classification model.

作者张志远李庭恩 ZHANG Zhi-yuan;LI Ting-en(School of Computer Science and Technology,Civil Aviation University of China,Tianjin 300300,China)

机构地区中国民航大学计算机科学与技术学院

出处《计算机工程与设计》北大核心 2019年第9期2607-2613,共7页 Computer Engineering and Design

基金国家自然科学基金民航联合基金项目(U1633110) 中央高校基本科研业务费专项基金项目(3122016D021)

关键词深度学习文本分类自注意力机制循环神经网络分层语义表示 deep learning text classification self-attention mechanism recurrent neural network hierarchical semantic representation

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1张志琳,宗成庆.基于多样化特征的中文微博情感分类方法研究[J].中文信息学报,2015,29(4):134-143. 被引量：21
2万圣贤,兰艳艳,郭嘉丰,徐君,庞亮,程学旗.用于文本分类的局部化双向长短时记忆[J].中文信息学报,2017,31(3):62-68. 被引量：17

二级参考文献18

1A Das,S Bandyopadhyay.Dr Sentiment knows everything![C]//Proceedings of the ACL-HLT,2011:50-55.
2A Joshi,A Balamurali,P Bhattacharyya,et al.C-feel-it:A sentiment analyzer for micro-blogs[C]//Proceedings of the ACL-HLT,2011 :127-132.
3P Chesley,B Vincent,L Xu,et al.Using verbs and adjectives to automatically classify blog sentiment[J] .Training,2006,580(263).
4L Jiang,M Yu,M Zhou,et al.Target -dependent twitter sentiment classification[C]//Proceedings of ACL-HLT,2011:151-160.
5S Prasad.Micro-blogging Sentiment Analysis Using Bayesian Classification Methods[N].Technical Report,Stanford University,2010,Available at http://www-nlp.stanford.edu/courses/.
6Y Lu,M Castellanos,U Dayal,et al.Automatic construction of a context-aware sentiment lexicon:an optimization approach[C]//Proceedings of the 20th international conference on World wide web,2011:347-356.
7P D Turney.Thumbs up or thumbs down?:semantic orientation applied to unsupervised classification of reviews[C]//Proceedings of the 40th Annual Meeting on Association for Computational Linguistics,2002 :417-424.
8B Pang,L Lee,S Vaithyanathan.Thumbs up?:sentiment classification using machine learning techniques[C]//Proceedings of EMNLP,2002:79-86.
9T Mullen,N Collier.Sentiment Analysis using Support Vector Machines with Diverse Information Sources[C]//Proceedings of EMNLP,2004:412-418.
10A Go,R Bhayani,L Huang.Twitter sentiment classification using distant supervision[J].CS224N Project Report,Stanford University,2009:1-12.

共引文献36

1葛艳,郑利杰,杜军威,陈卓.基于BLSTM-Attention神经网络模型的化工事故分类[J].计算机系统应用,2020,29(10):205-210. 被引量：2
2刘金硕,张智.一种基于联合深度神经网络的食品安全信息情感分类模型[J].计算机科学,2016,43(12):277-280. 被引量：6
3丁晟春,吴靓婵媛,李红梅.基于SVM的中文微博观点倾向性识别[J].情报学报,2016,35(12):1235-1243. 被引量：21
4林伟.基于多特征提取的中文微博舆情分类研究[J].中国人民公安大学学报（自然科学版）,2016,22(4):53-56. 被引量：2
5林伟.中文微博舆情分类中一种改进的特征选择方法[J].中国人民公安大学学报（自然科学版）,2017,23(2):72-75. 被引量：1
6于海燕,陆慧娟,郑文斌.情感分类中基于词性嵌入的特征权重计算方法[J].计算机工程与应用,2017,53(22):121-125. 被引量：5
7朱星嘉,李红莲,吕学强,周建设,夏红科.一种改进的Attention-Based LSTM特征选择模型[J].北京信息科技大学学报（自然科学版）,2018,33(2):54-59. 被引量：13
8陈珂,梁斌,柯文德,许波,曾国超.基于多通道卷积神经网络的中文微博情感分析[J].计算机研究与发展,2018,55(5):945-957. 被引量：75
9韩毅,张涵,李跃新.基于情感直方图特征的中文文本情感分类方法[J].计算机工程与设计,2018,39(7):1917-1922.
10缪广寒.基于Word2vec和SVM的微博情感挖掘与仿真分析[J].电子科技,2018,31(5):81-83. 被引量：8

同被引文献4

1魏勇.关联语义结合卷积神经网络的文本分类方法[J].控制工程,2018,25(2):367-370. 被引量：11
2字云飞,李业丽,孙华艳.基于深度神经网络的个性化推荐系统研究[J].电子技术应用,2019,45(1):14-18. 被引量：28
3高磊,范冰冰,黄穗.基于残差的改进卷积神经网络图像分类算法[J].计算机系统应用,2019,28(7):139-144. 被引量：10
4汪嘉伟,杨煦晨,琚生根,袁宵,谢正文.基于卷积神经网络和自注意力机制的文本分类模型[J].四川大学学报（自然科学版）,2020,57(3):469-475. 被引量：25

引证文献1

1梁顺攀,豆明明,于洪涛,郑智中.基于混合神经网络的文本分类方法[J].计算机工程与设计,2022,43(2):573-579. 被引量：6

二级引证文献6

1刘柏霆,管卫利,李陶深.基于XLNet+BiGRU+Att(Label)的文本分类模型[J].广西科学院学报,2022,38(4):412-419. 被引量：1
2班玛宝,慈祯嘉措,张瑞,才让加.融合La格虚词语义信息的藏文La格分类模型[J].厦门大学学报（自然科学版）,2023,62(4):695-703.
3马文源,袁蜀翔,刘宁,罗姚,欧阳泽,胡兴新.基于改进卷积神经网络的齿轮箱故障诊断方法[J].自动化与仪器仪表,2023(9):46-50. 被引量：1
4耿飙,梁成全,魏炜,朱长元.基于深度学习的非结构化医学文本知识抽取[J].计算机工程与设计,2024,45(1):177-186.
5郑文军,张顺香.全局和局部特征动态融合的文本分类模型[J].西安工程大学学报,2024,38(4):97-105.
6原明君,江开忠,杨洋,惠岚昕.结合自注意力和归一化的MAC_BiLSTM文本分类模型[J].应用数学进展,2022,11(10):7012-7025.

1刘全,梁斌,徐进,周倩.一种用于基于方面情感分析的深度分层网络模型[J].计算机学报,2018,41(12):2637-2652. 被引量：47
2张莹,王超,郭文雅,袁晓洁.基于双向分层语义模型的多源新闻评论情绪预测[J].计算机研究与发展,2018,55(5):933-944. 被引量：5
3冯燕芬.医院噪音造成的影响及应对措施研究[J].黑龙江中医药,2019,48(4):154-155. 被引量：4
4傅柱,王曰芬,丁绪辉.面向知识重用的设计过程知识语义表示研究[J].数据分析与知识发现,2019,3(6):21-29. 被引量：7
5李霞,刘承标,章友豪,蒋盛益.基于局部和全局语义融合的跨语言句子语义相似度计算模型[J].中文信息学报,2019,33(6):18-26. 被引量：14
6杨霞辉.市政工程绿色施工技术措施的探析[J].电子乐园,2019(14):446-446.
7黄琳.我国开放式公园与城市公共空间的关系及其发展浅析[J].现代园艺,2019,0(15):151-152.
8杨帆,陈建峡,郑吟秋,黄煜俊,李超.基于深度学习的法院信息文本分类[J].湖北工业大学学报,2019,34(4):63-67. 被引量：2
9刘沈如,王伟,张其林,罗晓群,吴明儿.基于全过程课程设计虚实结合教学模式探讨[J].高等建筑教育,2019,28(4):99-102. 被引量：9
10谈清正.大数据时代建筑企业会计信息化存在的风险及防范[J].中国管理信息化,2019,22(17):47-49. 被引量：10

计算机工程与设计

2019年第9期

浏览历史

内容加载中请稍等...

基于自注意力机制的双向分层语义模型被引量：1

参考文献2

二级参考文献18

共引文献36

同被引文献4

引证文献1

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于自注意力机制的双向分层语义模型 被引量：1

参考文献2

二级参考文献18

共引文献36

同被引文献4

引证文献1

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于自注意力机制的双向分层语义模型被引量：1