自注意力机制的短文本分类算法被引量：7

Short text classification algorithm of self-attention mechanism

下载PDF

导出

摘要分析目前的短文本分类算法没有综合考虑文本中隐含的依赖关系和局部关键信息这一问题,提出基于自注意力机制(self-attention mechanism)的堆叠双向长短时记忆网络(stack bidirectional long short term memory)模型(简称Att-BLSTMs)。利用stack Bi-LSTMs捕获上下文隐藏依赖关系,优化短文本特征稀疏的问题;利用自注意力机制加大对短文本中局部关键信息的注意力,优化文本表示。在公开AG-news网页新闻的语料和DBpedia分类数据集中,进行丰富的对比实验。实验结果表明,该模型将文本中隐含依赖关系与局部关键信息综合考虑后,有效提高了短文本分类的准确性。 The implicit dependencies and local key information in the current short text classification algorithm are not comprehensively considered.A stack bidirectional long short term memory model based on the self-attention mechanism was proposed.Stack Bi-LSTMs was used to mine the contextual semantic dependencies information to optimize feature representation.The attention mechanism was used to focus on key information of text to optimize the text representation.The public corpus of the AG-news web news and DBpedia were used to conduct a rich comparative experiment.It is pointed out that the accuracy of the short text classification is improved a lot by considering the implicit dependencies and local key information.

作者姚苗杨文忠袁婷婷马国祥 YAO Miao;YANG Wen-zhong;YUAN Ting-ting;MA Guo-xiang(College of Software Engineering,Xinjiang University,Urumqi 830046,China;College of Information Science and Engineering,Xinjiang University,Urumqi 830046,China)

机构地区新疆大学软件学院新疆大学信息科学与工程学院

出处《计算机工程与设计》北大核心 2020年第6期1592-1598,共7页 Computer Engineering and Design

基金国家自然科学基金项目(U1603115、71801125) 国家自然科学基金重点基金项目(U1435215) 自治区自然科学基金项目(2017D01C042)。

关键词短文本分类深度学习自注意力机制堆叠双向长短时记忆网络模型微平均宏平均 short text classification deep learning self-attention mechanism stack bidirectional long short term memory mo-del micro-average macro-average

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1田生伟,胡伟,禹龙,吐尔根.依布拉音,赵建国,李圃.结合注意力机制的Bi-LSTM维吾尔语事件时序关系识别[J].东南大学学报（自然科学版）,2018,48(3):393-399. 被引量：11
2白静,李霏,姬东鸿.基于注意力的BiLSTM-CNN中文微博立场检测模型[J].计算机应用与软件,2018,35(3):266-274. 被引量：29

二级参考文献6

1赵妍妍,秦兵,刘挺.文本情感分析[J].软件学报,2010,21(8):1834-1848. 被引量：528
2魏韡,向阳,陈千.中文文本情感分析综述[J].计算机应用,2011,31(12):3321-3323. 被引量：70
3钟军,禹龙,田生伟,吐尔根.依布拉音.基于双层模型的维吾尔语突发事件因果关系抽取[J].自动化学报,2014,40(4):771-779. 被引量：11
4郑新,李培峰,朱巧明.基于全局优化的中文事件时序关系推理方法[J].中文信息学报,2016,30(5):129-135. 被引量：3
5李敏,禹龙,田生伟,吐尔根.依布拉音,赵建国.基于深度学习的维吾尔语名词短语指代消解[J].自动化学报,2017,43(11):1984-1992. 被引量：7
6田生伟,周兴发,禹龙,冯冠军,艾山.吾买尔,李圃.基于双向LSTM的维吾尔语事件因果关系抽取[J].电子与信息学报,2018,40(1):200-208. 被引量：16

共引文献36

1杨一璞,朱永华,高海燕,高文靖.一种结合文章信息的新闻评论情感分析方法[J].上海大学学报（自然科学版）,2022,28(1):170-178.
2周海华,曹春萍.基于BLSTM-CRF的领域知识点实体识别技术[J].软件,2019,40(2):1-5.
3李润川,张行进,王旭,陈刚,冀沙沙,王宗敏.基于单心搏活动特征与BiLSTM-Attention模型的心律失常检测[J].计算机应用与软件,2019,36(10):145-150. 被引量：3
4王伟,孙玉霞,齐庆杰,孟祥福.基于BiGRU-attention神经网络的文本情感分类模型[J].计算机应用研究,2019,36(12):3558-3564. 被引量：61
5王安君,黄凯凯,陆黎明.基于Bert-Condition-CNN的中文微博立场检测[J].计算机系统应用,2019,28(11):45-53. 被引量：10
6徐德华,张未央.基于深度记忆网络的在线评论细粒度情感分类[J].电子制作,2020,0(1):28-29.
7王立荣.Word2vec-CNN-Bilstm短文本情感分类[J].福建电脑,2020,36(1):11-16. 被引量：1
8饶竹一,张云翔.基于BiGRU和注意力机制的多标签文本分类模型[J].现代计算机,2020,26(1):31-35. 被引量：4
9李凌浩,李欣晔,张承强,周雄图,张永爱.基于Bi-GRU和双层注意力机制的商品评论情感分析[J].广播电视网络,2020,27(2):102-107. 被引量：1
10高明柯,赵卓,逄涛,王天保,邹一波,黄晨,李德旭.基于注意力机制和特征融合的手势识别方法[J].计算机应用与软件,2020,37(6):199-203. 被引量：7

同被引文献82

1周意乔,徐昱琳.基于双向LSTM的复杂环境下实时人体姿势识别[J].仪器仪表学报,2020,41(3):192-201. 被引量：3
2陶志勇,李小兵,刘影,刘晓芳.基于双向长短时记忆网络的改进注意力短文本分类方法[J].数据分析与知识发现,2019,3(12):21-29. 被引量：23
3熊漩,严佩敏.融合多头自注意力机制的中文分类方法[J].电子测量技术,2020(10):125-130. 被引量：7
4段建东,张保会,周艺,罗四倍,任晋峰,杭乃善,刁桂平.基于暂态量的超高压输电线路故障选相[J].中国电机工程学报,2006,26(3):1-6. 被引量：63
5林圣,梅俊涛,陈双,何正友,钱清泉.基于暂态行波时频特征的输电线路故障检测与选相方法[J].电网技术,2012,36(7):48-53. 被引量：15
6陈旸,胡炎,邰能灵,张沛超.基于电压故障分量的超高压线路故障选相新方法[J].电力系统保护与控制,2014,42(7):8-14. 被引量：6
7杨宇婷,王名扬,田宪允,李鹏宇.基于文档分布式表达的新浪微博情感分类研究[J].情报杂志,2016,35(2):151-156. 被引量：16
8周庆平,谭长庚,王宏君,湛淼湘.基于聚类改进的KNN文本分类算法[J].计算机应用研究,2016,33(11):3374-3377. 被引量：67
9张建付,宋雨,李刚,王传洋,焦亚菲.基于长短时记忆神经网络的风电机组滚动轴承故障诊断方法[J].计算机测量与控制,2017,25(1):16-19. 被引量：28
10张乐,闫强,吕学强.面向短文本的情感折射模型[J].情报学报,2017,36(2):180-189. 被引量：9

引证文献7

1金乐.基于双向长短期记忆网络的高压输电线路短路故障识别方法[J].内蒙古电力技术,2021,39(2):66-72. 被引量：3
2黄卫春,陶自强,熊李艳.密集池化连接和短语注意力下的文本分类算法[J].科学技术与工程,2021,21(17):7193-7199.
3杨秀璋,李晓峰,袁杰,李坤琪,杨鑫,罗子江.一种融合语义知识和BiLSTM-CNN的短文本分类方法[J].计算机时代,2021(11):49-54. 被引量：2
4吴迪,姜丽婷,王路路,吐尔根·依布拉音,艾山·吾买尔,早克热·卡德尔.结合多头注意力机制的旅游问句分类研究[J].计算机工程与应用,2022,58(3):165-171. 被引量：2
5陈立潮,秦杰,陆望东,潘理虎,张睿.自注意力机制的短文本分类方法[J].计算机工程与设计,2022,43(3):728-734. 被引量：6
6谢星雨,余本功.基于MFFMB的电商评论文本分类研究[J].数据分析与知识发现,2022,6(1):101-112. 被引量：6
7杨秀璋,郭明镇,候红涛,袁杰,李晓峰,李坤琪,汪威,何世群,罗子江.融合情感词典的改进BiLSTM-CNN+Attention情感分类算法[J].科学技术与工程,2022,22(20):8761-8770. 被引量：12

二级引证文献31

1黄茜,贺超城,李欣儒,吴江.后疫情时代下短租民宿用户购买行为研究——基于BERT衡量的网络口碑[J].知识管理论坛,2023(3):238-257.
2方洪波,万广,陈忠辉,黄以卫,张文勇,谢本亮.基于改进YOLOv5s的离线手写数学符号识别[J].图学学报,2022,43(3):387-395. 被引量：2
3金泽熙,李磊.基于自然语言处理和深度学习的在线信任识别研究[J].信息技术与信息化,2022(8):197-201. 被引量：3
4程欣炜,岳中刚.基于电商大数据的农产品短期经营风险预测研究——以家庭经营梨果种植户为样本[J].商业经济与管理,2022(9):16-29. 被引量：2
5顾彬,郭焘,王义成,纪大伟,祁步仁.2M光接口的继电保护装置线路隐藏故障检测方法[J].电力设备管理,2022(17):36-37.
6王国英.基于多粒度与动态词向量的机器翻译关键技术研究[J].自动化与仪器仪表,2022(9):181-185. 被引量：1
7王仁超,张毅伟,毛三军.水电工程施工安全隐患文本智能分类与知识挖掘[J].水力发电学报,2022,41(11):96-106. 被引量：8
8阮进军,杨萍.基于Att-CN-BiLSTM模型的中文新闻文本分类[J].通化师范学院学报,2022,43(12):65-70. 被引量：4
9刘柏霆,管卫利,李陶深.基于XLNet+BiGRU+Att(Label)的文本分类模型[J].广西科学院学报,2022,38(4):412-419. 被引量：1
10淦亚婷,安建业,徐雪.基于深度学习的短文本分类方法研究综述[J].计算机工程与应用,2023,59(4):43-53. 被引量：6

1齐玉东,丁海强,司维超,李程瑜.基于改进CNN的海军军事文本分类模型[J].电光与控制,2020,27(5):68-73. 被引量：9
2张晓辉,于双元,王全新,徐保民.基于对抗训练的文本表示和分类算法[J].计算机科学,2020,47(S01):12-16. 被引量：6

计算机工程与设计

2020年第6期

浏览历史

内容加载中请稍等...

自注意力机制的短文本分类算法被引量：7

参考文献2

二级参考文献6

共引文献36

同被引文献82

引证文献7

二级引证文献31

相关作者

相关机构

相关主题

浏览历史

自注意力机制的短文本分类算法 被引量：7

参考文献2

二级参考文献6

共引文献36

同被引文献82

引证文献7

二级引证文献31

相关作者

相关机构

相关主题

浏览历史

自注意力机制的短文本分类算法被引量：7