基于卷积神经网络和自注意力机制的文本分类模型被引量：25

Text classification model based on convolutional neural network and self-attention mechanism

下载PDF

导出

摘要单词级别的浅层卷积神经网络(CNN)模型在文本分类任务上取得了良好的表现.然而,浅层CNN模型由于无法捕捉长距离依赖关系,影响了模型在文本分类任务上的效果.简单地加深模型层数并不能提升模型的效果.本文提出一种新的单词级别的文本分类模型Word-CNN-Att,该模型使用CNN捕捉局部特征和位置信息,利用自注意力机制捕捉长距离依赖.在AGNews、DBPedia、Yelp Review Polarity、Yelp Review Full、Yahoo! Answers等5个公开的数据集上,Word-CNN-Att比单词级别的浅层CNN模型的准确率分别提高了0.9%、0.2%、0.5%、2.1%、2.0%. The word-level shallow convolutional neural network(CNN) model has achieved good performance in text classification tasks. However, shallow CNN models can’t capture long-range dependencies, which affects the model’s performance in text classification tasks, but simply deepening the number of layers of the model does not improve the model’s performance. This paper proposes a new word-level text classification model Word-CNN-Att, which uses CNN to capture local features and position information, and captures long-range dependencies with self-attention mechanism. The accuracy of Word-CNN-Att, on the five public datasets of AGNews, DBPedia, Yelp Review Polarity, Yelp Review Full, Yahoo! Answers, is 0.9%, 0.2%, 0.5%, 2.1%, and 2.0% higher than the word-level shallow CNN model respectively.

作者汪嘉伟杨煦晨琚生根袁宵谢正文 WANG Jia-Wei;YANG Xu-Chen;JU Sheng-Gen;YUAN Xiao;XIE Zheng-Wen(College of Computer Science,Sichuan University,Chengdu 610065,China)

机构地区四川大学计算机学院

出处《四川大学学报（自然科学版）》 CAS CSCD 北大核心 2020年第3期469-475,共7页 Journal of Sichuan University(Natural Science Edition)

基金 2018年四川省新一代人工智能重大专项科技项目(2018GZDZX0039)。

关键词文本分类卷积神经网络自注意力机制长距离依赖 Text classification Convolutional neural network Self-attentionmechanism Long-range dependencies

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1高云龙,左万利,王英,王鑫.基于集成神经网络的短文本分类模型[J].吉林大学学报（理学版）,2018,56(4):933-938. 被引量：12
2凌语,孙自强.基于卷积神经网络的乳腺病理图像识别算法[J].江苏大学学报（自然科学版）,2019,40(5):573-578. 被引量：20
3陈波.基于循环结构的卷积神经网络文本分类方法[J].重庆邮电大学学报（自然科学版）,2018,30(5):705-710. 被引量：14

二级参考文献13

1孔英会,景美丽.基于混淆矩阵和集成学习的分类方法研究[J].计算机工程与科学,2012,34(6):111-117. 被引量：46
2王进,金理雄,孙开伟.基于演化超网络的中文文本分类方法[J].江苏大学学报（自然科学版）,2013,34(2):196-201. 被引量：13
3肖业鸣,张晴晴,宋黎明,潘接林,颜永红.深度神经网络技术在汉语语音识别声学建模中的优化策略[J].重庆邮电大学学报（自然科学版）,2014,26(3):373-379. 被引量：5
4张建华,孔繁涛,吴建寨,翟治芬,韩书庆,曹姗姗.基于改进VGG卷积神经网络的棉花病害识别模型[J].中国农业大学学报,2018,23(11):161-171. 被引量：107
5赖娟,金澎,洪艳伟.文本分类中的主动多域学习[J].西南师范大学学报（自然科学版）,2014,39(7):108-114. 被引量：3
6陈翠平.基于深度信念网络的文本分类算法[J].计算机系统应用,2015,24(2):121-126. 被引量：43
7LIAN Zifeng,JING Xiaojun,WANG Xiaohan,HUANG Hai,TAN Youheng,CUI Yuanhao.DropConnect Regularization Method with Sparsity Constraint for Neural Networks[J].Chinese Journal of Electronics,2016,25(1):152-158. 被引量：7
8巴志超,杨子江,朱世伟,王蕾.基于关键词语义网络的领域主题演化分析方法研究[J].情报理论与实践,2016,39(3):67-72. 被引量：35
9潘炯光,韦余永.一种基于领域语义相关性挖掘的迁移学习方法[J].西南师范大学学报（自然科学版）,2016,41(5):184-189. 被引量：1
10李华,屈丹,张文林,王炳锡,梁玉龙.结合全局词向量特征的循环神经网络语言模型[J].信号处理,2016,32(6):715-723. 被引量：10

共引文献41

1刘雅楠,王晓艳,李靖宇,郝利国,赵添羽,邹鹤,许东滨.基于空间注意力机制的EfficientNet乳腺癌病理图像分类研究[J].电子元器件与信息技术,2022,6(8):1-4. 被引量：1
2刘云,黄荣乘.最大判别特征选择算法在文本分类的优化研究[J].四川大学学报（自然科学版）,2019,56(1):65-70. 被引量：7
3刘承启,林振荣,黄文海.基于LSTM的WEB服务响应时间大数据预测方法[J].四川大学学报（自然科学版）,2019,56(1):71-77. 被引量：7
4姚礼垚,熊浩,钟依健,刘财兴,刘汉兴,高月芳.基于深度网络模型的牛脸检测算法比较[J].江苏大学学报（自然科学版）,2019,40(2):197-202. 被引量：10
5罗强,黄睿岚,朱轶.基于深度学习的粮库虫害实时监测预警系统[J].江苏大学学报（自然科学版）,2019,40(2):203-208. 被引量：11
6邓可君,华凯,邓昌明,姜宁,袁玲,彭一明,张治坤.基于机器学习的论文作者名消歧方法研究[J].四川大学学报（自然科学版）,2019,56(2):241-245. 被引量：8
7黄裕.DSM-Forest算法对计算机多类数据学习分类性能的影响[J].信息技术,2019,43(5):148-150. 被引量：1
8王霞,孙界平,琚生根,胡思才.基于段落内部推理和联合问题答案匹配的选择型阅读理解模型[J].四川大学学报（自然科学版）,2019,56(3):423-430. 被引量：4
9张若彬,刘嘉勇,何祥.基于BLSTM-CRF模型的安全漏洞领域命名实体识别[J].四川大学学报（自然科学版）,2019,56(3):469-475. 被引量：16
10刘礼文,俞弦.循环神经网络（RNN）及应用研究[J].科技视界,2019,0(32):54-55. 被引量：17

同被引文献225

1陈波,张华,汪双,王皓冉,刘昭伟,李永龙,谢辉.基于全卷积神经网络的坝面裂纹检测方法研究[J].水力发电学报,2020(7):52-60. 被引量：25
2冀振燕,宋晓军,皮怀雨,杨春.基于深度学习的融合多源异构数据的推荐模型[J].北京邮电大学学报,2019,42(6):35-42. 被引量：12
3詹悦,陈志峰.基于交叉熵函数的神经网络研究[J].休闲,2021(12):0217-0217. 被引量：1
4朱远平,戴汝为.基于SVM决策树的文本分类器[J].模式识别与人工智能,2005,18(4):412-416. 被引量：24
5张建华,陈家骏.自然语言生成综述[J].计算机应用研究,2006,23(8):1-3. 被引量：27
6车君华,冯毅雄,谭建荣,王云.基于决策支持向量机的产品设计知识文档分类研究[J].计算机集成制造系统,2007,13(5):891-897. 被引量：8
7卜擎燕,熊宁宁,邹建东,蒋萌,刘芳,Anna Zhao-Wong.ICH国际医学用语词典(MedDRA):药事管理的标准医学术语集[J].中国临床药理学与治疗学,2007,12(5):586-590. 被引量：39
8赵鹏,蔡庆生,王清毅,耿焕同.一种基于复杂网络特征的中文文档关键词抽取算法[J].模式识别与人工智能,2007,20(6):827-831. 被引量：44
9庞秀丽,冯玉强,姜维.贝叶斯文本分类中特征词缺失的补偿策略[J].哈尔滨工业大学学报,2008,40(6):956-960. 被引量：5
10施聪莺,徐朝军,杨晓江.TFIDF算法研究综述[J].计算机应用,2009,29(B06):167-170. 被引量：218

引证文献25

1彭学勤,董梦雪,马琳.大数据背景下塑料光纤通信系统安全态势诊断研究[J].塑料科技,2020,48(8):73-76. 被引量：11
2王国桥,牛少彰.基于TF-IDF的社交电商文本信息分类研究[J].网络空间安全,2020,11(12):32-38. 被引量：6
3刘仲博.基于卷积神经网络的电选粉煤灰颗粒图像识别与烧失量预测模型[J].中国矿业,2021,30(5):125-129. 被引量：2
4刘婷,张社荣,李志竑,关炜.基于字符级CNN的调水工程巡检文本智能分类方法[J].水力发电学报,2021,40(6):89-98. 被引量：14
5李攀锋,林锋,蒋宗神.基于多模板模糊竞争的涉案财物关系抽取方法[J].四川大学学报（自然科学版）,2021,58(4):50-56.
6张彦晖,吕娜,刘鹏飞,陈卓.基于卷积注意力门控循环网络的加密流量分类方法[J].信号处理,2021,37(7):1180-1188. 被引量：7
7陈永刚,陈丽珊,邹易,孙余顺.基于深度学习的包装组件检测系统研究[J].包装工程,2021,42(15):284-291. 被引量：2
8赵革委,胡海东.基于局部卷积神经网络算法的文本分类识别[J].微型电脑应用,2021,37(8):136-139. 被引量：1
9魏胜楠,张景异,陈亮,耿俊香,王中洲.自适应局部关系网络的小样本学习方法[J].沈阳理工大学学报,2021,40(4):35-41. 被引量：4
10周末,宋玉蓉,宋波,苏晓萍.融合自注意力机制的D-BGRU文本分类模型[J].微电子学与计算机,2021,38(12):8-16. 被引量：5

二级引证文献112

1郭小萍,钟道金,李元.基于AMSDAE-BLSTM的工业过程质量预测[J].电子测量技术,2023,46(4):19-24.
2毛明.人工智能技术在食品智能包装设计中的应用及创新实践[J].包装工程,2023,44(S02):231-235. 被引量：14
3王照琳.基于DRN的塑料光纤传输系统误码率研究[J].塑料科技,2021,49(3):95-97.
4房金龙.大数据与机器学习构建动态企业级画像系统[J].科技风,2021(15):101-103.
5田丹,沈扬,李明超,韩帅.混凝土坝施工文档实体知识智能挖掘方法[J].水力发电学报,2021,40(6):139-151. 被引量：10
6赵春菊,资瑛,周宜红,刘全,赵可欣.缆机吊重海量监测数据的吊运混凝土模式识别[J].水力发电学报,2021,40(12):119-128. 被引量：5
7张美晨,赵丽娟,王雅东.基于CPS感知分析的煤岩截割状态识别系统[J].煤炭学报,2021,46(12):4071-4087. 被引量：8
8覃光明.应用ResGCNN的文本情感分析[J].福建电脑,2022,38(2):20-24.
9兰海翔,李卫群,张涛.基于大数据的通信网络阻塞故障检测系统设计[J].电子设计工程,2022,30(4):7-10. 被引量：8
10陈宇峰.采用CNN-LSTM与迁移学习的虚假评论检测[J].软件导刊,2022,21(2):63-67. 被引量：1

1Chang Xingyu.The Meaning of Fight for Achilles Hector and Heracles[J].新东方英语（中英文版）,2019(12):107-107.
2Angela Gebert,Markus Gerber,Uwe Pühse,Philippe Gassmann,Hanspeter Stamm,Markus Lamprecht.Costs resulting from nonprofessional soccer injuries in Switzerland:A detailed analysis[J].Journal of Sport and Health Science,2020,9(3):240-247.

四川大学学报（自然科学版）

2020年第3期

浏览历史

内容加载中请稍等...

基于卷积神经网络和自注意力机制的文本分类模型被引量：25

参考文献3

二级参考文献13

共引文献41

同被引文献225

引证文献25

二级引证文献112

相关作者

相关机构

相关主题

浏览历史

基于卷积神经网络和自注意力机制的文本分类模型 被引量：25

参考文献3

二级参考文献13

共引文献41

同被引文献225

引证文献25

二级引证文献112

相关作者

相关机构

相关主题

浏览历史

基于卷积神经网络和自注意力机制的文本分类模型被引量：25