融合通道特征的混合神经网络文本分类模型被引量：5

Hybrid Neural Network Text Classification Model with Channel Features

下载PDF

导出

摘要基于卷积神经网络与循环神经网络的混合文本分类模型通常使用单通道词嵌入。单通道词嵌入空间维度低,特征表示单一,导致一维卷积神经网络不能充分学习文本的空间特征,影响了模型的性能。因此,该文提出一种融合通道特征的混合神经网络文本分类模型。该模型使用了双通道词嵌入丰富文本表示,增加了空间维度,在卷积的过程中融合了通道特征,优化了空间特征与时序特征的结合方式,最终提高了混合模型的分类性能。在IMDB、20NewsGroups、复旦中文数据集、THUC数据集上进行实验,该模型的分类准确率相比于传统卷积神经网络平均提升了1%,在THUC数据集上准确率最高提升了1.3%。 The hybrid text classification model based on convolutional neural network and recurrent neural network usually uses single-channel word embedding. Single-channel word embedding has low spatial dimension, leading that one-dimensional convolutional neural network fail to fully capture text features. This paper proposes a hybrid neural network text classification model combined with the channel features. The model uses two-channel word embedding to enrich text representation, fuses channel feature in the process of convolution, and optimizes the combination of spatial and temporal features. Tested on IMDB, 20 NewsGroups, Fudan Chinese dataset and THUC dataset, the proposed model improves the classification accuracy by an average of 1% compared with the traditional methods, with a top increase of 1.3% on the THUC dataset.

作者韩永鹏陈彩苏航梁毅 HAN Yongpeng;CHEN Cai;SU Hang;LIANG Yi(Faculty of Information,Beijing University of Technology,Beijing 100124,China)

机构地区北京工业大学信息学部

出处《中文信息学报》 CSCD 北大核心 2021年第2期78-88,共11页 Journal of Chinese Information Processing

基金国家自然科学基金(61672505,91546111)。

关键词通道特征神经网络文本分类 channel feature neural network text classification

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1苏金树,张博锋,徐昕.基于机器学习的文本分类技术研究进展[J].软件学报,2006,17(9):1848-1859. 被引量：388
2王盛玉,曾碧卿,商齐,韩旭丽.基于词注意力卷积神经网络模型的情感分析研究[J].中文信息学报,2018,32(9):123-131. 被引量：18
3江伟,金忠.基于短语注意机制的文本分类[J].中文信息学报,2018,32(2):102-109. 被引量：11
4程艳,叶子铭,王明文,张强,张光河.融合卷积神经网络与层次化注意力网络的中文文本情感倾向性分析[J].中文信息学报,2019,33(1):133-142. 被引量：25
5车蕾,杨小平,王良,梁天新,韩镇远.面向文本结构的混合分层注意力网络的话题归类[J].中文信息学报,2019,33(5):93-102. 被引量：4

二级参考文献9

1王建会,王洪伟,申展,胡运发.一种实用高效的文本分类算法[J].计算机研究与发展,2005,42(1):85-93. 被引量：20
2李荣陆,王建会,陈晓云,陶晓鹏,胡运发.使用最大熵模型进行中文文本分类[J].计算机研究与发展,2005,42(1):94-101. 被引量：96
3梁军,柴玉梅,原慧斌,昝红英,刘铭.基于深度学习的微博情感分析[J].中文信息学报,2014,28(5):155-161. 被引量：110
4刘龙飞,杨亮,张绍武,林鸿飞.基于卷积神经网络的微博情感倾向性分析[J].中文信息学报,2015,29(6):159-165. 被引量：97
5孙晓,何家劲,任福继.基于多特征融合的混合神经网络模型讽刺语用判别[J].中文信息学报,2016,30(6):215-223. 被引量：14
6叶敏,汤世平,牛振东.一种基于多特征因子改进的中文文本分类算法[J].中文信息学报,2017,31(4):132-137. 被引量：11
7栾克鑫,杜新凯,孙承杰,刘秉权,王晓龙.基于注意力机制的句子排序方法[J].中文信息学报,2018,32(1):123-130. 被引量：7
8陈毅松,汪国平,董士海.基于支持向量机的渐进直推式分类学习算法[J].软件学报,2003,14(3):451-460. 被引量：88
9张爱华.一种基于动态协同神经网络的文本作者身份分类研究[J].计算机科学,2015,42(S1):143-145. 被引量：2

共引文献438

1李林,刁磊,唐詹,柏召,周晗,郭旭超.基于BERT_Stacked LSTM的农业病虫害问句分类方法[J].农业机械学报,2021,52(S01):172-177. 被引量：6
2姚学恒,张萍,闫立伟,操诚.基于机器学习的企业秘密文档自动分类方法[J].产业与科技论坛,2020,19(7):44-45.
3张小艳,李强.基于SVM的分类方法综述[J].科技信息,2008(28):344-345. 被引量：23
4王辉,左万利,袁华.一种基于质心与本体的文本分类方法[J].计算机研究与发展,2007,44(z2):6-11. 被引量：3
5徐燕,李锦涛,王斌,孙春明,张森.不均衡数据集上文本分类的特征选择研究[J].计算机研究与发展,2007,44(z2):58-62. 被引量：20
6袁志坚,贾焰.基于误差反馈的高速Web文本流快速近似分类[J].计算机研究与发展,2007,44(z3):13-17.
7贾志洋,高炜,王勇刚.结合信息检索技术的半监督文本分类方法[J].苏州大学学报（自然科学版）,2012,28(1):34-39. 被引量：1
8陈思,钱铭宇,刘昌明.文本分类技术研究进展[J].电脑编程技巧与维护,2009(S1):22-24.
9李艾林,李照耀.基于朴素贝叶斯技术的藏文文本分类[J].中文信息,2013(11). 被引量：4
10伍洋,钟鸣,姜艳,李石君.面向审计领域的短文本分类技术研究[J].微电子学与计算机,2015,32(1):5-10. 被引量：7

同被引文献38

1张国宾,王新迎.基于混合神经网络的光伏组件输出特性数据驱动建模方法[J].智能科学与技术学报,2020,2(2):169-178. 被引量：1
2刘亚慧,杨浩苹,李正华,张民.一种轻量级的汉语语义角色标注规范[J].中文信息学报,2020(4):10-20. 被引量：4
3李文宽,刘培玉,朱振方,刘文锋.基于卷积神经网络和贝叶斯分类器的句子分类模型[J].计算机应用研究,2020,37(2):333-336. 被引量：11
4翟林,刘亚军.支持向量机的中文文本分类研究[J].计算机与数字工程,2005,33(3):21-23. 被引量：14
5李荣艳,金鑫,王春辉,郑宁,别荣芳.一种新的中文文本分类算法[J].北京师范大学学报（自然科学版）,2006,42(5):501-505. 被引量：6
6高云龙,左万利,王英,王鑫.基于稀疏自学习卷积神经网络的句子分类模型[J].计算机研究与发展,2018,55(1):179-187. 被引量：10
7王明轩,刘群.基于深度神经网络的语义角色标注[J].中文信息学报,2018,32(2):50-57. 被引量：10
8胡朝举,梁宁.基于深层注意力的LSTM的特定主题情感分析[J].计算机应用研究,2019,36(4):1075-1079. 被引量：30
9刘月,翟东海,任庆宁.基于注意力CNLSTM模型的新闻文本分类[J].计算机工程,2019,45(7):303-308. 被引量：20
10余本功,陈杨楠,杨颖.基于nBD-SVM模型的投诉短文本分类[J].数据分析与知识发现,2019,3(5):77-85. 被引量：13

引证文献5

1王金政,杨颖,余本功.基于多头协同注意力机制的客户投诉文本分类模型[J].数据分析与知识发现,2023,7(1):128-137. 被引量：3
2班玛宝,色差甲,才让加,张瑞,柔特.一种端到端的藏文La格浅层语义分析[J].中文信息学报,2023,37(2):62-70.
3班玛宝,慈祯嘉措,张瑞,才让加.融合La格虚词语义信息的藏文La格分类模型[J].厦门大学学报（自然科学版）,2023,62(4):695-703.
4樊蒙蒙,庞建成.基于混合神经网络的网络数据传输中恶意攻击数据辨识[J].长江信息通信,2024,37(5):86-88.
5廖列法,李奎,姚秀.融合概率类别特征增强的短文本分类[J].计算机工程与设计,2024,45(7):2074-2081.

二级引证文献3

1湛志宏,覃开贤,彭凌华,湛铖.基于MacBERT和联合注意力增强网络的物业服务投诉分类方法[J].广西科学,2024,31(1):110-118.
2廖列法,李奎,姚秀.融合概率类别特征增强的短文本分类[J].计算机工程与设计,2024,45(7):2074-2081.
3陈雪松,李衡,王浩畅.结合注意力机制和Mengzi模型的短文本分类[J].计算机与现代化,2024(9):101-106.

1李妍慧,郑超美,王炜立,杨昕.一种混合语种文本的多维度多情感分析方法[J].计算机工程,2020,46(12):113-119. 被引量：6
2孙新,唐正,赵永妍,张颖捷.基于层次混合注意力机制的文本分类模型[J].中文信息学报,2021,35(2):69-77. 被引量：7
3邢鑫,孙国梓.基于双通道词向量的ACRNN文本分类[J].计算机应用研究,2021,38(4):1033-1037. 被引量：2
4观点[J].语文学习,2020(12):78-78.
5朱晓东,丁婷.2017-2020年浙江高考英语阅读理解试题评析——基于PISA 2018阅读素养测评框架[J].教育测量与评价,2020(12):14-23. 被引量：1
6何多魁.电商短文本的方面级情感分析[J].新丝路,2021(4):223-223.
7严敏.韩国移民家庭的美利坚“南柯一梦”[J].新民周刊,2021(10):80-80.

中文信息学报

2021年第2期

浏览历史

内容加载中请稍等...

融合通道特征的混合神经网络文本分类模型被引量：5

参考文献5

二级参考文献9

共引文献438

同被引文献38

引证文献5

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

融合通道特征的混合神经网络文本分类模型 被引量：5

参考文献5

二级参考文献9

共引文献438

同被引文献38

引证文献5

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

融合通道特征的混合神经网络文本分类模型被引量：5