基于循环神经网络变体和卷积神经网络的文本分类方法被引量：19

Text classification method based on recurrent neural network variants and convolutional neural network

下载PDF

导出

摘要针对长文本在文本分类时提取语义关键特征难度大,分类效果差等问题,建立基于循环神经网络变体和卷积神经网络(BGRU-CNN)的混合模型,实现中文长文本的准确分类。首先,通过PV-DM模型将文本表示为句向量,并将其作为神经网络的输入;然后,建立BGRU-CNN模型,经双向门控循环单元(B-GRU)实现文本的序列信息表示,利用卷积神经网络(CNN)提取文本的关键特征,通过Softmax分类器实现文本的准确分类;最后,经SogouC和THUCNews中文语料集测试,文本分类准确率分别达到89.87%和94.65%。测试结果表明,循环层提取的文本序列特征通过卷积层得到了进一步优化,文本的分类性能得到了提高。 In view of the long text semantic key features is difficult to extract,poor classification results in a text classification,a mixed model based on recurrent neural network variants and convolutional neural networks (BGRU-CNN) was established to achieve accurate classification of Chinese long texts. First,the text is represented as a sentence vector by PV-DM model as input to the neural network. Then,the BGRU-CNN model is established,the sequence information of the text is represented by the bidirectional gate recurrent unit (B-GRU). The key features of the text are extracted by the convolution neural network (CNN),and the text is classified by the Softmax classifier. Finally,by SogouC and THUCNews corpus test,the accuracy of text classification reaches 89.87% and 94.65% respectively. The test results show that the text sequence features extracted by the recurrent layer are further optimized through convolution layer,and the classification performance of the text is improved.

作者李云红梁思程任劼李敏奇张博李禹萱 LI Yunhong;LIANG Sicheng;REN Jie;LI Minqi;ZHANG Bo;LI Yuxuan(School of Electronics and Information,Xi′an Polytechnic University,Xi′an 710048,China;State Grid Xi′an Power Supply Company,Xi′an 710032,China)

机构地区西安工程大学电子信息学院国网西安供电公司

出处《西北大学学报（自然科学版）》 CAS CSCD 北大核心 2019年第4期573-579,共7页 Journal of Northwest University（Natural Science Edition）

基金国家自然科学基金资助项目(61471161) 陕西省科技厅自然科学基础研究重点项目(2016JZ026) 西安工程大学大学生创新创业项目(chx201824)

关键词文本分类句向量循环神经网络卷积神经网络 text classification sentence vector recurrent neural network convolution neural network

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1魏勇.关联语义结合卷积神经网络的文本分类方法[J].控制工程,2018,25(2):367-370. 被引量：11
2王路琪,龙军,袁鑫攀.WDS:基于词向量的文本相似函数[J].计算机科学,2018,45(B11):113-116. 被引量：1
3陈洋,罗智勇.一种基于Hownet的词向量表示方法[J].北京大学学报（自然科学版）,2019,55(1):22-28. 被引量：11
4熊富林,邓怡豪,唐晓晟.Word2vec的核心架构及其应用[J].南京师范大学学报（工程技术版）,2015,15(1):43-48. 被引量：68
5郭泗辉,樊兴华.一种改进的贝叶斯网络短文本分类算法[J].广西师范大学学报（自然科学版）,2010,28(3):140-143. 被引量：6
6阿力木江.艾沙,吐尔根.依布拉音,库尔班.吾布力,艾山.吾买尔.基于SVM的维吾尔文文本分类研究[J].计算机工程与科学,2012,34(12):150-154. 被引量：11
7李荣陆,王建会,陈晓云,陶晓鹏,胡运发.使用最大熵模型进行中文文本分类[J].计算机研究与发展,2005,42(1):94-101. 被引量：95
8薛涛,王雅玲,穆楠.基于词义消歧的卷积神经网络文本分类模型[J].计算机应用研究,2018,35(10):2898-2903. 被引量：15

二级参考文献60

1胡卫华,朱永利.贝叶斯网络推理算法的研究和实现[J].华北电力大学学报（自然科学版）,2004,31(5):63-65. 被引量：7
2樊兴华,孙茂松.一种高性能的两类中文文本分类方法[J].计算机学报,2006,29(1):124-131. 被引量：70
3孙晋文,肖建国.基于SVM文本分类中的关键词学习研究[J].计算机科学,2006,33(11):182-184. 被引量：12
4马金娜,田大钢.基于支持向量机的中文文本自动分类研究[J].系统工程与电子技术,2007,29(3):475-478. 被引量：14
5SEBASTIANI F. Machine learning in automated text categorization[J]. ACM Computing Surveys, 2002,34(1 ):1-47.
6SAHAMI M. Learning limited dependence Bayesian elassifiers[C]//proceedings of the Second International Conference on Knowledge Discovery and Data Mining. Menlo Park : AAAI Press, 1996 : 335-338.
7D. D. Lewis. Naive (Bayes) at forty: The independence assumption in information retrieval. In: Proc. of the 10th European Conf. on Machine Learning. New York: Springer,1998, 4-15.
8Y. Yang, X. Lin. A re-examination of text categorization methods. In: The 22nd Annual Int'l ACM SIGIR Conf. onResearch and Development in the Information Retrieval. NewYork: ACM Press, 1999.
9Y. Yang, C. G. Chute. An example based mapping method for text categorization and retrieval. ACM Trans. on Information Systems, 1994, 12(3): 252 -277.
10E. Wiener. A neural network approach to topic spotting. The 4th Annual Syrup. on Document Analysis and Information Retrieval,Las Vegas, NV, 1995.

共引文献207

1叶佳鑫,熊回香,蒋武轩.一种融合患者咨询文本与决策机理的医生推荐算法[J].数据分析与知识发现,2020,4(2):153-164. 被引量：9
2章乐,朱娅霖.自然语言中词汇的信息获取:改进的skip-gram模型[J].北京电子科技学院学报,2020(2):19-26. 被引量：1
3陈文庆,李勤,姚伽华.基于最大熵模型的垃圾邮件过滤方法[J].网络安全技术与应用,2005(1):16-18. 被引量：1
4修宇,王士同,朱林,宗成庆.极大熵球面K均值文本聚类分析[J].计算机科学与探索,2007,1(3):331-339. 被引量：1
5钱晶,张杰,张涛.基于最大熵的汉语人名地名识别方法研究[J].小型微型计算机系统,2006,27(9):1761-1765. 被引量：26
6苏金树,张博锋,徐昕.基于机器学习的文本分类技术研究进展[J].软件学报,2006,17(9):1848-1859. 被引量：387
7尚文倩,瞿有利,黄厚宽,朱海滨,林永民,董红斌.基于基尼的模糊kNN分类器(英文)[J].广西师范大学学报（自然科学版）,2006,24(4):87-90.
8周琳.摄影,靠的就是眼力[J].军事记者,2006(10):52-52.
9尚文倩,黄厚宽,刘玉玲,林永民,瞿有利,董红斌.文本分类中基于基尼指数的特征选择算法研究[J].计算机研究与发展,2006,43(10):1688-1694. 被引量：38
10崔彩霞,王素格.基于粗集的支持向量机文本分类方法研究[J].科技广场,2006(8):4-6. 被引量：1

同被引文献173

1王启航,关小桐,金城.辽宁省某医院住院病案首页填报质量影响因素分析[J].中国病案,2020,0(1):17-20. 被引量：11
2陶志勇,李小兵,刘影,刘晓芳.基于双向长短时记忆网络的改进注意力短文本分类方法[J].数据分析与知识发现,2019,3(12):21-29. 被引量：23
3熊漩,严佩敏.融合多头自注意力机制的中文分类方法[J].电子测量技术,2020(10):125-130. 被引量：7
4尉景辉,何丕廉,孙越恒.基于K-Means的文本层次聚类算法研究[J].计算机应用,2005,25(10):2323-2324. 被引量：18
5洪宇,张宇,刘挺,李生.话题检测与跟踪的评测及研究综述[J].中文信息学报,2007,21(6):71-87. 被引量：153
6宋彦,蔡东风,张桂平,赵海.一种基于字词联合解码的中文分词方法[J].软件学报,2009,20(9):2366-2375. 被引量：42
7蔡岳,袁津生.基于改进DBSCAN算法的文本聚类[J].计算机工程,2011,37(12):50-52. 被引量：20
8张瑾.基于改进TF-IDF算法的情报关键词提取方法[J].情报杂志,2014,33(4):153-155. 被引量：63
9李枫林,柯佳.基于深度学习的文本表示方法[J].情报科学,2019,37(1):156-164. 被引量：19
10付甜甜,姚钊,丁红,许智婷,杨茗然,余锦华,王文平.计算机辅助诊断慢性乙肝患者肝纤维化进程的价值分析[J].中华医学杂志,2019,99(7):491-495. 被引量：27

引证文献19

1殷晓雨,阿力木江·艾沙,库尔班·吾布力.基于卷积递归模型的文本分类研究[J].电子技术应用,2019,45(10):29-32. 被引量：3
2李云红,李弘昊,文达,魏凡粟,郭新新,周小计.卷积循环神经网络的光学晶格中超冷原子动量分布预测[J].光学精密工程,2020,28(7):1480-1484. 被引量：2
3赵鹏飞,李艳玲,林民.面向迁移学习的意图识别研究进展[J].计算机科学与探索,2020,14(8):1261-1274. 被引量：7
4张小川,戴旭尧,刘璐,冯天硕.融合多头自注意力机制的中文短文本分类模型[J].计算机应用,2020,40(12):3485-3489. 被引量：18
5肖禹,王景中,王宝成.基于深度学习的中文文本分类方法[J].计算机工程与设计,2021,42(4):1014-1019. 被引量：9
6杨秀,胡钟毓,田英杰,谢海宁,陈文涛.基于关注指标和深度学习的台区配变重过载预警方法研究[J].智慧电力,2021,49(4):66-74. 被引量：15
7翟一鸣,王斌君,周枝凝,仝鑫.面向文本分类的多头注意力池化RCNN模型[J].计算机工程与应用,2021,57(12):155-160. 被引量：6
8韩广,卜桐,王明明,郑海青,孙晓云,金龙.基于双通道双向长短时记忆网络的铁路行车事故文本分类[J].铁道学报,2021,43(9):71-79. 被引量：5
9景丽,何婷婷.基于改进TF-IDF和ABLCNN的中文文本分类模型[J].计算机科学,2021,48(S02):170-175. 被引量：25
10杨秀璋,李晓峰,袁杰,李坤琪,杨鑫,罗子江.一种融合语义知识和BiLSTM-CNN的短文本分类方法[J].计算机时代,2021(11):49-54. 被引量：2

二级引证文献142

1张博旭.铁路事故灰色关联分析[J].中国安全科学学报,2022,32(S02):60-63. 被引量：2
2唐静,杨涛,朱垚,胡孔法.融合共现和语义信息的药对提取方法研究及应用[J].世界科学技术-中医药现代化,2024,26(1):88-98.
3林海香,赵正祥,陆人杰,卢冉,白万胜,胡娜娜.基于字词融合的高铁道岔多级故障诊断组合模型[J].电子测量与仪器学报,2022,36(10):217-226. 被引量：2
4毛容秋.氦氖与半导体激光治疗伤口感染和溃疡的疗效比较[J].中华理疗杂志,2000,23(2):114-114. 被引量：6
5赵晓平,马文,刘雪萍,陈达.一种面向科技项目文本的相似度度量方法[J].电子技术应用,2020,46(5):31-34. 被引量：3
6肖晗,毛雪松,朱泽德.基于HybridDL模型的文本相似度检测方法[J].电子技术应用,2020,46(6):28-31. 被引量：3
7倪旻,范菁,李晨光,吴元凯,李鸿.工业控制系统信息安全防护技术研究综述[J].云南民族大学学报（自然科学版）,2020,29(6):619-627. 被引量：9
8陈筱,朱向冰,吴昌凡,余燕,张鹏飞.基于迁移学习与特征融合的眼底图像分类[J].光学精密工程,2021,29(2):388-399. 被引量：10
9齐佳琪,迟呈英,战学刚.基于ERNIE-DPCNN的短文本分类研究[J].电脑编程技巧与维护,2021(4):26-27. 被引量：1
10ZHAO Yuanyuan,GAO Shining,LIU Yang,GONG Xiaohui.Long Text Classification Algorithm Using a Hybrid Model of Bidirectional Encoder Representation from Transformers-Hierarchical Attention Networks-Dilated Convolutions Network[J].Journal of Donghua University(English Edition),2021,38(4):341-350. 被引量：1

1刘畅.浅议翻转课堂的关键特征及其有效实施[J].新教育时代电子杂志（学生版）,2019(3):21-22.
2胡瑞冬.基于循环经济理论下的企业可持续发展研究探析[J].济南职业学院学报,2019,0(3):94-96. 被引量：2
3王守山,李彬,金川,王青,张旻南.基于门控像增强相机的快速液体拉曼检测[J].警察技术,2019(4):58-60. 被引量：1
4唐美丽,胡琼,马廷淮.基于循环神经网络的语音识别研究[J].现代电子技术,2019,42(14):152-156. 被引量：19
5毕殿杰,魏苏林,赵涛,张子振.基于卷积神经网络的在线评论情感分析模型[J].河北科技师范学院学报,2019,33(2):41-47. 被引量：3
6林泽斐,欧石燕.多特征融合的中文命名实体链接方法研究[J].情报学报,2019,38(1):68-78. 被引量：7
7黄河,陈君,邓浩江.基于循环神经网络的Modbus/TCP模糊测试算法[J].计算机工程,2019,45(7):164-169. 被引量：9
8雷李义,艾矫燕,彭婧,姚冬宜.基于深度学习的水面漂浮物目标检测评估[J].环境与发展,2019,31(6):117-120. 被引量：8
9马孟铖,艾斯卡尔.艾木都拉,吐尔地.托合提.基于条件随机场多特征融合的中文地名、机构名实体识别[J].现代计算机,2019,25(12):13-17. 被引量：5
10刘月,翟东海,任庆宁.基于注意力CNLSTM模型的新闻文本分类[J].计算机工程,2019,45(7):303-308. 被引量：20

西北大学学报（自然科学版）

2019年第4期

浏览历史

内容加载中请稍等...

基于循环神经网络变体和卷积神经网络的文本分类方法被引量：19

参考文献8

二级参考文献60

共引文献207

同被引文献173

引证文献19

二级引证文献142

相关作者

相关机构

相关主题

浏览历史

基于循环神经网络变体和卷积神经网络的文本分类方法 被引量：19

参考文献8

二级参考文献60

共引文献207

同被引文献173

引证文献19

二级引证文献142

相关作者

相关机构

相关主题

浏览历史

基于循环神经网络变体和卷积神经网络的文本分类方法被引量：19