融合实体信息的图卷积神经网络的短文本分类模型被引量：7

Short text classification based on graph convolutional neural networks with entity information

下载PDF

导出

摘要提出一种融合实体信息的图卷积神经网络模型(ETGCN),用于短文本分类.首先,使用实体链接工具抽取短文本中的实体;然后,利用图卷积神经网络对文档、实体和单词进行建模,丰富文本的潜在语义特征;将学习到的单词节点表示与BERT词嵌入进行拼接,通过双向长短期记忆网络,进一步挖掘文本上下文语义特征,再与图神经网络模型得到的文本特征进行融合,用于分类.实验结果表明,该模型在数据集AGNews、R52和MR上的分类准确率分别为88.38%、93.87%和82.87%,优于大部分主流的基线方法. An entity information fused graph convolutional neural network model(ETGCN)is proposed for short text classificaion.Firstly,the entities in the short text are extracted by the entity link tool.And then,the text,entities and words are modeled by the graph convolutional neural network to enrich the latent semantic features of the text.After that,the learned node representation of the word and the BERT word embedding are spliced and fed to the bidirectional long and short-term memory network to further mine the semantic features of the text context.The semantic features of the text context are merged with the text features obtained by the graph neural network model.The fusion features are used for the classification of the short text.The experimental results show that the classification accuracy of the model on data sets of AGNews,R52 and MR is 88.38%,93.87%and 82.87%,respectively,which is better than other mainstream baseline methods.

作者王佳宇李楹马春梅吴东昊姜丽芬 WANG Jiayu;LI Ying;MA Chunmei;WU Donghao;JIANG Lifen(College of Computer and Information Engineering,Tianjin Normal University,Tianjin 300387,China)

机构地区天津师范大学计算机与信息工程学院

出处《天津师范大学学报（自然科学版）》 CAS 北大核心 2023年第1期67-72,共6页 Journal of Tianjin Normal University：Natural Science Edition

基金国家自然科学基金资助项目(61902282) 天津市自然科学基金重点项目(18JCYBJC8900,18JCQNJC70200,20JCZDJC000) 天津市教委科研计划资助项目(2018KJ155) 天津市科技发展基金资助项目(JW1702) 广东省科技计划资助项目(2017KQNCX194)。

关键词短文本分类实体信息图卷积神经网络 short text classification entity information graph convolutional neural networks

分类号 TP391.1 [自动化与计算机技术—计算机应用技术] TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1杨世刚,刘勇国.融合语料库特征与图注意力网络的短文本分类方法[J].计算机应用,2022,42(5):1324-1329. 被引量：3
2李新福,赵蕾蕾,何海斌,李芳.使用Logistic回归模型进行中文文本分类[J].计算机工程与应用,2009,45(14):152-154. 被引量：10

二级参考文献17

1邹娟,周经野,邓成.一种基于语义分析的中文特征值提取方法[J].计算机工程与应用,2005,41(36):164-166. 被引量：6
2谈文蓉,符红光,刘莉,杨宪泽.一种基于贝叶斯分类与机读词典的多义词排歧方法[J].计算机应用,2006,26(6):1389-1391. 被引量：5
3Rennie J D M,Shih L,Teevan J,et al.Tackling the poor assumptions of Naive Bayes text classifiers [C]//Proceedings of the Twentieth International Conference on Machine Learning,2003,2:616-623.
4Chiang J H,Chen Y C.Hierarchical fuzzy-KNN networks for news documents categorization[C]//lOth IEEE International Conference on Fuzzy Systems,2001(2) :720-723.
5Sebastiani F,Nazionale C,Valdambrini N.An improved boosting algorithm and its application to text categorization[C]//Proceedings of the Ninth International Conference on Information and Knowledge Management, 2000: 78-85.
6Zhang Hao,Berg A C,Maire M,et al.SVM-KNN:Discriminative nearest neighbor classification for visual category recognition[C]// IEEE Computer Society Conference on HHComputer Vision and Pattern Recognition, 2006 : 2126-2136.
7Yang Y.An evaluaton of statistical approaches to text categorization[J].Information Retrieval, 1999,1 ( 1 ) : 76-78.
8Komarek P,Moore A.Fast robust logistic regression for large sparse datasets with binary outputs[C]//Proceedings of the Ninth International Workshop on Artifical Intelligence and Statistics,2003:197-204.
9Keerth S S,Duan K B,Shevade S K,et al.A fast dual algorithm for kernel logistic regression[J].Machine Learning,2005,61( 1 ) : 151-165.
10Lin C J,Weng R C,Sathiya Keerthi S.Trust region Newton methods for large-scale logistic regression[C]//Proceedings of the 24th International Conference on Machine Learning,2007,3 : 561-568.

共引文献11

1张志武.跨领域迁移学习产品评论情感分析[J].现代图书情报技术,2013(6):49-54. 被引量：6
2万会芳,杜彦璞.K近邻和Logistic回归分类算法比较研究[J].洛阳理工学院学报（自然科学版）,2016,26(3):83-86. 被引量：5
3李平,戴月明,王艳.基于混合卡方统计量与逻辑回归的文本情感分析[J].计算机工程,2017,43(12):192-196. 被引量：17
4马琳琳,刘继.基于关联规则的党的十九大报告关键词相关性分析[J].新疆财经大学学报,2018(2):20-28. 被引量：5
5群诺,贾宏云.基于Logistic回归模型的藏文文本分类研究与实现[J].信息与电脑,2018,30(5):70-73. 被引量：8
6孙瑞.果蝇算法优化粗糙集特征选择的英语翻译方法设计[J].现代科学仪器,2019,0(4):158-160. 被引量：1
7吴晓丽.基于人机交互和特征提取的英汉翻译系统研究[J].微型电脑应用,2020,36(4):126-128. 被引量：5
8李鸣,郭晨皓,陈星.视觉类深度神经网络的自动标注[J].计算机应用,2020,40(6):1593-1600. 被引量：1
9白子诚,周艳玲,张龑.GM-FastText多通道词向量短文本分类模型[J].计算机系统应用,2022,31(9):403-408. 被引量：1
10刘嘉宇,李贺,沈旺,祝琳琳,李世钰.融合多源异构在线评论的开放式创新社区创意采纳预测研究[J].情报学报,2024,43(1):48-60.

同被引文献61

1邵权熙,刘慧.《中国林业年鉴》发展之路[J].年鉴信息与研究,2008(5):29-31. 被引量：1
2董青迅,李兴源,张淼,穆子龙,顾威.基于人工神经网络的次同步谐振监测方法[J].电力系统保护与控制,2011,39(9):21-25. 被引量：5
3吴立锋,吴经龙.BP算法学习率自适应性研究[J].大众科技,2011,13(12):16-18. 被引量：4
4韩轲.基于BP神经网络的教学质量评价模型研究[J].计算机与现代化,2013(1):45-46. 被引量：7
5周帅,张凤生,李富才.基于小波变换的织物疵点图像特征提取[J].青岛大学学报（工程技术版）,2013,28(2):53-59. 被引量：6
6宋克臣,颜云辉,陈文辉,张旭.局部二值模式方法研究与展望[J].自动化学报,2013,39(6):730-744. 被引量：111
7陈红,夏青,左婷,谭鹤群,边银丙.基于纹理分析的香菇品质分选方法[J].农业工程学报,2014,30(3):285-292. 被引量：28
8汪敏,王亦红.神经网络在织物疵点分类识别中的应用[J].计算机工程与设计,2016,37(1):221-225. 被引量：7
9张建强,高世家,赵霁红.舰船RCS特征提取与GA-BP神经网络分类研究[J].舰船科学技术,2016,38(2):125-130. 被引量：7
10王健,高媛,秦品乐,王丽芳.基于改进的LBP算法的三维人脸识别[J].计算机工程与设计,2016,37(12):3366-3370. 被引量：6

引证文献7

1孙红蕊,周星亚,原义豪,木也塞尔·努热合买提,夏克尔·赛塔尔.基于LBP和神经网络的织物疵点分类[J].服饰导刊,2023,12(3):110-120.
2王治学.融合实体信息的图卷积神经网络的短文本分类模型分析[J].信息系统工程,2023(9):122-125. 被引量：1
3周则旭,韩红旗,张均胜,周潇,徐紫燕.基于通用信息抽取模型的年鉴大事记知识图谱构建研究——以林业大事记知识图谱为例[J].档案学研究,2023(5):140-148.
4王治学.基于图卷积神经网络的主题模型文本分类探究[J].科技创新与应用,2023,13(36):83-86.
5郭小磊,张吴波.基于短文本扩展和特征融合的市民热线文本分类[J].山西大同大学学报（自然科学版）,2024,40(1):42-47. 被引量：1
6袁泉,陈昌平,陈泽,詹林峰.基于BERT的两次注意力机制远程监督关系抽取[J].计算机应用,2024,44(4):1080-1085.
7徐克圣,毛寅辉,陈胜男.基于转折词的图卷积短语音-短文本模态转换的分类方法[J].信息技术与信息化,2024(5):31-35.

二级引证文献2

1张德银,黄少晗,赵志恒,李俊佟,张裕尧.基于融合神经网络的飞机蒙皮缺陷检测的研究[J].成都大学学报（自然科学版）,2023,42(4):365-371. 被引量：1
2李志明,毕林丰.“接诉即办”:朝向高质量为民服务的基层治理创新[J].行政管理改革,2024(3):52-59.

1李清宇,谭理文.新型链接运行技术对数字经济主体的影响与规制[J].北京政法职业学院学报,2022(3):75-81.
2无线世界[J].少年电脑世界,2023(1).
3王玉,卞学华.4C理念下的高中英语读写结合教学[J].江苏教育,2023(3):79-80.
4郭梦昕.用于不平衡节点分类的集成图神经网络模型[J].现代信息科技,2023,7(3):29-32. 被引量：1
5连晓颖,薛源海,刘悦,沈华伟.标题与正文语义融合的新闻向量表示方法[J].计算机工程与应用,2023,59(4):89-96.
6刘聪,万根顺,高建清,付中华.基于韵律特征辅助的端到端语音识别方法[J].计算机应用,2023,43(2):380-384.
7何沁玮,李学俊,廖竞.基于图卷积网络的交通路口流量预测模型[J].计算机应用研究,2023,40(2):440-444. 被引量：1
8孙晓飞,朱静远,陈斌,游恒志.融合多模态数据的药物合成反应的虚拟筛选[J].计算机应用,2023,43(2):622-629.

天津师范大学学报（自然科学版）

2023年第1期

浏览历史

内容加载中请稍等...

融合实体信息的图卷积神经网络的短文本分类模型被引量：7

参考文献2

二级参考文献17

共引文献11

同被引文献61

引证文献7

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

融合实体信息的图卷积神经网络的短文本分类模型 被引量：7

参考文献2

二级参考文献17

共引文献11

同被引文献61

引证文献7

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

融合实体信息的图卷积神经网络的短文本分类模型被引量：7