基于改进型图神经网络的学术论文分类模型被引量：4

Classification Model for Scholarly Articles Based on Improved Graph Neural Network

导出

摘要【目的】解决传统图神经网络的过平滑问题,实现图神经网络不同深度和不同邻居的权重自适应分配,提高学术论文分类的性能。【方法】提出一种基于多头注意力机制和残差网络结构的改进型图神经网络学术论文分类模型。首先,基于多头注意力机制学习文献间多种关联特征,实现不同邻居节点权重的自适应分配;然后,基于残差网络结构聚合模型每层节点的输出,为模型提供自适应性聚合半径的学习机制;最后,基于改进型图神经网络学习论文引用关系图中每个节点的特征表示,将该特征输入多层全连接网络中得到最终分类结果。【结果】在大规模真实数据集上的实验结果表明,该模型准确率达到0.61,比图卷积神经网络和Transformer模型的准确率分别高出0.04和0.14。【局限】对小类别样本和难于区分的样本分类准确率不高。【结论】改进的图神经网络能够有效避免过平滑问题,实现不同权重的自适应分配。 [Objective]This paper tries to address the over-smoothing issues of the traditional graph neural network,and then realizes the weight adaptive allocation of different depths and neighbors,aiming to improve the performance of academic literature classification.[Methods]We proposed an improved graph neural network model for academic paper classification.First,with the help of multi-head attention mechanism,the new model learned a variety of related features among documents,and adaptively distributing the weights of different neighbor nodes.Then,based on the residual network structure,the model aggregated outputs of each layer node,and provided the learning of adaptive aggregation radius.Finally,with the help of improved graph neural network,the model learned feature representation of each node in the paper citation graph,which was input into the multilayer fully connected network to obtain the final classification.[Results]We examined our model on large-scale real datasets.The accuracy of our model reached 0.61,which is 0.04 and 0.14 higher than those of the GCN and Transformer models.[Limitations]More research is needed to improve the classification accuracy of small categories and difficult to distinguish samples.[Conclusions]The improved graph neural network can effectively conduct classification for academic articles.

作者黄学坚刘雨飏马廷淮 Huang Xuejian;Liu Yuyang;Ma Tinghuai(College of Computer and Software,Nanjing University of Information Science&Technology,Nanjing 210044,China;VR College of Modern Industry,Jiangxi University of Finance and Economics,Nanchang 330013,China;College of Humanities,Jiangxi University of Finance and Economics,Nanchang 330013,China)

机构地区南京信息工程大学计算机与软件学院江西财经大学虚拟现实现代产业学院江西财经大学人文学院

出处《数据分析与知识发现》 CSSCI CSCD 北大核心 2022年第10期93-102,共10页 Data Analysis and Knowledge Discovery

基金国家重点研发计划(项目编号:2021YFE0104400) 江西省高校人文社会科学研究项目(项目编号:JY21253) 江西省教育科学“十四五”规划2021年度青年专项课题(项目编号:21QN012)的研究成果之一。

关键词图神经网络注意力机制残差网络深度学习论文分类文本分类 Graph Neural Network Attention Mechanism Residual Network Deep Learning Paper Classification Text Classification

分类号 G202 [文化科学—传播学] TP319 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献15

1章成志,李卓,储荷婷.基于全文内容的学术论文研究方法自动分类研究[J].情报学报,2020,39(8):852-862. 被引量：25
2武永亮,赵书良,李长镜,魏娜娣,王子晏.基于TF-IDF和余弦相似度的文本分类方法[J].中文信息学报,2017,31(5):138-145. 被引量：97
3廖列法,勒孚刚,朱亚兰.LDA模型在专利文本分类中的应用[J].现代情报,2017,37(3):35-39. 被引量：43
4刘浏,王东波.基于论文自动分类的社科类学科跨学科性研究[J].数据分析与知识发现,2018,2(3):30-38.
5董放,刘宇飞,周源.基于LDA-SVM论文摘要多分类新兴技术预测[J].情报杂志,2017,36(7):40-45. 被引量：34
6王昊,叶鹏,邓三鸿.机器学习在中文期刊论文自动分类研究中的应用[J].现代图书情报技术,2014(3):80-87. 被引量：30
7薛峰,胡越,夏帅,许剑东.基于论文标题和摘要的短文本分类研究[J].合肥工业大学学报（自然科学版）,2018,41(10):1343-1349. 被引量：6
8吕璐成,韩涛,周健,赵亚娟.基于深度学习的中文专利自动分类方法研究[J].图书情报工作,2020,64(10):75-85. 被引量：23
9邓三鸿,傅余洋子,王昊.基于LSTM模型的中文图书多标签分类研究[J].数据分析与知识发现,2017,1(7):52-60. 被引量：27
10徐彤阳,尹凯.基于深度学习的数字图书馆文本分类研究[J].情报科学,2019,0(10):13-19. 被引量：32

二级参考文献112

1王杨,许闪闪,李昌,艾世成,张卫东,甄磊,孟丹.基于支持向量机的中文极短文本分类模型[J].计算机应用研究,2020,37(2):347-350. 被引量：30
2靳小波.文本分类综述[J].自动化博览,2006,23(z1):24-29. 被引量：16
3王细薇,樊兴华,赵军.一种基于特征扩展的中文短文本分类方法[J].计算机应用,2009,29(3):843-845. 被引量：36
4包剑,冀常鹏,李义杰.基于矢量空间模型的文本自动分类系统研究[J].计算机系统应用,2005,14(3):47-49. 被引量：6
5夏天,樊孝忠,刘林.利用JNI实现ICTCLAS系统的Java调用[J].计算机应用,2004,24(B12):177-178. 被引量：24
6陈立孚,周宁,李丹.基于机器学习的自动文本分类模型研究[J].现代图书情报技术,2005(10):23-27. 被引量：9
7郭炜强,戴天,文贵华.基于领域知识的专利自动分类[J].计算机工程,2005,31(23):52-54. 被引量：17
8穆荣平,任中保,袁思达,乔岩.中国未来20年技术预见德尔菲调查方法研究[J].科研管理,2006,27(1):1-7. 被引量：54
9李程雄,丁月华,文贵华.SVM-KNN组合改进算法在专利文本分类中的应用[J].计算机工程与应用,2006,42(20):193-195. 被引量：23
10苏金树,张博锋,徐昕.基于机器学习的文本分类技术研究进展[J].软件学报,2006,17(9):1848-1859. 被引量：387

共引文献333

1高原,施元磊,张蕾,曹天奕,冯筠.基于游记文本的游客游览行程重构[J].数据分析与知识发现,2020,4(2):165-172. 被引量：5
2龚丽娟,王昊,张紫玄,朱立平.Word2Vec对海关报关商品文本特征降维效果分析[J].数据分析与知识发现,2020,4(2):89-100. 被引量：7
3周波,冷伏海.技术识别研究进展[J].情报学进展,2022(1):315-348. 被引量：5
4吕璐成,罗文馨,许景龙,王莉莉,马丽婧,赵亚娟.专利情报方法、工具、应用研究进展及新技术应用趋势[J].情报学进展,2020(1):235-278. 被引量：9
5张兆滨,王素格,陈鑫,赵琳玲,王典.阅读理解中观点类问题的扩展研究[J].中文信息学报,2020(6):89-96. 被引量：2
6马心儒,丁伟.用户行为数据统计的案例分析[J].电子技术（上海）,2021,50(8):180-181.
7张普.小旋风M-900MK Ⅱ音箱[J].实用影音技术,2000(3):31-32.
8马宾,殷立峰.一种基于Hadoop平台的并行朴素贝叶斯网络舆情快速分类算法[J].现代图书情报技术,2015(2):78-84. 被引量：16
9李湘东,巴志超,高凡.数字文本自动分类中特征语义关联及加权策略研究综述与展望[J].现代图书情报技术,2016(9):17-26. 被引量：5
10耿思,李宁,赵林.参考文献格式规范性检测方法研究[J].北京信息科技大学学报（自然科学版）,2017,32(1):44-49.

同被引文献47

1侯汉清,黄刚.电子计算机与文献分类[J].现代图书情报技术,1982(1):5-14. 被引量：10
2李珩,朱靖波,姚天顺.基于Stacking算法的组合分类器及其应用于中文组块分析[J].计算机研究与发展,2005,42(5):844-848. 被引量：18
3李寿山,黄居仁.基于Stacking组合分类方法的中文情感分类研究[J].中文信息学报,2010,24(5):56-61. 被引量：43
4庞观松,蒋盛益.文本自动分类技术研究综述[J].情报理论与实践,2012,35(2):123-128. 被引量：33
5周丽红,刘勘.基于关联规则的科技文献分类研究[J].图书情报工作,2012,56(4):12-16. 被引量：9
6王方,阮梅花,朱海刚,熊燕,缪有刚.基于向量空间模型的科技文献自动分类研究[J].情报探索,2013(12):1-3. 被引量：5
7王昊,叶鹏,邓三鸿.机器学习在中文期刊论文自动分类研究中的应用[J].现代图书情报技术,2014(3):80-87. 被引量：30
8蒋昂波,王维维.ReLU激活函数优化研究[J].传感器与微系统,2018,37(2):50-52. 被引量：103
9刘浏,王东波.基于论文自动分类的社科类学科跨学科性研究[J].数据分析与知识发现,2018,2(3):30-38.
10谢红玲,奉国和,何伟林.基于深度学习的科技文献语义分类研究[J].情报理论与实践,2018,41(11):149-154. 被引量：10

引证文献4

1王卫军,宁致远,杜一,周园春.基于多标签分类的科技文献学科交叉研究性质识别[J].数据分析与知识发现,2023,7(1):102-112. 被引量：5
2安波.结构信息增强的文献分类方法研究[J].农业图书情报学报,2023,35(3):15-24.
3贾启龙,张仰森,刘帅康,朱思文,高强.学术论文学科领域层次标签分类方法[J].北京信息科技大学学报（自然科学版）,2024,39(1):42-48.
4刘爱琴,郭少鹏.基于Stacking模型的学术论文多标签分类系统构建[J].国家图书馆学刊,2024,33(2):96-104.

二级引证文献5

1刘爱琴,郭少鹏,张卓星.基于LDA模型融合Catboost算法的文本自动分类系统设计与实现[J].国家图书馆学刊,2023,32(5):84-92. 被引量：2
2江天明,郑国杰,王晴,曹高辉.面向投稿选刊的学术论文多标签分类研究[J].现代情报,2024,44(1):48-56.
3刘勘,游美琳,卫兰茜.基于层次标签结构的标记分布学习[J].数据分析与知识发现,2024,8(2):44-55.
4陈帅朴,钱宇星,钱志强,刘政昊,张志剑.多重特征关联和图注意力网络融合的文献分类方法研究——以中文医学文献为例[J].情报学报,2024,43(4):470-490.
5安波.基于提示学习的小样本文献分类方法[J].图书馆论坛,2024,44(5):96-104. 被引量：1

1作者书写论文分类号须知[J].青岛大学学报（医学版）,2022,58(5):707-707.
2作者书写论文分类号须知[J].青岛大学学报（医学版）,2022,58(3):378-378.
3作者书写论文分类号须知[J].青岛大学学报（医学版）,2022,58(4):606-606.
4田志宏,赵金东,李绍凯,侯延琛,韩双志,赵相福.基于节点权重的DPoS共识算法[J].应用科学学报,2022,40(4):639-652. 被引量：5
5参考文献引用要求[J].华南国防医学杂志,2022,36(9):746-746.

数据分析与知识发现

2022年第10期

浏览历史

内容加载中请稍等...

基于改进型图神经网络的学术论文分类模型被引量：4

参考文献15

二级参考文献112

共引文献333

同被引文献47

引证文献4

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于改进型图神经网络的学术论文分类模型 被引量：4

参考文献15

二级参考文献112

共引文献333

同被引文献47

引证文献4

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于改进型图神经网络的学术论文分类模型被引量：4