一种基于多元数据融合的引文网络知识表示方法被引量：6

A Knowledge Representation Method for Citation Network Based on Multi-data Fusion

下载PDF

导出

摘要 [目的/意义]有效融合引文网络中的引用关系和文本属性等多元数据,增强文献节点间的语义关联,从而为数据挖掘和知识发现等任务提供有力的支撑。[方法/过程]提出了一种引文网络的知识表示方法,先利用神经网络模型学习引文网络中的k阶邻近结构;然后使用doc2vec模型学习标题、摘要等文本属性;最后给出了基于向量共享的交叉学习机制用于多元数据融合。[结果/结论]通过面向干细胞领域的CNKI引文数据集的测试,在链路预测上取得了较好的性能,证明了方法的有效性和科学性。 [Purpose/significance] Effectively integrate multi-dimensional data such as citation relations and text attributes in citation networks,and enhance the semantic association between document nodes,thus providing powerful support for data mining and knowledge discovery. [Method/process] Propose a knowledge representation method for citation network. Firstly,method uses the neural network model to learn the k-order neighbor structure in the citation network. Then use the doc2 vec model to learn text attributes such as titles and abstracts. Finally,a cross-learning mechanism based on vector sharing is presented for multi-data fusion.[Result/conclusion] Through test of CNKI citation data sets for the stem cell field,get a better performance in link prediction,prove the effectiveness and scientificity of the method.

作者陈文杰许海云 Chen Wenjie

机构地区中国科学院成都文献情报中心

出处《情报理论与实践》 CSSCI 北大核心 2020年第1期150-154,134,共6页 Information Studies:Theory & Application

基金中国科学院“十三五”信息化项目“面向干细胞领域知识发现的科研信息化应用”(项目编号:XXH13506) 中国科学院青年创新促进会项目(项目编号:2016159)的研究成果国家自然科学基金项目“基于科学—技术主题关联分析的创新演化路径识别方法研究”(项目编号:71704170)

关键词引文网络多元数据融合知识表示 word2vec doc2vec citation network multi-data fusion knowledge representation word2vec doc2vec

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1刘知远,孙茂松,林衍凯,谢若冰.知识表示学习研究进展[J].计算机研究与发展,2016,53(2):247-261. 被引量：259
2赵星,谭旻,余小萍,闫现洋,叶鹰.我国文科领域知识扩散之引文网络探析[J].中国图书馆学报,2012,38(5):59-67. 被引量：57
3吴海峰,孙一鸣.引文网络的研究现状及其发展综述[J].计算机应用与软件,2012,29(2):164-168. 被引量：20
4李志宇,梁循,周小平,张海燕,马跃峰.一种大规模网络中基于节点结构特征映射的链接预测方法[J].计算机学报,2016,39(10):1947-1964. 被引量：9

二级参考文献100

1李玉华,肖海岭,李栋才,李瑞轩.基于链接重要性的动态链接预测方法研究[J].计算机研究与发展,2011,48(S3):40-46. 被引量：7
2胡利勇,陈定权.引文分析可视化研究[J].情报杂志,2004,23(11):78-79. 被引量：15
3李运景,侯汉清.引文分析可视化研究[J].情报学报,2007,26(2):301-308. 被引量：59
4Miller G A. WordNet: A lexical database for English [J]. Communications of the ACM, 1995, 38(11): 39-41.
5Bollacker K, Evans C, Paritosh P, et al. Freebase: A collaboratively created graph database for structuring human knowledge [C] //Proe of KDD. New York: ACM, 2008: 1247-1250.
6Miller E. An introduction to the resource description framework [J]. Bulletin of the American Society for Information Science and Technology, 1998, 25(1): 15-19.
7Bengio Y. Learning deep architectures for AI [J]. Foundations and Trends in Machine Learning, 2099, 2 (1) 1-127.
8Bengio Y, Courville A, Vincent P. Representation learning: A review and new perspectives [J]. IEEE Trans on Pattern Analysis and Machine Intelligence, 2013, 35(8): 1798-1828.
9Turian J, Ratinov L, Bengio Y. Word representations: A simple and general method for semi-supervised learning [C]// Proc of ACL. Stroudsburg, PA: ACL, 2010:384-394.
10Manning C D, Raghavan P, Schutze H. Introduction to Information Retrieval [M]. Cambridge, UK: Cambridge University Press, 2008.

共引文献339

1余传明,李浩男,王曼怡,黄婷婷,安璐.基于深度学习的知识表示研究:网络视角[J].数据分析与知识发现,2020,4(1):63-75.
2张骁雄,杨琴琴,何浩然,丁鲲.面向俄乌冲突的时序知识图谱推理系统设计与实现[J].网络安全与数据治理,2023,42(S01):157-162.
3赵晓函,周子力,李天宇,陈丹华,王凯莉.一种基于IC参数的知识图谱嵌入方法[J].中文信息学报,2021,35(10):48-55.
4詹威威,程序,蔡惠民,刘汪洋,王彬,余正涛.基于综合影响力模型的改进EvolveKG方法及应用研究[J].计算机应用研究,2020,37(S01):159-162.
5阿布都克力木·阿布力孜,张雨宁,阿力木江·亚森,郭文强,哈里旦木·阿布都克里木.预训练语言模型的扩展模型研究综述[J].计算机科学,2022,49(S02):43-54. 被引量：11
6Qiang Liu,Jorge Gulín-González,Yunwei Chen.A citation iteration method for publications and scientists evaluation[J].Data Science and Informetrics,2021,1(2):100-109. 被引量：3
7郝卫,魏赟.基于知识图谱表示学习的推荐算法优化[J].智能计算机与应用,2020,10(4):22-26. 被引量：3
8甘惟,吴志强,王元楷,徐浩文,严娟,何珍,赵紫辰.AIGC辅助城市设计的理论模型建构[J].城市规划学刊,2023(2):12-18. 被引量：15
9许升健.年薪制的困惑[J].金山企业管理,2000(1):40-41.
10李江.基于引文的知识扩散研究评述[J].情报资料工作,2013,34(4):36-40. 被引量：42

同被引文献72

1史聪灵,车洪磊,李源,何竞择.基于多数据融合的城市轨道交通客流监测系统研究[J].中国安全生产科学技术,2019,15(S01):5-9. 被引量：15
2常智勇,黄一波,万能,赵杰.零件工艺知识建模及其相似性度量方法研究[J].机械科学与技术,2015,34(6):892-897. 被引量：2
3李峰,刘静延,蒋录全.预测方法的发展及最新动态[J].情报杂志,2005,24(6):76-77. 被引量：10
4秦雅楠,由丽萍,董文博,裴夏璇.一种基于框架的情境知识表示方法[J].情报杂志,2011,30(1):155-158. 被引量：4
5王体春,卜良峰,王威.基于知识重用的产品方案设计多级实例推理模型[J].计算机集成制造系统,2011,17(3):571-576. 被引量：18
6李国杰,程学旗.大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考[J].中国科学院院刊,2012,27(6):647-657. 被引量：1605
7李直旭,沈永新,陈嘉,刘安,赵朋朋,赵雷.基于词共现图的属性知识库迭代自增式扩展算法[J].模式识别与人工智能,2018,31(12):1143-1150. 被引量：2
8张斌,马费成.科学知识网络中的链路预测研究述评[J].中国图书馆学报,2015,41(3):99-113. 被引量：60
9隗玲,许海云,郭婷,方曙.基于弱共现和突发监测的情报学学科研究主题及交叉性分析[J].图书情报工作,2015,59(21):105-114. 被引量：20
10张金柱,韩涛,王小梅.作者-关键词二分网络中的合著关系预测研究[J].图书情报工作,2016,60(21):74-80. 被引量：17

引证文献6

1牌艳欣,李长玲,徐璐.弱引文关系视角下跨学科相关知识组合识别方法探讨——以情报学为例[J].图书情报工作,2020,64(21):111-119. 被引量：24
2曹志鹏,潘定,潘启亮.基于表示学习的双层知识网络链路预测[J].情报学报,2021,40(2):135-144. 被引量：11
3祝勇仁.成衣制造工艺知识可拓表示与实例推理应用研究[J].北京服装学院学报（自然科学版）,2021,41(2):56-63. 被引量：3
4李秀峰,王崇霞.基于多信息融合的光纤网络威胁智能感知方法[J].激光杂志,2021,42(10):138-142. 被引量：5
5张伟华,王海英.基于B-CNN模型的异构网络大数据知识扩充算法研究[J].兵器装备工程学报,2022,43(6):290-294. 被引量：1
6王磊,陈磊,张明儒,魏敏,李晋先.面向数据库查询的非结构化数据融合存储系统[J].电子设计工程,2022,30(24):148-152. 被引量：1

二级引证文献45

1杜德慧,刘超.基于引用的潜在跨学科知识组合识别方法探究[J].知识管理论坛,2022(4):407-416. 被引量：1
2Changling Li,Guoyang Rong,Yanxin Pai,Dehui Du,Lu Xu,Qingqing Fan,Fuzhong Xiang.Research on identification of potential knowledge growth points in information science[J].Data Science and Informetrics,2021,1(2):79-99.
3谭晓,李辉,许海云.基于多维数据知识内容和关联深层融合的知识发现研究综述[J].科技情报研究,2021,3(4):58-68. 被引量：13
4赵海燕,杜丽娟,刘琨,王廷梅,刘建国.基于深度学习的情感类文本数据蕴含关系识别方法[J].电子技术与软件工程,2021(20):138-139.
5迟玉琢.2020年我国情报学研究进展[J].山东图书馆学刊,2021(6):17-22. 被引量：1
6张宇,郭文忠,林森,文朝武,龙洁花.深度学习与知识推理相结合的研究综述[J].计算机工程与应用,2022,58(1):56-69. 被引量：6
7李长玲,牌艳欣,荣国阳,范晴晴,郭凤娇.基于社交媒体弱关系的跨学科相关知识组合识别[J].情报理论与实践,2022,45(3):125-132. 被引量：9
8荣国阳,李长玲,范晴晴,栾锟.基于生命周期理论的跨学科知识生长点识别——以引文分析领域为例[J].情报理论与实践,2022,45(6):9-16. 被引量：9
9荣国阳,李长玲,范晴晴,申力旭.基于多路径分析的跨学科潜在知识组合识别——以引文分析领域为例[J].情报理论与实践,2022,45(6):17-23. 被引量：4
10刘丽帆,张恒,章成志.基于学术文献引文内容的跨学科知识流动研究[J].情报理论与实践,2022,45(6):24-31. 被引量：13

1孙静.期待视野:为阅读教学有效助力[J].小学语文教学,2019,0(27):9-12.
2王红迁,汪鹏,王飞,黄荣,李理,黄艺璠.多元数据融合的临床辅助决策系统的研究与应用[J].中国数字医学,2019,14(11):18-20. 被引量：9
3王爱丽,赵元,王子腾,于士尧,孙喜利.城市轨道交通客流信息智能检测与管控系统研究与设计[J].铁路计算机应用,2020,29(2):68-72. 被引量：8
4林雨谷,王艳.离散车间能效数据挖掘及调度优化[J].系统仿真学报,2019,31(12):2702-2711. 被引量：3
5王凯,李星,兰巨龙,卫红权,刘树新.一种基于资源传输路径拓扑有效性的链路预测方法[J].电子与信息学报,2020,42(3):653-660. 被引量：14
6王春,周建军,章顺壮.腹膜后原始神经外胚层肿瘤的MRI表现[J].实用肿瘤杂志,2019,34(6):550-554. 被引量：3
7田满鑫,寿黎但,陈珂,江大伟,陈刚.一种基于实体时间敏感度的知识表示方法[J].软件工程,2020,23(1):1-6. 被引量：5
8赵星,李书宁,肖亚男.数字人文视域下基于多源数据融合的人物专题数据库建设——以上海图书馆2018开放数据应用开发竞赛作品“树人者”为例[J].图书馆杂志,2019,38(12):45-51. 被引量：19
9岳增慧,许海云,王倩飞.基于局部信息相似性的学科引证知识扩散动态链路预测研究[J].情报理论与实践,2020,43(2):84-91. 被引量：11
10郭永华.螺旋CT对肺磨玻璃结节定性诊断的临床价值[J].世界复合医学,2019,5(12):192-195. 被引量：5

情报理论与实践

2020年第1期

浏览历史

内容加载中请稍等...

一种基于多元数据融合的引文网络知识表示方法被引量：6

参考文献4

二级参考文献100

共引文献339

同被引文献72

引证文献6

二级引证文献45

相关作者

相关机构

相关主题

浏览历史

一种基于多元数据融合的引文网络知识表示方法 被引量：6

参考文献4

二级参考文献100

共引文献339

同被引文献72

引证文献6

二级引证文献45

相关作者

相关机构

相关主题

浏览历史

一种基于多元数据融合的引文网络知识表示方法被引量：6