知识图谱嵌入中的自适应筛选被引量：2

Knowledge graph embedding with adaptive sampling

导出

摘要针对知识图谱数据类别不平衡与训练难度不同,随机进行训练数据采样可能导致嵌入模型不能快速收敛的问题,提出了一种自适应的筛选训练数据方法。对训练数据按照关系类别进行分组,采样过程中首先根据概率选择关系类别,然后从选定的分组中随机选择一个实例进行训练。根据训练效果对每组实例被选择的概率进行自适应调整。实验结果表明:自适应的分组筛选在链接预测任务上取得了更好的结果,使嵌入模型更快、更好地收敛。 Due to the imbalance of KG data and the difficulty of training,that random sampling of training data may make it difficult for embedded models to converge rapidly. Therefore,in this paper,an adaptive method for sampling of training data is proposed. The training data are grouped according to the different relationships. In the sampling process,a group is determined according to the probability,and then an instance is randomly selected from the determined group for training. At the same time,according to the training effect,the probability of each selected instance is adjusted adaptively. Experimental results show that adaptive grouping filter achieves better results in link prediction tasks,and enables the embedded model to converge faster and better.

作者欧阳丹彤马骢雷景佩冯莎莎 OUYANG Dan-tong;MA Cong;LEI Jing-pei;FENG Sha-sha(College of Computer Science and Technology Jilin University,Changchun 130012,China;Symbolic Computation and Knowledge Engineering of Ministry of Education,Jilin University Changchun 130012,China)

机构地区吉林大学计算机科学与技术学院吉林大学符号计算与知识工程教育部重点实验室

出处《吉林大学学报（工学版）》 EI CAS CSCD 北大核心 2020年第2期685-691,共7页 Journal of Jilin University:Engineering and Technology Edition

基金国家自然科学基金项目(61872159,61672261,61502199).

关键词人工智能知识图谱嵌入基于翻译的嵌入模型自适应筛选链接预测 artificial intelligence knowledge graph embedding translation-based embedding models adaptive sampling link prediction

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1刘知远,孙茂松,林衍凯,谢若冰.知识表示学习研究进展[J].计算机研究与发展,2016,53(2):247-261. 被引量：257
2刘峤,韩明皓,杨晓慧,刘瑶,吴祖峰.基于表示学习和语义要素感知的关系推理算法[J].计算机研究与发展,2017,54(8):1682-1692. 被引量：12

二级参考文献85

1Miller G A. WordNet: A lexical database for English [J]. Communications of the ACM, 1995, 38(11): 39-41.
2Bollacker K, Evans C, Paritosh P, et al. Freebase: A collaboratively created graph database for structuring human knowledge [C] //Proe of KDD. New York: ACM, 2008: 1247-1250.
3Miller E. An introduction to the resource description framework [J]. Bulletin of the American Society for Information Science and Technology, 1998, 25(1): 15-19.
4Bengio Y. Learning deep architectures for AI [J]. Foundations and Trends in Machine Learning, 2099, 2 (1) 1-127.
5Bengio Y, Courville A, Vincent P. Representation learning: A review and new perspectives [J]. IEEE Trans on Pattern Analysis and Machine Intelligence, 2013, 35(8): 1798-1828.
6Turian J, Ratinov L, Bengio Y. Word representations: A simple and general method for semi-supervised learning [C]// Proc of ACL. Stroudsburg, PA: ACL, 2010:384-394.
7Manning C D, Raghavan P, Schutze H. Introduction to Information Retrieval [M]. Cambridge, UK: Cambridge University Press, 2008.
8Mikolov T, Sutskever I, Chen K, et al. Distributed representations of words and phrases and their eompositionality [C] //Proe of NIPS. Cambridge, MA: MIT Press, 2013:3111-3119.
9Zhao Y, Liu Z, Sun M. Phrase type sensitive tensor indexing model for semantic composition [C] //Proc of AAAI. Menlo Park, CA: AAAI, 2015: 2195-2202.
10Zhao Y, Liu Z, Sun M. Representation learning for measuring entity relatedness with rich information [C] //Proc of IJCAI. San Francisco, CA: Morgan Kaufmann, 2015: 1412-1418.

共引文献263

1余传明,李浩男,王曼怡,黄婷婷,安璐.基于深度学习的知识表示研究:网络视角[J].数据分析与知识发现,2020,4(1):63-75.
2张骁雄,杨琴琴,何浩然,丁鲲.面向俄乌冲突的时序知识图谱推理系统设计与实现[J].网络安全与数据治理,2023,42(S01):157-162.
3赵晓函,周子力,李天宇,陈丹华,王凯莉.一种基于IC参数的知识图谱嵌入方法[J].中文信息学报,2021,35(10):48-55.
4詹威威,程序,蔡惠民,刘汪洋,王彬,余正涛.基于综合影响力模型的改进EvolveKG方法及应用研究[J].计算机应用研究,2020,37(S01):159-162.
5阿布都克力木·阿布力孜,张雨宁,阿力木江·亚森,郭文强,哈里旦木·阿布都克里木.预训练语言模型的扩展模型研究综述[J].计算机科学,2022,49(S02):43-54. 被引量：6
6郝卫,魏赟.基于知识图谱表示学习的推荐算法优化[J].智能计算机与应用,2020,10(4):22-26. 被引量：3
7甘惟,吴志强,王元楷,徐浩文,严娟,何珍,赵紫辰.AIGC辅助城市设计的理论模型建构[J].城市规划学刊,2023(2):12-18. 被引量：10
8许升健.年薪制的困惑[J].金山企业管理,2000(1):40-41.
9王春凯,冯键.跨界数据融合在保险行业中的应用[J].保险理论与实践,2019,0(3):38-50.
10徐增林,盛泳潘,贺丽荣,王雅芳.知识图谱技术综述[J].电子科技大学学报,2016,45(4):589-606. 被引量：488

同被引文献10

1刘知远,孙茂松,林衍凯,谢若冰.知识表示学习研究进展[J].计算机研究与发展,2016,53(2):247-261. 被引量：257
2徐增林,盛泳潘,贺丽荣,王雅芳.知识图谱技术综述[J].电子科技大学学报,2016,45(4):589-606. 被引量：488
3姜枫,顾庆,郝慧珍,李娜,郭延文,陈道蓄.基于内容的图像分割方法综述[J].软件学报,2017,28(1):160-183. 被引量：129
4方阳,赵翔,谭真,杨世宇,肖卫东.一种改进的基于翻译的知识图谱表示方法[J].计算机研究与发展,2018,55(1):139-150. 被引量：50
5陈晓军,向阳.STransH:一种改进的基于翻译模型的知识表示模型[J].计算机科学,2019,46(9):184-189. 被引量：14
6朱艳丽,杨小平,王良,张志宇.TransRD：一种不对等特征的知识图谱嵌入表示模型[J].中文信息学报,2019,33(11):73-82. 被引量：8
7陈文杰,文奕,张鑫,杨宁,赵爽.一种改进的基于TransE知识图谱表示方法[J].计算机工程,2020,46(5):63-69. 被引量：13
8Yunhe Pan.Multiple Knowledge Representation of Artificial Intelligence[J].Engineering,2020,6(3):216-217. 被引量：13
9饶官军,古天龙,常亮,宾辰忠,秦赛歌,宣闻.基于相似性负采样的知识图谱嵌入[J].智能系统学报,2020,15(2):218-226. 被引量：6
10王会勇,论兵,张晓明,孙晓领.基于联合知识表示学习的多模态实体对齐[J].控制与决策,2020,35(12):2855-2864. 被引量：15

引证文献2

1张正航,钱育蓉,行艳妮,赵鑫.基于TransE的表示学习方法研究综述[J].计算机应用研究,2021,38(3):656-663. 被引量：6
2张正航,钱育蓉,行艳妮,赵鑫.知识表示学习方法研究综述[J].计算机应用研究,2021,38(4):961-967. 被引量：8

二级引证文献14

1刘巍,陈霄,陈静,周觐,张斌.知识图谱技术研究[J].指挥控制与仿真,2021,43(6):6-13. 被引量：9
2焦守龙,段友祥,孙歧峰,庄子浩,孙琛皓.融合实体描述信息和邻居节点特征的知识表示学习方法[J].计算机应用,2022,42(4):1050-1056. 被引量：1
3高茂,张丽萍.融合多模态资源的教育知识图谱的内涵、技术与应用研究[J].计算机应用研究,2022,39(8):2257-2267. 被引量：14
4胡瑛婷,马骏,石玉,闫伟.基于扩展语义匹配的BIM和GIS三维建筑数据融合[J].土木建筑工程信息技术,2022,14(3):9-15. 被引量：4
5胡雪若白,黄洁,王建涛,李一鸣.基于高斯层次感知的知识图谱链接预测[J].电子科技,2022,35(12):91-96. 被引量：1
6李军怀,武允文,王怀军,李志超,徐江.融合实体描述与路径信息的知识图谱表示学习模型[J].智能系统学报,2023,18(1):153-161.
7王彦忠,李逸松.建筑领域文档推荐模型设计与实现[J].武汉大学学报（理学版）,2023,69(1):106-114.
8张浪浪,吴建斌,彭浩,陈乐倩.基于链接预测模型的融合研究[J].浙江师范大学学报（自然科学版）,2023,46(2):132-138.
9曹捷,阙小生,李慎兴,范永学,李兴,宋文志.基于知识图谱技术的配电站房智能运检[J].吉林大学学报（信息科学版）,2023,41(3):474-483. 被引量：1
10张渊,姚峰.基于知识嵌入式预训练语言模型的文本分类方法研究[J].武汉工程大学学报,2023,45(6):674-679.

1邓垚,李登峰.分块筛选自适应压缩感知重构算法[J].计算机应用与软件,2020,37(5):233-237. 被引量：1
2龙赞群.初中体育课堂的长跑项目教学探讨[J].好日子,2019(30):259-259.
3李云喜.无人机遥感在水土保持领域的应用研究[J].农业科技与信息,2020(7):57-58. 被引量：3
4谭晓,张志强.知识图谱研究进展及其前沿主题分析[J].图书与情报,2020(2):50-63. 被引量：7
5王年,孟树林,吴洛天,汪曙光,张艳.基于改进关系网络的小样本学习[J].安徽大学学报（自然科学版）,2020,44(4):38-44. 被引量：5
6徐祥玮.提高高校跆拳道教学质量的策略研究[J].视界观,2020,0(12):0272-0272. 被引量：1
7吴建生,谢永盛,金龙.基于协同进化算法的支持向量回归径流建模研究与应用[J].计算机科学与应用,2020,10(3):505-520.
8龚萱.大数据背景下思想政治理论课话语权的再提升[J].高教论坛,2020,0(6):4-6.
9王烨,张百强.快速收敛截断核范数矩阵填充方法的远监督关系抽取[J].电子技术与软件工程,2020(7):197-199.
10余传明,李浩男,王曼怡,黄婷婷,安璐.基于深度学习的知识表示研究:网络视角[J].数据分析与知识发现,2020,4(1):63-75.

吉林大学学报（工学版）

2020年第2期

浏览历史

内容加载中请稍等...

知识图谱嵌入中的自适应筛选被引量：2

参考文献2

二级参考文献85

共引文献263

同被引文献10

引证文献2

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

知识图谱嵌入中的自适应筛选 被引量：2

参考文献2

二级参考文献85

共引文献263

同被引文献10

引证文献2

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

知识图谱嵌入中的自适应筛选被引量：2