基于相似性负采样的知识图谱嵌入被引量：7

Knowledge graph embedding based on similarity negative sampling

下载PDF

导出

摘要针对现有知识图谱嵌入模型通过从实体集中随机抽取一个实体来生成负例三元组,导致负例三元组质量较低,影响了实体与关系的特征学习能力。研究了影响负例三元组质量的相关因素,提出了基于实体相似性负采样的方法来生成高质量的负例三元组。在相似性负采样方法中,首先使用K-Means聚类算法将所有实体划分为多个组,然后从正例三元组中头实体所在的簇中选择一个实体替换头实体,并以类似的方法替换尾实体。通过将相似性负采样方法与TransE相结合得到TransE-SNS。研究结果表明:TransE-SNS在链路预测和三元组分类任务上取得了显著的进步。 For the existing knowledge graph embedding model,the random extraction of an entity from the entity set results in the generation of lower-quality negative triples,and this affects the feature learning ability of the entity and the relationship.In this paper,we study the related factors affecting the quality of negative triples,and propose an entity similarity negative sampling method to generate high-quality negative triples.In the similarity negative sampling method,all entities are first divided into a number of groups using the K-means clustering algorithm.Then,corresponding to each positive triple,an entity is selected to replace the head entity from the cluster,whereby the head entity is located in the positive triple,and the tail entity is replaced in a similar approach.TransE-SNS is obtained by combining the similarity negative sampling method with TransE.Experimental results show that TransE-SNS has made significant progress in link prediction and triplet classification tasks.

作者饶官军古天龙常亮宾辰忠秦赛歌宣闻 RAO Guanjun;GU Tianlong;CHANG Liang;BIN Chenzhong;QIN Saige;XUAN Wen(Guangxi Key Laboratory of Trusted Software,Guilin University of Electronic Technology,Guilin 541004,China)

机构地区桂林电子科技大学广西可信软件重点实验室

出处《智能系统学报》 CSCD 北大核心 2020年第2期218-226,共9页 CAAI Transactions on Intelligent Systems

基金国家自然科学基金资助项目(U1501252,61572146) 广西创新驱动重大专项项目(AA17202024) 广西自然科学基金项目(2016GXNSFDA380006) 广西高校中青年教师基础能力提升项目(2018KYD203) 广西研究生教育创新计划项目(YCSW2018139)。

关键词知识图谱表示学习随机抽样相似性负采样 K-MEANS聚类随机梯度下降链接预测三元组分类 knowledge graph representation learning random sampling similarity sampling K-means clustering stochastic gradient descent link prediction triple classification

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1刘知远,孙茂松,林衍凯,谢若冰.知识表示学习研究进展[J].计算机研究与发展,2016,53(2):247-261. 被引量：260

二级参考文献82

1Miller G A. WordNet: A lexical database for English [J]. Communications of the ACM, 1995, 38(11): 39-41.
2Bollacker K, Evans C, Paritosh P, et al. Freebase: A collaboratively created graph database for structuring human knowledge [C] //Proe of KDD. New York: ACM, 2008: 1247-1250.
3Miller E. An introduction to the resource description framework [J]. Bulletin of the American Society for Information Science and Technology, 1998, 25(1): 15-19.
4Bengio Y. Learning deep architectures for AI [J]. Foundations and Trends in Machine Learning, 2099, 2 (1) 1-127.
5Bengio Y, Courville A, Vincent P. Representation learning: A review and new perspectives [J]. IEEE Trans on Pattern Analysis and Machine Intelligence, 2013, 35(8): 1798-1828.
6Turian J, Ratinov L, Bengio Y. Word representations: A simple and general method for semi-supervised learning [C]// Proc of ACL. Stroudsburg, PA: ACL, 2010:384-394.
7Manning C D, Raghavan P, Schutze H. Introduction to Information Retrieval [M]. Cambridge, UK: Cambridge University Press, 2008.
8Mikolov T, Sutskever I, Chen K, et al. Distributed representations of words and phrases and their eompositionality [C] //Proe of NIPS. Cambridge, MA: MIT Press, 2013:3111-3119.
9Zhao Y, Liu Z, Sun M. Phrase type sensitive tensor indexing model for semantic composition [C] //Proc of AAAI. Menlo Park, CA: AAAI, 2015: 2195-2202.
10Zhao Y, Liu Z, Sun M. Representation learning for measuring entity relatedness with rich information [C] //Proc of IJCAI. San Francisco, CA: Morgan Kaufmann, 2015: 1412-1418.

共引文献259

1余传明,李浩男,王曼怡,黄婷婷,安璐.基于深度学习的知识表示研究:网络视角[J].数据分析与知识发现,2020,4(1):63-75.
2张骁雄,杨琴琴,何浩然,丁鲲.面向俄乌冲突的时序知识图谱推理系统设计与实现[J].网络安全与数据治理,2023,42(S01):157-162.
3赵晓函,周子力,李天宇,陈丹华,王凯莉.一种基于IC参数的知识图谱嵌入方法[J].中文信息学报,2021,35(10):48-55.
4詹威威,程序,蔡惠民,刘汪洋,王彬,余正涛.基于综合影响力模型的改进EvolveKG方法及应用研究[J].计算机应用研究,2020,37(S01):159-162.
5阿布都克力木·阿布力孜,张雨宁,阿力木江·亚森,郭文强,哈里旦木·阿布都克里木.预训练语言模型的扩展模型研究综述[J].计算机科学,2022,49(S02):43-54. 被引量：11
6郝卫,魏赟.基于知识图谱表示学习的推荐算法优化[J].智能计算机与应用,2020,10(4):22-26. 被引量：3
7甘惟,吴志强,王元楷,徐浩文,严娟,何珍,赵紫辰.AIGC辅助城市设计的理论模型建构[J].城市规划学刊,2023(2):12-18. 被引量：16
8许升健.年薪制的困惑[J].金山企业管理,2000(1):40-41.
9王春凯,冯键.跨界数据融合在保险行业中的应用[J].保险理论与实践,2019,0(3):38-50.
10徐增林,盛泳潘,贺丽荣,王雅芳.知识图谱技术综述[J].电子科技大学学报,2016,45(4):589-606. 被引量：507

同被引文献32

1朱丽雅,张珺,洪亮,罗绍辉,兰度.数字人文领域的知识图谱:研究进展与未来趋势[J].知识管理论坛,2022(1):87-100. 被引量：5
2王国霞,刘贺平.个性化推荐系统综述[J].计算机工程与应用,2012,48(7):66-76. 被引量：335
3张晓林.机构知识库的发展趋势与挑战[J].现代图书情报技术,2014(2):1-7. 被引量：71
4刘知远,孙茂松,林衍凯,谢若冰.知识表示学习研究进展[J].计算机研究与发展,2016,53(2):247-261. 被引量：260
5安波,韩先培,孙乐,吴健.基于分布式表示和多特征融合的知识库三元组分类[J].中文信息学报,2016,30(6):84-89. 被引量：7
6姜枫,顾庆,郝慧珍,李娜,郭延文,陈道蓄.基于内容的图像分割方法综述[J].软件学报,2017,28(1):160-183. 被引量：133
7方阳,赵翔,谭真,杨世宇,肖卫东.一种改进的基于翻译的知识图谱表示方法[J].计算机研究与发展,2018,55(1):139-150. 被引量：51
8丁建辉,贾维嘉.知识图谱补全算法综述[J].信息通信技术,2018,12(1):56-62. 被引量：19
9段鹏飞,王远,熊盛武,毛晶晶.基于空间投影和关系路径的地理知识图谱表示学习[J].中文信息学报,2018,32(3):26-33. 被引量：8
10鲍开放,顾君忠,杨静.基于结构与文本联合表示的知识图谱补全方法[J].计算机工程,2018,44(7):205-211. 被引量：10

引证文献7

1陈文杰.一种融合主题特征的自适应知识表示方法[J].计算机工程,2021,47(1):87-93. 被引量：3
2张正航,钱育蓉,行艳妮,赵鑫.基于TransE的表示学习方法研究综述[J].计算机应用研究,2021,38(3):656-663. 被引量：7
3王瑞,李智杰,李昌华,张颉.面向链接预测的知识图谱嵌入研究综述[J].计算机测量与控制,2022,30(9):8-16. 被引量：4
4胡旭阳,王治政,孙媛媛,徐博,林鸿飞.融合语义解析的知识图谱表示方法[J].计算机研究与发展,2022,59(12):2878-2888. 被引量：2
5郭一楠,王斌,巩敦卫,于泽宽.实体结构与语义融合的多层注意力知识表示学习[J].智能系统学报,2023,18(3):577-588.
6奚超亮,冷泳林.混合负采样的知识图谱嵌入[J].计算机技术与发展,2023,33(9):168-174.
7徐金诚,葛云生.TransE-KCB:一种改进负样本采样的知识图谱表示方法[J].计算机应用与软件,2024,41(8):345-350.

二级引证文献16

1刘均,宫子栋,吴力.基于信息熵度量的局部线性嵌入算法[J].吉林大学学报（理学版）,2022,60(1):143-149. 被引量：5
2侯靖琳,仇润鹤,薛季爱,王晨,蒋学芹.基于知识图谱嵌入和补全的电梯故障预测[J].计算机工程与设计,2022,43(1):224-230. 被引量：7
3焦守龙,段友祥,孙歧峰,庄子浩,孙琛皓.融合实体描述信息和邻居节点特征的知识表示学习方法[J].计算机应用,2022,42(4):1050-1056. 被引量：1
4胡瑛婷,马骏,石玉,闫伟.基于扩展语义匹配的BIM和GIS三维建筑数据融合[J].土木建筑工程信息技术,2022,14(3):9-15. 被引量：4
5柯庆镝,孙伯骜,薛冰,张雷,陈鹏飞.产品性能关联下绿色设计知识表达及获取方法[J].中国机械工程,2022,33(22):2717-2726. 被引量：2
6董家玮,孙福振,吴相帅,吴田慧,王绍卿.基于差异性汉明距离的变分推荐算法[J].计算机科学,2022,49(12):178-184. 被引量：2
7李军怀,武允文,王怀军,李志超,徐江.融合实体描述与路径信息的知识图谱表示学习模型[J].智能系统学报,2023,18(1):153-161.
8王彦忠,李逸松.建筑领域文档推荐模型设计与实现[J].武汉大学学报（理学版）,2023,69(1):106-114.
9慈颖,秦留洋,韩惠婕.基于航天装备数据的知识图谱体系研究[J].计算机测量与控制,2023,31(5):249-254. 被引量：6
10王晶,王琼,周永博,荀位,高建勇,龚亮亮,张俊尧.面向电力物联网调度任务的分布式知识图谱[J].无线电通信技术,2023,49(3):432-437. 被引量：2

1宋希良,韩先培,孙乐.面向新类型人名识别的数据增强方法[J].中文信息学报,2019,33(6):72-79. 被引量：5
2胡月怡,陈虹.服务设计视角下移动社交产品的创新研究[J].工业设计,2020(6):65-66.
3范纯龙,范东皖,许莉,何宇峰.利用互斥策略优化二分网络节点预测[J].计算机应用研究,2020,37(7):1999-2005. 被引量：2
4许进,文春英,马仙雁.韩国网络视频市场的变局[J].国际品牌观察（媒介）,2020(7):72-76.
5张婧,袁细国.基于小样本学习的高光谱遥感图像分类算法[J].聊城大学学报（自然科学版）,2020,33(6):1-11. 被引量：3
6赵国清,何佳洲,李永盛,王景石.基于统计的知识推理研究进展[J].指挥控制与仿真,2020,42(4):8-12. 被引量：1
7李锦超,赵仲元,绳伟光.基于相似性的粗粒度可重构指令压缩[J].微电子学与计算机,2020,37(8):21-26.
8王慧,乐孜纯,龚轩,武玉坤,左浩.基于特征分类的链路预测方法综述[J].计算机科学,2020,47(8):302-312. 被引量：8
9张强,张瀚驰,李成榕,马国明.X射线激励对SF6中直流针尖放电的影响[J].电工技术学报,2019,34(24):5282-5288.
10郑建兴,李沁文,王素格,李德玉.基于翻译模型的异质重边信息网络链路预测研究[J].南京大学学报（自然科学版）,2020,56(4):541-548.

智能系统学报

2020年第2期

浏览历史

内容加载中请稍等...

基于相似性负采样的知识图谱嵌入被引量：7

参考文献1

二级参考文献82

共引文献259

同被引文献32

引证文献7

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

基于相似性负采样的知识图谱嵌入 被引量：7

参考文献1

二级参考文献82

共引文献259

同被引文献32

引证文献7

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

基于相似性负采样的知识图谱嵌入被引量：7