融合语义解析的知识图谱表示方法被引量：2

Knowledge Graph Representation Method Combined with Semantic Parsing

下载PDF

导出

摘要为解决大多数知识图谱表示学习模型仅使用三元组信息的问题,提出融合语义解析的知识图谱表示模型BERT-PKE.模型利用实体和关系的文本描述,通过BERT的双向编码表示进行语义解析,深度挖掘语义信息.由于BERT训练代价昂贵,提出一种基于词频和k近邻的剪枝策略,提炼选择文本描述集.此外,由于负样本的构造影响了模型的训练,提出2种改进随机抽样的策略:一种是基于实体分布的负采样方法,以伯努利分布概率来选择替换的实体,该方法可以减少负采样引起的伪标记问题;另一种是基于实体相似性负采样方法,首先用TransE将实体嵌入到向量空间,使用k-means聚类算法将实体进行分类.通过同簇实体的相互替换可获得高质量的负三元组,有利于实体的特征学习.实验结果表明,所提出BERT-PKE模型与TransE,KG-BERT,RotatE等相比,性能有显著提升. To solve the problem that the knowledge graph representation learning model only uses triples information,a representation model with semantic analysis is proposed,which is named bidirectional encoder representations from transformers-pruning knowledge embedding(BERT-PKE).It employs bidirectional encoder representations to analyze text,and mines the depth semantic information of entities and relations based on the entities and relations of text description.Since BERT has the heavy consumption in the training time,we propose a pruning strategy with word frequency and k-nearest neighbors to extract the selected text description set.In addition,due to the construction of negative samples has impacts on training model,two strategies are introduced for improving random sampling.One is a negative sampling method based on entity distribution,in which the Bernoulli distribution probability is used to select the replaced entities.It reduces the Pseudo-Labelling problem caused by negative sampling.The other is a negative sampling method based on the similarity of the entities.It mainly uses TransE and k-means to represent the entities as the vectors and classify the entities respectively.High-quality negative triples can be obtained by mutual replacement of entities in the same cluster,which is helpful for feature learning of entities.Experimental results show that the performance of proposed model is significantly improved compared to the SOTA baselines.

作者胡旭阳王治政孙媛媛徐博林鸿飞 Hu Xuyang;Wang Zhizheng;Sun Yuanyuan;Xu Bo;Lin Hongfei(School of Computer Science and Technology,Dalian University of Technology,Dalian,Liaoning 116024)

机构地区大连理工大学计算机科学与技术学院

出处《计算机研究与发展》 EI CSCD 北大核心 2022年第12期2878-2888,共11页 Journal of Computer Research and Development

基金国家重点研发计划项目(2018YFC0830603)。

关键词知识图谱表示学习 BERT模型语义解析负采样剪枝 knowledge graph representation learning BERT semantic analysis negative sampling pruning

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献3

1刘知远,孙茂松,林衍凯,谢若冰.知识表示学习研究进展[J].计算机研究与发展,2016,53(2):247-261. 被引量：259
2饶官军,古天龙,常亮,宾辰忠,秦赛歌,宣闻.基于相似性负采样的知识图谱嵌入[J].智能系统学报,2020,15(2):218-226. 被引量：7
3丁建辉,贾维嘉.知识图谱补全算法综述[J].信息通信技术,2018,12(1):56-62. 被引量：18

二级参考文献83

1Miller G A. WordNet: A lexical database for English [J]. Communications of the ACM, 1995, 38(11): 39-41.
2Bollacker K, Evans C, Paritosh P, et al. Freebase: A collaboratively created graph database for structuring human knowledge [C] //Proe of KDD. New York: ACM, 2008: 1247-1250.
3Miller E. An introduction to the resource description framework [J]. Bulletin of the American Society for Information Science and Technology, 1998, 25(1): 15-19.
4Bengio Y. Learning deep architectures for AI [J]. Foundations and Trends in Machine Learning, 2099, 2 (1) 1-127.
5Bengio Y, Courville A, Vincent P. Representation learning: A review and new perspectives [J]. IEEE Trans on Pattern Analysis and Machine Intelligence, 2013, 35(8): 1798-1828.
6Turian J, Ratinov L, Bengio Y. Word representations: A simple and general method for semi-supervised learning [C]// Proc of ACL. Stroudsburg, PA: ACL, 2010:384-394.
7Manning C D, Raghavan P, Schutze H. Introduction to Information Retrieval [M]. Cambridge, UK: Cambridge University Press, 2008.
8Mikolov T, Sutskever I, Chen K, et al. Distributed representations of words and phrases and their eompositionality [C] //Proe of NIPS. Cambridge, MA: MIT Press, 2013:3111-3119.
9Zhao Y, Liu Z, Sun M. Phrase type sensitive tensor indexing model for semantic composition [C] //Proc of AAAI. Menlo Park, CA: AAAI, 2015: 2195-2202.
10Zhao Y, Liu Z, Sun M. Representation learning for measuring entity relatedness with rich information [C] //Proc of IJCAI. San Francisco, CA: Morgan Kaufmann, 2015: 1412-1418.

共引文献271

1余传明,李浩男,王曼怡,黄婷婷,安璐.基于深度学习的知识表示研究:网络视角[J].数据分析与知识发现,2020,4(1):63-75.
2张骁雄,杨琴琴,何浩然,丁鲲.面向俄乌冲突的时序知识图谱推理系统设计与实现[J].网络安全与数据治理,2023,42(S01):157-162.
3赵晓函,周子力,李天宇,陈丹华,王凯莉.一种基于IC参数的知识图谱嵌入方法[J].中文信息学报,2021,35(10):48-55.
4詹威威,程序,蔡惠民,刘汪洋,王彬,余正涛.基于综合影响力模型的改进EvolveKG方法及应用研究[J].计算机应用研究,2020,37(S01):159-162.
5阿布都克力木·阿布力孜,张雨宁,阿力木江·亚森,郭文强,哈里旦木·阿布都克里木.预训练语言模型的扩展模型研究综述[J].计算机科学,2022,49(S02):43-54. 被引量：10
6郝卫,魏赟.基于知识图谱表示学习的推荐算法优化[J].智能计算机与应用,2020,10(4):22-26. 被引量：3
7甘惟,吴志强,王元楷,徐浩文,严娟,何珍,赵紫辰.AIGC辅助城市设计的理论模型建构[J].城市规划学刊,2023(2):12-18. 被引量：13
8许升健.年薪制的困惑[J].金山企业管理,2000(1):40-41.
9王春凯,冯键.跨界数据融合在保险行业中的应用[J].保险理论与实践,2019,0(3):38-50.
10徐增林,盛泳潘,贺丽荣,王雅芳.知识图谱技术综述[J].电子科技大学学报,2016,45(4):589-606. 被引量：499

同被引文献49

1熊奥,高畅,赵明辉,张玲玲.基于知识图谱的核电设备健康管理知识建模与分析[J].科技促进发展,2021,17(4):640-649. 被引量：10
2殷豪,欧祖宏,陈德,孟安波.基于二次模式分解和级联式深度学习的超短期风电功率预测[J].电网技术,2020,44(2):445-453. 被引量：43
3李威,陈曙东,欧阳小叶,杜蓉,王荣.基于高速多核网络的远监督关系抽取方法[J].北京邮电大学学报,2020(5):71-76. 被引量：1
4梁铭.基于英汉平行语料库术语词典的自动抽取[J].电脑知识与技术,2009,5(7):5081-5083. 被引量：5
5史光耀,邱晓燕,赵劲帅,马菁曼.计及风电功率预测误差与需求响应的电力系统滚动调度[J].现代电力,2018,35(6):9-15. 被引量：4
6闫炯程,李常刚,刘玉田.基于SDAE特征提取的含风电电网可用输电能力计算[J].电力系统自动化,2019,43(1):32-39. 被引量：15
7闪鑫,陆晓,翟明玉,高宗和,徐春雷,滕贤亮,王波.人工智能应用于电网调控的关键技术分析[J].电力系统自动化,2019,43(1):49-57. 被引量：122
8王元卓,贾岩涛,刘大伟,靳小龙,程学旗.基于开放网络知识的信息检索与数据挖掘[J].计算机研究与发展,2015,52(2):456-474. 被引量：95
9黎明,吴跃,陈佳.基于语义搜索引擎的云资源调度[J].计算机应用研究,2015,32(12):3735-3737. 被引量：7
10刘知远,孙茂松,林衍凯,谢若冰.知识表示学习研究进展[J].计算机研究与发展,2016,53(2):247-261. 被引量：259

引证文献2

1卢冠华,陈俊斌,丁茂生,杨慧彪.知识图谱在电力系统调度运行中的应用与展望[J].电力信息与通信技术,2023,21(7):27-35. 被引量：5
2王文慧,王敬东.电力领域知识图谱发展态势分析[J].产业创新研究,2024(10):43-45.

二级引证文献5

1丁义轩,王文涛.基于知识图谱的电力通信设备故障诊断方法研究及应用[J].家电维修,2024(3):7-9.
2胡广林,张思慧,刘丹,魏国旺,李海涛,林雪.基于知识图谱技术的电网项目数据关联分析[J].机械与电子,2024,42(2):9-14.
3李兴,吴天宇,马光明.基于深度学习算法的电力运行数据隐私保护方法[J].信息技术与信息化,2024(3):192-195. 被引量：1
4唐昕,孙宇菲,王钰珏,石敏,朱登明.面向工业数字孪生的三层知识图谱结构设计方法[J].计算机科学,2024,51(S01):51-56.
5卜宪德,刘世栋,位祺,张立杨.基于强化学习的IMS及软交换网络主动防御安全策略[J].电力信息与通信技术,2024,22(6):45-51.

1梁维中,王洪玉,王淑涵.基于改进YOLOv4-tiny的铝合金型材表面缺陷检测[J].黑龙江科技大学学报,2022,32(6):752-758.
2王慧丽.基于K-means聚类算法的电商数据智能分析方法设计[J].信息与电脑,2022,34(14):79-81. 被引量：1
3张立柱,高慧,张林峰,李雅文,武同宝.基于Spark和K-Means聚类算法的电力用户智能画像[J].电力设备管理,2022(22):119-122.
4许诺,赵薇,尚柯源,陈浩宇.基于预训练语言模型的健康谣言检测[J].系统科学与数学,2022,42(10):2582-2589. 被引量：4
5才东阳.基于K-means聚类的计算机网络信息安全风险评估方法[J].网络安全技术与应用,2022(11):30-31. 被引量：7
6张海涛,柴思敏.改进双分支胶囊网络的高光谱图像分类[J].计算机科学与探索,2022,16(10):2405-2414.
7龙玥,韩军,孙园,黄慧玲,郭前进.改进型SSD网络的织物瑕疵检测算法[J].厦门理工学院学报,2022,30(5):64-73. 被引量：2
8顾煜,金赟,马勇,姜芳艽,俞佳佳.基于声学和文本特征的多模态情感识别[J].数据采集与处理,2022,37(6):1353-1362. 被引量：2
9李鹏.职业教育产教融合制度化:新尺度、新挑战与新方向[J].南京师大学报（社会科学版）,2022(6):24-33. 被引量：36
10赵乐,张恩,秦磊勇,李功丽.基于区块链的多方隐私保护k-means聚类方案[J].计算机应用,2022,42(12):3801-3812. 被引量：3

计算机研究与发展

2022年第12期

浏览历史

内容加载中请稍等...

融合语义解析的知识图谱表示方法被引量：2

参考文献3

二级参考文献83

共引文献271

同被引文献49

引证文献2

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

融合语义解析的知识图谱表示方法 被引量：2

参考文献3

二级参考文献83

共引文献271

同被引文献49

引证文献2

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

融合语义解析的知识图谱表示方法被引量：2