一种分层强化学习的知识推理方法

Knowledge reasoning method based on hierarchical reinforcement learning

下载PDF

导出

摘要针对知识推理过程中,随着推理路径长度的增加,节点的动作空间急剧增长,使得推理难度不断提升的问题,提出一种分层强化学习的知识推理方法(knowledge reasoning method of hierarchical reinforcement learning,MutiAg-HRL),降低推理过程中的动作空间大小。MutiAg-HRL调用高级智能体对知识图谱中的关系进行粗略推理,通过计算下一步关系及给定查询关系之间的相似度,确定目标实体大致位置,依据高级智能体给出的关系,指导低级智能体进行细致推理,选择下一步动作;模型还构造交互奖励机制,对两个智能体的关系和动作选择及时给予奖励,防止模型出现奖励稀疏问题。为验证该方法的有效性,在FB15K-237和NELL-995数据集上进行实验,将实验结果与TransE、MINERVA、HRL等11种主流方法进行对比分析,MutiAg-HRL方法在链接预测任务上的hits@k平均提升了1.85%,MRR平均提升了2%。 In the process of knowledge inference,with the increase of the length of the inference path,the action space of the node increases sharply,which makes the inference difficulty continue to increase.This paper proposed a knowledge reasoning method of hierarchical reinforcement learning(MutiAg-HRL)to reduce the size of action space in the reasoning process.MutiAg-HRL invoked high-level agents to perform rough reasoning on the relationships in the knowledge graph,and determined the approximate location of the target entity by calculating the similarity between the next step relationship and the given query relationship.According to the relationship given by the high-level agent,the low-level agents were guided to conduct detailed reasoning and select the next action.The model also constructed an interactive reward mechanism to reward the relationship between the two agents and the choice of actions in time to prevent the problem of sparse reward in the model.To verify the effectiveness of the proposed method,it carried out experiments on FB15K-237 and NELL-995 datasets.The experimental results were compared with those of 11 mainstream methods such as TransE,MINERVA and HRL.The average value of the MutiAg-HRL method on the link prediction task hits@k is increased by 1.85%,MRR increases by an average of 2%.

作者孙崇王海荣荆博祥马赫 Sun Chong;Wang Hairong;Jing Boxiang;Ma He(College of Computer Science&Engineering,North Minzu University,Yinchuan 750021,China;The Key Laboratory of Images&Graphics Intelligent Processing of State Ethnic Affairs Commission,North Minzu University,Yinchuan 750021,China)

机构地区北方民族大学计算机科学与工程学院北方民族大学图像图形智能处理国家民委重点实验室

出处《计算机应用研究》 CSCD 北大核心 2024年第3期805-810,共6页 Application Research of Computers

基金宁夏自然科学基金资助项目(2023AAC03316)。

关键词知识推理分层强化学习交互奖励链接预测 knowledge reasoning hierarchical reinforcement learning interactive reward link prediction

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1于铁忠,罗婧,王利琴,董永峰.融合TuckER嵌入和强化学习的知识推理[J].计算机系统应用,2022,31(9):127-135. 被引量：1
2官赛萍,靳小龙,贾岩涛,王元卓,程学旗.面向知识图谱的知识推理研究进展[J].软件学报,2018,29(10):2966-2994. 被引量：162
3刘玉华,翟如钰,张翔,王毅刚,周志光.知识图谱可视分析研究综述[J].计算机辅助设计与图形学学报,2023,35(1):23-36. 被引量：9

二级参考文献11

1李茹杨,彭慧民,李仁刚,赵坤.强化学习算法与应用综述[J].计算机系统应用,2020,29(12):13-25. 被引量：35
2赵军,刘康,周光有,蔡黎.开放式文本信息抽取[J].中文信息学报,2011,25(6):98-110. 被引量：60
3刘峤,李杨,段宏,刘瑶,秦志光.知识图谱构建技术综述[J].计算机研究与发展,2016,53(3):582-600. 被引量：846
4徐增林,盛泳潘,贺丽荣,王雅芳.知识图谱技术综述[J].电子科技大学学报,2016,45(4):589-606. 被引量：459
5官赛萍,靳小龙,贾岩涛,王元卓,程学旗.面向知识图谱的知识推理研究进展[J].软件学报,2018,29(10):2966-2994. 被引量：162
6黄恒琪,于娟,廖晓,席运江.知识图谱研究综述[J].计算机系统应用,2019,28(6):1-12. 被引量：177
7王勇超,罗胜文,杨英宝,张宏鑫.知识图谱可视化综述[J].计算机辅助设计与图形学学报,2019,31(10):1666-1676. 被引量：50
8陈文杰,文奕,张鑫,杨宁,赵爽.一种改进的基于TransE知识图谱表示方法[J].计算机工程,2020,46(5):63-69. 被引量：12
9丁泽源,杨志豪,罗凌,王磊,张音,林鸿飞,王健.基于深度学习的中文生物医学实体关系抽取系统[J].中文信息学报,2021,35(5):70-76. 被引量：13
10封皓君,段立,张碧莹.面向知识图谱的知识推理综述[J].计算机系统应用,2021,30(10):21-30. 被引量：14

共引文献169

1赵悦淑,王军,王蕊,昝红英,张坤丽,穗志方.中文医学知识图谱研究进展[J].中国数字医学,2021,16(6):86-91. 被引量：5
2张一畅,代茂利,吴开明,明拂晓.数据流编排技术在绩效考核数据质控中的应用研究[J].中国数字医学,2021,16(6):58-62.
3韩少恒,杨家荣.智能制造型企业知识图谱的构建[J].上海电气技术,2022,15(1):60-62.
4陈军,刘万增,武昊,李志林,赵勇,张蓝.基础地理知识服务的基本问题与研究方向[J].武汉大学学报（信息科学版）,2019,44(1):38-47. 被引量：44
5陈珺.一种知识库体系的设计构建方法及在媒体领域的应用探索[J].中国传媒科技,2019(5):106-108. 被引量：1
6欧艳鹏.知识图谱技术研究综述[J].电子世界,2018,0(13):54-54. 被引量：13
7魏凡翔,蒋鹏飞,刘泽,魏松杰.面向空管安全态势的数据组织和可视化分析软件设计[J].信息与电脑,2019,31(4):158-159.
8李启可,张克亮.基于问答系统的知识推理技术[J].电脑知识与技术,2019,15(3X):155-156. 被引量：1
9张仲伟,曹雷,陈希亮,寇大磊,宋天挺.基于神经网络的知识推理研究综述[J].计算机工程与应用,2019,55(12):8-19. 被引量：35
10宋蕾.大数据在复杂生态环境中的应用研究[J].数字技术与应用,2019,37(4):64-65. 被引量：6

1肖蕾,李琪.时序知识图谱补全方法研究综述[J].计算机工程与应用,2024,60(6):43-54. 被引量：1
2王永康,艾山·吾买尔,顾亚东,何江涛.TransREF:一种改进的基于邻域信息的知识表示模型[J].电子测量技术,2023,46(21):7-15.
3周琳茹,彭鹏菲.基于注意力-生成对抗网络的任务分析方法研究[J].计算机科学,2024,51(3):63-71.
4李笑笑,安玉娥,段祎然.企业审计知识图谱的构建——以华神科技公司为例[J].运筹与模糊学,2024,14(1):309-315.
5李鑫,何芳州.基于语义信息的大规模知识图谱补全算法[J].计算机仿真,2023,40(12):428-433.
6欧阳继红,曹竞月,王腾.Copula层次化变分推理[J].吉林大学学报（信息科学版）,2024,42(1):51-58.
7Zhigang Zhao,Xiong Luo,Maojian Chen,Ling Ma.A Survey of Knowledge Graph Construction Using Machine Learning[J].Computer Modeling in Engineering & Sciences,2024,139(4):225-257.
8徐亚鹏,刘全,栗军伟.基于轨迹信息量的分层强化学习方法[J].计算机科学,2023,50(12):314-321.
9李晶.凸显证据推理的“化学反应的速率与限度”教学[J].中学化学教学参考,2024(5):22-24.
10罗仁泽,唐祥,余泓,李华督.基于改进Faster RCNN的射线图像焊缝缺陷检测方法[J].电子测量技术,2023,46(22):160-168.

计算机应用研究

2024年第3期

浏览历史

内容加载中请稍等...

一种分层强化学习的知识推理方法

参考文献3

二级参考文献11

共引文献169

相关作者

相关机构

相关主题

浏览历史