期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于收益塑造技术的知识图谱多跳推理
1
作者 姚章俊 《计算机工程与设计》 北大核心 2023年第8期2389-2398,共10页
为解决现存多跳推理方法存在的泛化能力差、难以解释等问题,在基于策略的强化学习框架下,通过推理智能体扩展推理路径的方式解决,将实体对间的路径搜索问题转换为选择多个关系边和实体节点的序列决策问题。提出DRL-MHR(deep reinforceme... 为解决现存多跳推理方法存在的泛化能力差、难以解释等问题,在基于策略的强化学习框架下,通过推理智能体扩展推理路径的方式解决,将实体对间的路径搜索问题转换为选择多个关系边和实体节点的序列决策问题。提出DRL-MHR(deep reinforcement learning for multi-hop reasoning)算法,将经过语义和拓扑表征的实体节点与关系边按照建模要求组成知识图谱强化学习环境,利用收益塑造技术,通过最大化推理智能体的收益,学习最优搜索路径。DRL-MHR算法在一次和三次命中率方面有显著改进,提升了多跳推理在不同量级和领域知识图谱上的问答应用能力。 展开更多
关键词 强化学习 多跳推理 知识图谱 收益塑造 图神经网络 推理智能体 序列决策
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部