-
题名基于协同知识嵌入注意网络的推荐算法研究
- 1
-
-
作者
师博雅
梁光成
孙宇健
张家华
胡泉
-
机构
中国航天系统科学与工程研究院
航天宏康智能科技(北京)有限公司
-
出处
《计算机应用与软件》
北大核心
2024年第4期297-305,共9页
-
文摘
推荐系统广泛用于实际应用场景中,现有利用图神经网络的基于知识图谱的解决方法忽略了对知识图谱中蕴含丰富关系知识的有效编码。提出一种协同知识嵌入注意网络模型,通过在知识高阶传播过程中融入翻译模型对以三元组形式表示的知识进行有效编码,实现协同信息与知识传播更高效的融合方式,并通过拓展端到端模型CKAN完成推荐算法的设计。在三个真实推荐场景中的实验结果表明,相对于现有的KGCN、KGNN-LS、KGAT等方法,所提算法在点击率预测中的AUC值在Last.FM数据集上达到了0.8473,在Book-Crossing数据集上达到了0.7538,在Dianping-Food数据集上达到了0.8783;在Top-K推荐中的召回率均优于基准算法。
-
关键词
推荐系统
协同过滤
异质信息网络
知识图谱嵌入
图卷积神经网络
-
Keywords
Recommender system
Collaborative filtering
Heterogeneous information network
Knowledge graph embedding
Graph convolutional neural network
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-
-
题名基于多智能体协同强化学习的多目标追踪方法
被引量:4
- 2
-
-
作者
王毅然
经小川
贾福凯
孙宇健
佟轶
-
机构
中国航天系统科学与工程研究院
航天宏康智能科技(北京)有限公司
-
出处
《计算机工程》
CAS
CSCD
北大核心
2020年第11期90-96,共7页
-
基金
广东省应用型科技研发基金(2016B010127005)。
-
文摘
针对现有多目标追踪方法通常存在学习速度慢、追踪效率低及协同追踪策略设计困难等问题,提出一种改进的多目标追踪方法。基于追踪智能体和目标智能体数量及其环境信息建立任务分配模型,运用匈牙利算法根据距离效益矩阵对其进行求解得到多个追踪智能体的任务分配情况,并以缩短目标智能体的追踪路径为优化目标进行任务分工,同时利用多智能体协同强化学习算法使多个智能体在相同环境中不断重复执行探索-积累-学习-决策过程,最终根据经验数据更新策略完成多目标追踪任务。仿真结果表明,与DDPG和MADDPG方法相比,该方法能在避免碰撞和躲避障碍物的情况下,使多个智能体通过相互协作形成针对多个运动目标的最短追踪路线。
-
关键词
多智能体
多目标追踪
强化学习
任务分配
实时性
-
Keywords
multi-agent
multi-target tracking
reinforcement learning
task assignment
real-time
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名多智能体同时到达多目标点的协同强化学习算法
被引量:1
- 3
-
-
作者
李瑞群
王若冰
田涛
郑重
张越
-
机构
中国航天系统科学与工程研究院
航天宏康智能科技(北京)有限公司
-
出处
《计算机应用与软件》
北大核心
2021年第9期199-204,共6页
-
基金
广东省科技厅应用型研发基金专项“水资源大数据综合应用平台研发及产业化”(2016B010127005)。
-
文摘
针对动态未知环境下多智能体多目标协同问题,为实现在动态未知环境下多个智能体能够同时到达所有目标点,设计函数式奖励函数,对强化学习算法进行改进。智能体与环境交互,不断重复“探索-学习-决策”过程,在与环境的交互中积累经验并优化策略,在未预先分配目标点的情况下,智能体通过协同决策,能够避开环境中的静态障碍物和动态障碍物,同时到达所有目标点。仿真结果表明,该算法相比现有多智能体协同方法的学习速度平均提高约42.86%,同时智能体能够获得更多的奖励,可以做到自主决策自主分配目标,并且实现同时到达所有目标点的目标。
-
关键词
多智能体
多目标
同时到达
协同避障
强化学习
-
Keywords
Multi-agent
Multi-target
Arrive simultaneously
Collaborative obstacle avoidance
Reinforcement learning
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
TP3
[自动化与计算机技术—计算机科学与技术]
-