-
题名基于图嵌入编码形态信息的非均匀多任务强化学习方法
- 1
-
-
作者
贺晓
王文学
-
机构
中国科学院沈阳自动化研究所机器人学国家重点实验室
中国科学院机器人与智能制造创新研究院
中国科学院大学
-
出处
《计算机应用研究》
CSCD
北大核心
2024年第4期1022-1028,共7页
-
基金
国家自然科学基金资助项目(U1908215)
辽宁省“兴辽英才计划”资助项目(XLYC2002014)。
-
文摘
传统强化学习方法存在效率低下、泛化性能差、策略模型不可迁移的问题。针对此问题,提出了一种非均匀多任务强化学习方法,通过学习多个强化任务提升效率和泛化性能,将智能体形态构建为图,利用图神经网络能处理任意连接和大小的图来解决状态和动作空间维度不同的非均匀任务,突破模型不可迁移的局限,充分发挥图神经网络天然地利用图结构归纳偏差的优点,实现了模型高效训练和泛化性能提升,并可快速迁移到新任务。多任务学习实验结果表明,与以往方法相比,该方法在多任务学习和迁移学习实验中均表现出更好的性能,在迁移学习实验中展现出更准确的知识迁移。通过引入图结构偏差,使该方法具备更高的效率和更好的迁移泛化性能。
-
关键词
多任务强化学习
图神经网络
变分图自编码器
形态信息编码
迁移学习
-
Keywords
multi-task reinforcement learning
graph neural network
variational graph autoencoder
morphology information encoding
transfer learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-