摘要
本文提出一种基于定性模糊网络的强化学习知识传递方法。该方法通过建立系统的定性模型,并用定性模糊网络抽取基于定性动作的次优策略的共同特征获得与系统参数无关知识。这些知识能有效描述参数值不同的系统所具有的共同控制规律,加快在新参数值的系统中强化学习的收敛速度。
This paper proposes a new reinforcement learning knowledge transfer method based on a qualitative model.The method defines the qualitative model and extracts the common features of the sub-optimal policy to obtain knowledge by qualitative fuzzy networks.The knowledge can represent the common features of the tasks with different parameters.The convergence can be accelerated by the knowledge unrelated to the parameters.
出处
《计算机工程与科学》
CSCD
北大核心
2011年第6期118-124,共7页
Computer Engineering & Science
基金
省教育厅科学研究项目(09C1134)
关键词
强化学习
定性模型
知识传递
reinforcement learning
qualitative model
knowledge transfer