检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到5篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于模型的强化学习中可学习的样本加权机制: 1; 作者黄文振尹奇跃 +1 位作者张俊格黄凯奇《软件学报》 EI CSCD 北大核心 2023年第6期2765-2775,共11页; 基于模型的强化学习方法利用已收集的样本对环境进行建模并使用构建的环境模型生成虚拟样本以辅助训练,因而有望提高样本效率.但由于训练样本不足等问题,构建的环境模型往往是不精确的,其生成的样本也会因携带的预测误差而对训练过程产... 展开更多; 关键词基于模型的强化学习模型误差元学习强化学习深度学习; 下载PDF 职称材料

基于模型的机器人强化学习研究综述被引量：5: 2; 作者孙世光兰旭光 +1 位作者张翰博郑南宁《模式识别与人工智能》 CSCD 北大核心 2022年第1期1-16,共16页; 基于模型的强化学习通过学习一个环境模型和基于此模型的策略优化或规划,实现机器人更接近于人类的学习和交互方式.文中简述机器人学习问题的定义,介绍机器人学习中基于模型的强化学习方法,包括主流的模型学习及模型利用的方法.主流的... 展开更多; 关键词人工智能机器人学习强化学习基于模型的强化学习; 下载PDF 职称材料

基于平均场内生奖励的多智能体强化学习算法: 3; 作者孙文绮李大鹏 +1 位作者田峰丁良辉《无线电通信技术》 2023年第3期556-565,共10页; 针对复杂的多智能体应用场景中只依靠根据最终目标设计的简单奖励函数无法对智能体学习策略做出有效引导的问题,提出了一种基于平均场内生奖励的多智能体强化学习(Model-based Multi-agent Mean-field Intrinsic Reward Upper Confidenc... 展开更多; 关键词多智能体系统平均场控制基于模型的强化学习内生奖励; 下载PDF 职称材料

强化学习及其在机器人任务规划中的进展与分析: 4; 作者张晓明高士杰 +2 位作者姚昌瑀褚誉彭硕《模式识别与人工智能》 EI CSCD 北大核心 2023年第10期902-917,共16页; 强化学习可以让机器人通过与环境的交互,学习最优的行动策略,是目前机器人领域关注的重要前沿方向之一.文中简述机器人任务规划问题的形式化建模,分析强化学习的主要方法,分别介绍无模型强化学习、基于模型的强化学习和分层强化学习的... 展开更多; 关键词机器人任务规划强化学习无模型强化学习基于模型的强化学习分层强化学习; 下载PDF 职称材料

基于高斯回归的连续空间多智能体跟踪学习被引量：2: 5; 作者陈鑫魏海军 +1 位作者吴敏曹卫华《自动化学报》 EI CSCD 北大核心 2013年第12期2021-2031,共11页; 提高适应性、实现连续空间的泛化、降低维度是实现多智能体强化学习(Multi-agent reinforcement learning,MARL)在连续系统中应用的几个关键.针对上述需求,本文提出连续多智能体系统(Multi-agent systems,MAS)环境下基于模型的智能体跟... 展开更多; 关键词连续状态空间多智能体系统基于模型的强化学习高斯回归; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部