期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
优势加权互信息最大化的最大熵分层强化学习
1
作者 乌兰 刘全 +2 位作者 黄志刚 朱斐 张立华 《计算机学报》 EI CAS CSCD 北大核心 2023年第10期2066-2083,共18页
近年来,深度强化学习在控制任务中取得了显著的效果.但受限于探索能力,难以快速且稳定地求解复杂任务.分层强化学习作为深度强化学习的重要分支,主要解决大规模问题.但是仍存在先验知识设定的不合理和无法有效平衡探索与利用等难题.针... 近年来,深度强化学习在控制任务中取得了显著的效果.但受限于探索能力,难以快速且稳定地求解复杂任务.分层强化学习作为深度强化学习的重要分支,主要解决大规模问题.但是仍存在先验知识设定的不合理和无法有效平衡探索与利用等难题.针对以上问题,提出优势加权互信息最大化的最大熵分层强化学习(Maximum Entropy Hierarchical Reinforcement Learning with Advantage-weighted Mutual Information Maximization,HRLAMIM)算法.该算法通过优势函数加权重要性采样与互信息最大化,解决由策略引起的样本聚类问题,增加内部奖励来强调Option的多样性.同时,将奖励引入最大熵强化学习目标,使策略具有了更强的探索性和更好的稳定性.此外,采用Option数量退火方法,不仅减少了先验知识对性能的影响,还平衡了算法的探索与利用,并获得了更高的样本效率和更快的学习速度.将HRL-AMIM算法应用于Mujoco任务中,实验表明,与传统深度强化学习算法和同类型的分层强化学习算法相比,HRL-AMIM算法在性能和稳定性方面均具有较大的优势.进一步通过消融实验和超参数敏感性实验,验证了算法的鲁棒性和有效性. 展开更多
关键词 深度强化学习 分层强化学习 优势加权 互信息 最大熵
下载PDF
加权先验概率优势关系的粗糙决策分析模型 被引量:2
2
作者 骆公志 李震 黄卫东 《统计与决策》 CSSCI 北大核心 2015年第20期67-70,共4页
文章针对含有不完备偏好信息的多属性决策问题,提出了基于加权先验概率优势关系的粗糙决策分析模型。首先分析了先验概率优势关系在判定未知属性取值上的不足,在此基础上给出了加权先验概率优势关系的概念,并由此得出粗糙近似,获取分类... 文章针对含有不完备偏好信息的多属性决策问题,提出了基于加权先验概率优势关系的粗糙决策分析模型。首先分析了先验概率优势关系在判定未知属性取值上的不足,在此基础上给出了加权先验概率优势关系的概念,并由此得出粗糙近似,获取分类决策规则。理论证明与实例分析均表明了新模型的有效性和实用性。 展开更多
关键词 多属性决策 不完备信息 粗糙集 加权先验概率优势关系
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部