期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
受限玻尔兹曼机及其变体研究综述
1
作者 汪强龙 高晓光 +2 位作者 吴必聪 胡子剑 万开方 《系统工程与电子技术》 EI CSCD 北大核心 2024年第7期2323-2345,共23页
受限玻尔兹曼机作为学习数据分布和提取内在特征的典型概率图模型,是深度学习领域重要的基础模型。近年来,通过改进受限玻尔兹曼机的模型结构和能量函数得到众多新兴模型,即受限玻尔兹曼机变体,可以进一步提升模型的特征提取性能。研究... 受限玻尔兹曼机作为学习数据分布和提取内在特征的典型概率图模型,是深度学习领域重要的基础模型。近年来,通过改进受限玻尔兹曼机的模型结构和能量函数得到众多新兴模型,即受限玻尔兹曼机变体,可以进一步提升模型的特征提取性能。研究受限玻尔兹曼机及其变体能够显著促进深度学习领域的发展,实现大数据时代海量信息的快速提取。基于此,对近年来受限玻尔兹曼机及其变体的相关研究进行系统回顾,并创新性地从训练算法改进、模型结构改进、模型深层融合研究和模型相关最新应用4个方面进行全面综述。其中,重点梳理受限玻尔兹曼机训练算法和变体模型的发展史。最后,讨论受限玻尔兹曼机及其变体领域的现存难点与挑战,对主要研究工作进行总结与展望。 展开更多
关键词 受限玻尔兹曼机 深度学习 受限玻尔兹曼机变体 概率无向图 特征提取
下载PDF
异策略深度强化学习中的经验回放研究综述
2
作者 胡子剑 高晓光 +3 位作者 万开方 张乐天 汪强龙 NERETIN Evgeny 《自动化学报》 EI CAS CSCD 北大核心 2023年第11期2237-2256,共20页
作为一种不需要事先获得训练数据的机器学习方法,强化学习(Reinforcement learning,RL)在智能体与环境的不断交互过程中寻找最优策略,是解决序贯决策问题的一种重要方法.通过与深度学习(Deep learning,DL)结合,深度强化学习(Deep reinfo... 作为一种不需要事先获得训练数据的机器学习方法,强化学习(Reinforcement learning,RL)在智能体与环境的不断交互过程中寻找最优策略,是解决序贯决策问题的一种重要方法.通过与深度学习(Deep learning,DL)结合,深度强化学习(Deep reinforcement learning,DRL)同时具备了强大的感知和决策能力,被广泛应用于多个领域来解决复杂的决策问题.异策略强化学习通过将交互经验进行存储和回放,将探索和利用分离开来,更易寻找到全局最优解.如何对经验进行合理高效的利用是提升异策略强化学习方法效率的关键.首先对强化学习的基本理论进行介绍;随后对同策略和异策略强化学习算法进行简要介绍;接着介绍经验回放(Experience replay,ER)问题的两种主流解决方案,包括经验利用和经验增广;最后对相关的研究工作进行总结和展望. 展开更多
关键词 深度强化学习 异策略 经验回放 人工智能
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部