期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
智能体记忆引导的学习与决策: 海马体记忆回放的视角
1
作者
朱觐镳
吴一帆
王东署
《控制理论与应用》
EI
CAS
CSCD
北大核心
2024年第10期1753-1764,共12页
生物体记忆回放对提高其学习和决策能力有重要作用.研究表明,生物体记忆回放主要是由位于海马体内的位置细胞完成的,在回放激活顺序和具体激活位置上具有多样性,但是现有模拟海马体记忆回放研究方法大多形式单一,只模拟了单方向或者部...
生物体记忆回放对提高其学习和决策能力有重要作用.研究表明,生物体记忆回放主要是由位于海马体内的位置细胞完成的,在回放激活顺序和具体激活位置上具有多样性,但是现有模拟海马体记忆回放研究方法大多形式单一,只模拟了单方向或者部分情形下的回放,难以较好地复现海马体记忆回放机理.因此,结合生物体记忆回放机理,多方面模拟海马体位置细胞的记忆回放功能来提高智能体的学习与决策性能,具有重要的研究价值和应用前景.针对静态栅格场景,本文通过使用组合的强化学习机制来模拟海马体重新激活的多样性,设计了一种轨迹采样和优先扫描两个过程相互交替使用的双向搜索模型,来模拟海马体不同位置记忆的再激活,同时,通过在线学习和离线学习的方式分别模拟生物体清醒和睡眠状态下的记忆机理,更好地复现海马体的记忆回放过程.进一步地,针对变化的动态场景,设计具有“一套参数,两段更新”功能的深度双向搜索模型,来提高智能体动态环境下的学习与决策性能.复杂静态和动态栅格环境下智能体导航实验以及与其他强化学习算法的性能对比实验验证了本文所提模型的有效性.
展开更多
关键词
记忆引导
决策
海马体
记忆回放
轨迹采样
优先扫描
下载PDF
职称材料
题名
智能体记忆引导的学习与决策: 海马体记忆回放的视角
1
作者
朱觐镳
吴一帆
王东署
机构
郑州大学电气与信息工程学院
龙门实验室智能系统科创中心
出处
《控制理论与应用》
EI
CAS
CSCD
北大核心
2024年第10期1753-1764,共12页
基金
国家自然科学基金项目(62173309,61873245)资助.
文摘
生物体记忆回放对提高其学习和决策能力有重要作用.研究表明,生物体记忆回放主要是由位于海马体内的位置细胞完成的,在回放激活顺序和具体激活位置上具有多样性,但是现有模拟海马体记忆回放研究方法大多形式单一,只模拟了单方向或者部分情形下的回放,难以较好地复现海马体记忆回放机理.因此,结合生物体记忆回放机理,多方面模拟海马体位置细胞的记忆回放功能来提高智能体的学习与决策性能,具有重要的研究价值和应用前景.针对静态栅格场景,本文通过使用组合的强化学习机制来模拟海马体重新激活的多样性,设计了一种轨迹采样和优先扫描两个过程相互交替使用的双向搜索模型,来模拟海马体不同位置记忆的再激活,同时,通过在线学习和离线学习的方式分别模拟生物体清醒和睡眠状态下的记忆机理,更好地复现海马体的记忆回放过程.进一步地,针对变化的动态场景,设计具有“一套参数,两段更新”功能的深度双向搜索模型,来提高智能体动态环境下的学习与决策性能.复杂静态和动态栅格环境下智能体导航实验以及与其他强化学习算法的性能对比实验验证了本文所提模型的有效性.
关键词
记忆引导
决策
海马体
记忆回放
轨迹采样
优先扫描
Keywords
memory-guided
decision-making
hippocampus
memory replay
trajectory sampling
prioritized sweeping
分类号
G63 [文化科学—教育学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
智能体记忆引导的学习与决策: 海马体记忆回放的视角
朱觐镳
吴一帆
王东署
《控制理论与应用》
EI
CAS
CSCD
北大核心
2024
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部