-
题名面向动态三维迷宫的综合奖励设计
- 1
-
-
作者
焦昌成
王少威
-
机构
武汉科技大学计算机科学与技术学院
武汉科技大学机器人与智能系统研究院
智能信息处理与实时工业系统湖北省重点实验室
-
出处
《计算机应用研究》
CSCD
北大核心
2024年第6期1699-1703,共5页
-
基金
国家自然科学基金资助项目(62073249)
湖北省技术创新专项重大资助项目(2019AAA071)。
-
文摘
动态三维迷宫是较为困难的、具有不确定性和不完全信息的强化学习任务环境,使用常规奖励函数在此环境中训练任务,速度缓慢甚至可能无法完成。为解决利用强化学习在动态迷宫中寻找多目标的问题,提出一种基于事件触发的综合奖励方案。该方案将三维迷宫中各种行为状态表达为各种事件,再由事件驱动奖励。奖励分为环境奖励和内部奖励,其中环境奖励与三维迷宫任务直接相关,含有体现任务目标的节点奖励和任务约束的约束奖励。内部奖励与智能体学习过程中的状态感受相关,含有判断奖励和心情奖励。在实验中,综合奖励的性能均值相较于改进奖励提升54.66%。结果表明,综合奖励方案在提高完成任务满意度、增强探索能力、提升训练效率方面具有优势。
-
关键词
三维迷宫
奖励设计
强化学习
事件触发
-
Keywords
3D maze
reward design
reinforcement learning
event trigger
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名我和“作文成功之路”的不解之缘
- 2
-
-
作者
焦昌成
-
机构
湖北谷城县五山二中八年级
-
出处
《作文成功之路(中考冲刺)》
2012年第9期56-56,共1页
-
文摘
9年前的偶遇,让我与你结下了不解之缘。5岁时,我在上高中的表哥家第一次遇见你——《作文成功之路》(2003年第1期),你“站”在书桌上,新颖简洁的外表,一下子就吸引了我。我拿起笔在你身上乱涂起来,并撕下了几页叠纸飞机。表哥发现后,愤怒地把我“修理”了一顿,使我对你“恨之入骨”。
-
关键词
成功之路
作文
纸飞机
高中
-
分类号
G633.34
[文化科学—教育学]
-