-
题名面向策略探索的强化学习与进化计算方法综述
被引量:3
- 1
-
-
作者
王尧
罗俊仁
周棪忠
谷学强
张万鹏
-
机构
国防科技大学智能科学学院
中国人民解放军
-
出处
《计算机科学》
CSCD
北大核心
2024年第3期183-197,共15页
-
文摘
强化学习与进化计算作为两类自然启发的学习范式,是当前求解策略探索问题的主流方法,两类方法的融合为策略探索问题的求解提供了通用解决方案。通过对比强化学习与进化计算,从强化学习与进化计算的基本方法、策略探索的基础方法分析、策略探索的融合式方法分析以及前沿挑战4个方面全面分析了策略探索问题的方法,以期能够为该领域的交叉融合研究带来启发。
-
关键词
马尔可夫决策过程
强化学习
进化计算
策略搜索
元学习
-
Keywords
Markov decision-making process
Reinforcement learning
Evolutionary computation
Strategy exploration
Meta learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名事件抽取方法综述:深度学习与预训练对比分析
- 2
-
-
作者
王嘉宾
罗俊仁
周棪忠
王超
张万鹏
-
机构
国防科技大学智能科学学院
-
出处
《计算机科学》
CSCD
北大核心
2024年第9期196-206,共11页
-
文摘
事件抽取是伴随着信息技术的发展而诞生的。随着人们对从繁多的日常信息中抽取出有用信息的需求日益增强,事件抽取的研究发展也越发受重视。首先,介绍了事件抽取的发展历程,理清了事件抽取的发展脉络;其次,介绍了事件抽取的2种范式,并对管道型抽取和联合型抽取范式进行了对比分析;再次,围绕事件抽取的层级,分别从句子级事件抽取和篇章级事件抽取2个层面对近年来事件抽取的发展进行了梳理;然后,从传统型事件抽取方法、基于深度学习的事件抽取方法,以及基于预训练模型的事件抽取方法3个方面对事件抽取方法进行了对比分析;最后,介绍了事件抽取的典型应用场景,并根据事件抽取的发展现状,对未来事件抽取前沿发展进行了展望。
-
关键词
事件抽取
论元
触发词
要素抽取
时序抽取
预训练
-
Keywords
Event extraction
Argument
Trigger word
Entity extraction
Temporal extraction
Pre-training
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名面向低轨星座边缘计算的博弈强化学习方法综述
- 3
-
-
作者
谷学强
张万鹏
谭思雨
罗俊仁
周棪忠
-
机构
国防科技大学智能科学学院
湖南先进技术研究院
-
出处
《智能科学与技术学报》
CSCD
2024年第3期301-318,共18页
-
基金
国家自然科学基金项目(No.92271108,No.62173336)。
-
文摘
博弈强化学习作为人工智能领域的新兴范式,是当前解决低轨星座边缘计算问题的主流方法。融入博弈论的多智能体深度强化学习方法为复杂、动态、不确定性的星座边缘计算问题提供了新思路。通过梳理总结卫星组网、任务卸载以及资源调度3种卫星边缘计算主要研究方向,详细阐述了博弈强化学习范式基础,并从博弈模型、深度Q网络、深度确定性策略梯度以及近端策略优化等方面分别阐述了3种研究方向上的典型应用现状,最后对该领域的前沿挑战进行分析,期望为博弈强化学习范式与低轨星座边缘计算领域的交叉融合研究提供参考。
-
关键词
低轨星座
边缘计算
博弈论
多智能体强化学习
-
Keywords
low-orbit constellation
edge computing
game theory
multi-agent reinforcement learning
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名严明法纪纯正基层风气
- 4
-
-
作者
周棪忠
-
机构
国防科技大学军事基础教育学院
-
出处
《基层政治工作研究》
2020年第12期69-69,共1页
-
文摘
法纪贯之于基层则基层稳,风气正之于基层则基层兴。建设法纪严、风气正的过硬基层,就要扭住强化思想引领、立起标杆尺度、严肃监督执纪等关键环节发力,以严明的法治和纪律凝聚铁的意志、锤炼铁的作风、锻造铁的队伍。一、强化思想引领。
-
关键词
监督执纪
纪贯之
思想引领
基层
关键环节
风气
-
分类号
D26
[政治法律—中共党史]
-