逆向强化学习研究概述被引量：1

下载PDF

导出

摘要深度强化学习在可以手动设计奖励函数的领域取得了优异的效果。逆向强化学习利用专家演示数据推断奖励函数,可以有效解决强化学习的奖励函数设计困难的问题。为了全面反映逆向强化学习的研究进展,本文对国内外公开发表的具有代表性的论文进行了概述。本文首先介绍了逆向强化学习的简介,然后概述了逆向强化学习的研究进展,最后提出了逆向强化学习存在的问题以及未来的研究方向。

作者刘旖菲

机构地区湖北大学计算机与信息工程学院

出处《电脑知识与技术》 2021年第15期190-191,共2页 Computer Knowledge and Technology

基金国家级大学生创新创业训练计划项目,基于分层强化学习的端到端自动驾驶运动规划模型研究(202010512030)。

关键词人工智能深度学习逆向强化学习

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

同被引文献3

1郭应时,蒋拯民,白艳,唐杰帧.无人驾驶汽车路径跟踪控制方法拟人程度研究[J].中国公路学报,2018,31(8):189-196. 被引量：29
2高振海,孙天骏,何磊.汽车纵向自动驾驶的因果推理型决策[J].吉林大学学报（工学版）,2019,49(5):1392-1404. 被引量：12
3高振海,闫相同,高菲,孙天骏.仿驾驶员DDPG汽车纵向自动驾驶决策方法[J].汽车工程,2021,43(12):1737-1744. 被引量：11

引证文献1

1高振海,闫相同,高菲.基于逆向强化学习的纵向自动驾驶决策方法[J].汽车工程,2022,44(7):969-975. 被引量：7

二级引证文献7

1姚悦,吉明佳,杨霄.基于改进PPO算法的自动驾驶技术研究[J].电子测量技术,2023,46(8):162-168. 被引量：1
2吕相霖,臧兆祥,李思博,王俊英.基于注意力的循环PPO算法及其应用[J].计算机技术与发展,2024,34(1):136-142.
3陈阳,华维,曹志金.基于逆向学习的水电厂现场作业风险预警模型研究[J].中国农村水利水电,2024(1):257-261. 被引量：1
4傅明建,郭福强.基于深度强化学习的无信号灯路口决策研究[J].计算机工程,2024,50(5):91-99.
5杨硕,李时珍,赵中原,黄小鹏,黄岩军.基于时序差分学习模型预测控制的一体化自动驾驶换道策略[J].机械工程学报,2024,60(10):329-338.
6张名芳,马健,赵娜乐,王力,刘颖.无信号交叉口处基于深度强化学习的智能网联车辆运动规划[J].浙江大学学报（工学版）,2024,58(9):1923-1934.
7宋莉,李大字,徐昕.逆强化学习算法、理论与应用研究综述[J].自动化学报,2024,50(9):1704-1723.

电脑知识与技术

2021年第15期

浏览历史

内容加载中请稍等...

逆向强化学习研究概述被引量：1

同被引文献3

引证文献1

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

逆向强化学习研究概述 被引量：1

同被引文献3

引证文献1

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

逆向强化学习研究概述被引量：1