深度强化学习及智能路径规划应用综述被引量：1

Review of Deep Reinforcement Learning and Its Application in Intelligent Path Planning Algorithms

下载PDF

导出

摘要强化学习是人工智能的重要分支,具备与环境直接交互学习能力并具有优化决策的特点。强化学习问世以来便受到科研学者广泛关注,并探索其与深度学习之间融合的可能性。强化学习应用广泛,渗透教育、医药卫生、制造业、金融等多个领域。通过总结值函数与策略更新两种深度强化学习算法的演变历程,分别探索强化学习在智能路径规划领域中的优化算法,探讨算法落地过程中的难点及发展方向。 Reinforcement learning is an important branch of artificial intelligence,which has the ability to directly interact with the environment to learn and optimize decision-making.Since its inception,reinforcement learning has been widely concerned by researchers and explored the possibility of integration with deep learning.Reinforcement learning has a wide range of applica⁃tions,infiltrating many fields such as education,medicine and health,manufacturing,and finance.By summarizing the evolution of the two deep reinforcement learning algorithms,value function and policy update,the optimization algorithms of reinforcement learning in the field of intelligent path planning are explored respectively,and the difficulties and development directions in the process of algorithm implementation are discussed.

作者程浩鹏朱涵杨高奇晏为民王慧婷 Cheng Haopeng;Zhu Han;Yang Gaoqi;Yan Weimin;Wang Huiting(School of Computer Science,Civil Aviation Flight University of China,Guanghan 618300;School of Science,Civil Aviation Flight University of China,Guanghan 618300)

机构地区中国民用航空飞行学院计算机学院中国民用航空飞行学院理学院

出处《现代计算机》 2022年第21期1-10,共10页 Modern Computer

基金中国民用航空飞行学院学生科研基金(XSB2022-069)。

关键词强化学习路径规划深度神经网络 reinforcement learning path planning deep neural network

分类号 TP242 [自动化与计算机技术—检测技术与自动化装置] TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献8

1徐国华,谭民.移动机器人的发展现状及其趋势[J].机器人技术与应用,2001(3):7-14. 被引量：189
2李磊,叶涛,谭民,陈细军.移动机器人技术研究现状与未来[J].机器人,2002,24(5):475-480. 被引量：343
3高峰,郭为忠.中国机器人的发展战略思考[J].机械工程学报,2016,52(7):1-5. 被引量：72
4王雪莹,袁盛玥,张译芳,马世峰.多条件约束下的汽车微观动态滚动轨迹规划[J].汽车实用技术,2022,47(9):14-23. 被引量：2
5杨韵,王成彦,巫凯旋,杨诗丹,李佳文,翁伟涛.移动机器人全局路径规划算法综述[J].信息记录材料,2022,23(3):29-32. 被引量：14
6张旭,程传奇,郝向阳,李建胜,胡鹏.一种兼顾全局与局部特性的机器人动态路径规划算法[J].测绘科学技术学报,2018,35(3):315-320. 被引量：26
7张同法,于雷,鲁艺.多架无人机协同作战的路径规划[J].火力与指挥控制,2009,34(2):143-145. 被引量：14
8董永峰,杨琛,董瑶,屈向前,肖华昕,王子秋.基于改进的DQN机器人路径规划[J].计算机工程与设计,2021,42(2):552-558. 被引量：18

二级参考文献46

1高晓光,符小卫,宋绍梅.多UCAV航迹规划研究[J].系统工程理论与实践,2004,24(5):140-143. 被引量：25
2段俊花,李孝安.基于改进遗传算法的机器人路径规划[J].微电子学与计算机,2005,22(1):70-72. 被引量：26
3蒋新松.未来机器人技术发展方向的探讨[J].机器人,1996,18(5):285-291. 被引量：45
4王越超.多机器人协作系统研究：博士论文[M].哈尔滨工业大学,1999..
5MANYIKA J, CHUI M, BUGHIN J, et al. Disruptive technologies: Advances that will transform life, business, and the global economy[M]. San Francisco, CA, USA: McKinsey Global Institute, 2013.
6CHRISTENSEN H, BATZINGER T, BEKRIS K, et al. A roadmap for U.S. robotics- from internet to robotics[R]. USA: Computing Community Consortium and Computing Research Assoc., 2009.
7BARACK H O. Advanced manufacturing partnership (AMP)[R]. Washington: US Presidential Science and Technology Advisory Committee, 2011.
8BARACK H O. National robotics initiative (NRI)[R]. Washington: US National Science Foundation, 2011.
9CUI Zhongqing. Robot future strategy 2022[R]. Seoul.- South Korean Ministry of Knowledge Economy, 2012.
10Industry 4.0 Working Group. Securing the future of German manufacturing industry recommendations for implementing the strategic initiative INDUSTRY 4.0[R]. Berlin: German Federal Ministry for Education, 2013.

共引文献634

1张保磊,赵世佳,李炜,方毅芳,刘涛.机器人产业“聪敏机器”和“知识重构”双驱策略研究[J].中国仪器仪表,2023(2):21-26.
2郑亚君,薛磊,董璐,王庆领.基于UWB定位技术的多移动机器人编队控制[J].智能科学与技术学报,2019,1(1):83-87.
3迟旭,李花,费继友.基于改进A^(*)算法与动态窗口法融合的机器人随机避障方法研究[J].仪器仪表学报,2021,42(3):132-140. 被引量：77
4唐尧,张恩政,陈本永,陈刚,刘翠苹.基于运动学分析的工业机器人轨迹精度补偿方法[J].仪器仪表学报,2020,41(3):175-183. 被引量：24
5刘兰兰.基于梯形速度规划算法的新能源汽车规划管理研究[J].山西能源学院学报,2024,37(3):97-99.
6孟广雄,闫海勇,刘俊梅,田军,黄国坤.炸药混装车智能精准装药系统构建及效益分析[J].煤炭工程,2020,52(S02):1-5.
7董康兴,包振山,任智慧,温鹏云.智能井场巡检机器人结构设计[J].机械设计,2022,39(S02):31-34. 被引量：4
8汪中原.基于5G技术的智能机器人技术[J].电子技术（上海）,2020(3):54-55. 被引量：1
9刘显祖,熊泽群,许旵鹏,臧伟,翁凌,孔庆华,于和林,刘会良.虚拟现实技术在特高压变电站的应用[J].安徽电力,2020,37(1):35-38. 被引量：1
10邬再新,李艳宏,刘涛.多移动机器人路径规划技术的研究现状与展望[J].机械,2008,35(1):1-3. 被引量：11

同被引文献50

1任伟建,王飞,吕微.分层模糊控制的移动机器人路径规划[J].科学技术与工程,2010,10(10):2317-2321. 被引量：3
2万晓凤,胡伟,郑博嘉,方武义.基于改进蚁群算法与Morphin算法的机器人路径规划方法[J].科技导报,2015,33(3):84-89. 被引量：14
3张俊溪,米国际,王鑫,蒋江红.基于进化算法和模糊控制的机器人路径规划[J].计算机技术与发展,2018,28(6):49-52. 被引量：6
4李丽娜,郭永强,张晓东,卢媛,徐攀峰.萤火虫算法结合人工势场法的机器人路径规划[J].计算机工程与应用,2018,54(20):104-109. 被引量：29
5程志,张志安,李金芝,江涛.改进人工势场法的移动机器人路径规划[J].计算机工程与应用,2019,55(23):29-34. 被引量：46
6翟敬梅,刘坤,徐晓.室内移动机器人自主导航系统设计与方法[J].计算机集成制造系统,2020,26(4):890-899. 被引量：22
7郭娜,李彩虹,王迪,张宁,宋莉.基于模糊控制的移动机器人局部路径规划[J].山东理工大学学报（自然科学版）,2020,34(4):24-29. 被引量：11
8郑凯林,韩宝玲,王新达.基于改进TEB算法的阿克曼机器人运动规划系统[J].科学技术与工程,2020,20(10):3997-4003. 被引量：30
9王凡,李铁军,刘今越,赵海文.基于BIM的建筑机器人自主路径规划及避障研究[J].计算机工程与应用,2020,56(17):224-230. 被引量：22
10张瑜,宋荆洲,张琪祁.基于改进动态窗口法的户外清扫机器人局部路径规划[J].机器人,2020,42(5):617-625. 被引量：39

引证文献1

1于军琪,陈易圣,冯春勇,苏煜聪,郭聚刚.智能建造机器人局部路径规划研究综述[J].计算机工程与应用,2024,60(10):16-29.

1李巧玉.小学语文阅读教学中如何渗透心理健康教育[J].品位·经典,2022(24):161-162. 被引量：1
2方艳青,严婕,胡蝶,孟娜.MXene复合膜的制备及其水处理应用综述[J].资源节约与环保,2022(12):119-122. 被引量：3
3马宏刚.在小学数学教学中渗透德育的途径[J].数学学习与研究,2022(31):155-157.
4郭峰,陈金川,谢云.基于CNN-LSTM的运动想象脑电四分类研究[J].现代电子技术,2023,46(2):132-136. 被引量：1
5余敏.使用后评价在我国城市绿地中的研究应用综述[J].绿色建筑,2022,14(6):30-32.
6庞晓波.中职学前专业学生师德教育培养策略与方法[J].师道（教研）,2022(12):81-81.
7梁志鹏,杨进霞.基于完全二部图K_(m,n)的广义Sierpiński网络的全控制数[J].数学的实践与认识,2022,52(11):235-239.
8何佳强.案例教学法应用于篮球裁判教学的分析[J].新体育（下半月）,2022(12):84-86.
9陈进华,高云龙.一致分数阶导数意义下NLS方程和CNLS方程的精确解[J].数学的实践与认识,2022,52(11):209-215.

现代计算机

2022年第21期

浏览历史

内容加载中请稍等...

深度强化学习及智能路径规划应用综述被引量：1

参考文献8

二级参考文献46

共引文献634

同被引文献50

引证文献1

相关作者

相关机构

相关主题

浏览历史

深度强化学习及智能路径规划应用综述 被引量：1

参考文献8

二级参考文献46

共引文献634

同被引文献50

引证文献1

相关作者

相关机构

相关主题

浏览历史

深度强化学习及智能路径规划应用综述被引量：1