基于SAC算法的矿山应急救援智能车快速避障控制被引量：6

High speed obstacle avoidance control of mine emergency rescue intelligent vehicle based on SAC algorithm

下载PDF

导出

摘要针对传统反应式避障算法存在灵活度差及普适性不足的问题,提出Soft Actor-Critic深度强化学习算法的快速避障方法。通过分析SAC算法的框架及更新策略,采用ROS和RVIZ搭建实验仿真环境,优化SAC算法的状态输入,利用灾后中部车场、下部车场虚拟环境对智能体分别进行训练和验证。结果表明,SAC算法优化后,GPU计算速度和算法添加噪声会导致智能体奖励值出现波动,但最终奖励值趋于稳定,改善了优化前越训练奖励值越低的问题,使避障性能大幅度提升,为实现矿山应急救援智能车快速避障控制提供研究基础。 This paper proposes a fast obstacle avoidance method based on Soft Actor-Critic deep reinforcement learning algorithm as an improved alternative to traditional reactionary obstacle avoidance algorithms plagued by the poor flexibility and universality.The study involves analyzing the framework and update strategy of SAC algorithm,building the experimental simulation environment using ROS and RVIZ,optimizing the state input of SAC algorithm,and training and verifying the agents using the virtual environment of the middle yard and the lower yard after the disaster.The results show that the value fluctuation in agent reward due to GPU computing speed and the algorithm noise addition after the SAC algorithm optimization is outweighed by the tendency of final reward value to be stable,an improvement over pre-optimization training in which the more training causes lower reward value and this enables the great improvement in the performance of obstacle avoidance.The research could inform the fast obstacle avoidance control of mine emergency rescue intelligent vehicle.

作者单麒源张智豪张耀心余宗祥 Shan Qiyuan;Zhang Zhihao;Zhang Yaoxin;Yu Zongxiang(School of Mining Engineering, Heilongjiang University of Science & Technology, Harbin 150022, China)

机构地区黑龙江科技大学矿业工程学院

出处《黑龙江科技大学学报》 CAS 2021年第1期14-20,共7页 Journal of Heilongjiang University of Science And Technology

基金黑龙江省省属高校基本科研业务费项目(2018-KYYWF-1173)。

关键词矿山应急救援深度强化学习反应式避障 SAC算法 mine emergency rescue deep reinforcement learning reactive obstacle avoidance Soft Actor-Critic algorithm

分类号 TD82 [矿业工程—煤矿开采]

引文网络
相关文献

参考文献3

1刘庆杰,林友勇,李少利.面向智能避障场景的深度强化学习研究[J].智能物联技术,2018,1(2):18-22. 被引量：2
2冯尚友.信息熵与最大熵原理[J].水利电力科技,1995,22(3):24-29. 被引量：12
3徐国艳,宗孝鹏,余贵珍,苏鸿杰.基于DDPG的无人车智能避障方法研究[J].汽车工程,2019,41(2):206-212. 被引量：14

二级参考文献10

1乔俊飞,侯占军,阮晓钢.基于神经网络的强化学习在避障中的应用[J].清华大学学报（自然科学版）,2008,48(S2):1747-1750. 被引量：27
2冯尚友.熵的微观解释与信息[J].水利电力科技,1995,22(1):5-11. 被引量：2
3李伟.在未知环境中基于模糊逻辑的移动机器人行为控制[J].控制理论与应用,1996,13(2):153-162. 被引量：16
4李保国,张春熹.双轮移动机器人安全目标追踪与自动避障算法[J].控制理论与应用,2007,24(4):535-540. 被引量：13
5梁宏倩.多智能体系统中强化学习模型的改进及应用[J].西安文理学院学报（自然科学版）,2008,11(2):93-96. 被引量：1
6杨会会,宁丽娟.非线性漂移的Fokker-Planck方程的近似非定态解[J].物理学报,2013,62(18):38-45. 被引量：3
7徐国华,谭民.移动机器人的发展现状及其趋势[J].机器人技术与应用,2001(3):7-14. 被引量：190
8时巧,李财,邓渊.智能巡线小车的设计[J].微型机与应用,2015,34(9):78-80. 被引量：10
9徐梁征,肖成永,张建武.汽车列车系统稳定性分析及控制系统仿真[J].计算机仿真,2003,20(12):107-110. 被引量：5
10王树凤,张大伟.车速与前轮转角的极限关系分析[J].机械设计与制造,2017(S1):237-240. 被引量：5

共引文献25

1赵健,宋东鉴,朱冰,刘斌,陈志成,张培兴.基于自学习和监督学习混合驱动的智能汽车跟驰控制策略[J].中国公路学报,2022,35(3):55-65. 被引量：4
2张群,刘文生.基于三维熵式度量模型的风险型决策[J].统计与决策,2008,24(16):60-62. 被引量：1
3张群,刘文生,孙晓娟.熵权决策法在项目投资决策中的应用[J].统计与决策,2009,25(1):169-170. 被引量：9
4裴勇,孙玉娣.多进制网络时间隐蔽信道设计及仿真实现[J].科学技术与工程,2011,11(26):6377-6381.
5张丽青,寿永熙,马志强.最大熵算法在汉语拼音标注中的研究与实现[J].微电子学与计算机,2012,29(8):120-122. 被引量：1
6严霄凤.基于熵的密码强度估计[J].网络安全技术与应用,2012(11):36-38. 被引量：1
7何庭杰,孙兴波,曾黄麟.基于粗糙集理论和系统信息覆盖率最大化原则的白酒香型识别[J].酿酒科技,2014(4):1-4.
8黎澄生,贾鹏飞.基于χ^2函数的e-p曲线模型[J].水文地质工程地质,2016,43(4):84-88. 被引量：1
9田桐羽,玉梅,苏虹.基于信息熵的产业结构与土地利用结构优化的相关性分析——以呼和浩特市为例[J].安徽农业科学,2018,46(7):6-9. 被引量：2
10汪佳炎,邵雪杰.基于信息熵——信道模型的水利项目风险识别[J].才智,2013(20):246-246.

同被引文献52

1李茹杨,彭慧民,李仁刚,赵坤.强化学习算法与应用综述[J].计算机系统应用,2020,29(12):13-25. 被引量：45
2曾德全,余卓平,张培志,陈慧勇.三次B样条曲线的无人车避障轨迹规划[J].同济大学学报（自然科学版）,2019,47(S01):159-163. 被引量：14
3徐永.基于满意度的多目标约束模糊控制规则库的建立及应用[J].交通运输工程与信息学报,2013,11(1):74-78. 被引量：1
4张晓南,王德泉,杨俊峰.坦克战场目标威胁评估方法[J].指挥信息系统与技术,2015,6(1):45-48. 被引量：9
5王道威,朱明富,刘慧.动态步长的RRT路径规划算法[J].计算机技术与发展,2016,26(3):105-107. 被引量：33
6姬浩,徐寅峰,苏兵.基于城市清洁车作业行为的移动瓶颈建模与仿真[J].系统工程学报,2016,31(5):676-688. 被引量：3
7马静,王佳斌,张雪.A*算法在无人车路径规划中的应用[J].计算机技术与发展,2016,26(11):153-156. 被引量：10
8宋晓琳,周南,黄正瑜,曹昊天.改进RRT在汽车避障局部路径规划中的应用[J].湖南大学学报（自然科学版）,2017,44(4):30-37. 被引量：61
9胡晓峰,贺筱媛,陶九阳.AlphaGo的突破与兵棋推演的挑战[J].科技导报,2017,35(21):49-60. 被引量：37
10张新钰,高洪波,赵建辉,周沫.基于深度学习的自动驾驶技术综述[J].清华大学学报（自然科学版）,2018,58(4):438-444. 被引量：116

引证文献6

1沈悦,陈璟,周子涵,杨达.车联网环境下自动驾驶车辆动态障碍物协作避让模型[J].交通运输工程与信息学报,2021,19(4):13-23. 被引量：3
2徐建华,邵康康,王佳惠,刘学聪.基于改进强化学习的移动机器人动态避障方法[J].中国惯性技术学报,2023,31(1):92-99. 被引量：5
3李永迪,李彩虹,张耀玉,张国胜.基于改进SAC算法的移动机器人路径规划[J].计算机应用,2023,43(2):654-660. 被引量：7
4宁强,刘元盛,谢龙洋.基于SAC的自动驾驶车辆控制方法应用[J].计算机工程与应用,2023,59(8):306-314. 被引量：2
5赵书海.人工智能在矿山应急救援中的应用[J].世界有色金属,2023(18):195-197.
6彭莉莎,孙宇祥,薛宇凡,周献中.融合三支多属性决策与SAC的兵棋推演智能决策技术[J].系统工程与电子技术,2024,46(7):2310-2322.

二级引证文献17

1刘怿轩,张慧永,王猛,吴欢,宗芳.跟驰自动驾驶车时人驾车行为研究:实证与建模[J].交通运输工程与信息学报,2023,21(2):14-28. 被引量：6
2王亚波,靳玉良,张亚,范世伟,于飞.基于激光雷达的结构化道路障碍物检测方法[J].中国惯性技术学报,2023,31(6):593-600. 被引量：6
3赖信君,林深和,邹靖凯,李敏,黄家琪,刘智睿,傅惠.基于群体感性工学的智能网联汽车功能偏好分析[J].交通运输工程与信息学报,2023,21(3):59-73. 被引量：2
4宋春雷,张嘉轩,田晓春,徐建华,吴晓晖,张钰荣.基于优化的离散空间轨迹规划算法[J].中国惯性技术学报,2023,31(11):1150-1156. 被引量：1
5Tingjun Lei,Timothy Sellers,Chaomin Luo,Daniel W.Carruth,Zhuming Bi.Graph-based robot optimal path planning with bio-inspired algorithms[J].Biomimetic Intelligence & Robotics,2023,3(3):75-90. 被引量：2
6葛星,秦丽,沙瀛.基于投影奖励机制的多机器人协同编队与避障[J].应用科学学报,2024,42(1):174-188.
7侯远韶.基于视觉跟踪的移动机器人路径规划研究[J].信息技术与信息化,2023(12):89-92. 被引量：1
8张坤鹏,常成,王世璞,张佐,李力.自动驾驶汽车仿真器综述:能力、挑战和发展方向[J].交通运输工程与信息学报,2024,22(1):1-24. 被引量：6
9徐建华,吴晓晖,张嘉轩,张钰荣.一种未知环境下移动机器人自主导航方法[J].中国惯性技术学报,2024,32(3):250-257.
10张晓莉,郭仕林,刘鼎,宋婉莹.基于改进SAC的倒立摆控制算法研究[J].电子测量技术,2024,47(1):93-100. 被引量：1

1《山东煤炭科技》征稿简则[J].山东煤炭科技,2021,39(1).
2朱震,陶健康,娄培杰.全断面组合锚注加固技术在软岩巷道修复中的应用[J].建井技术,2020,41(3):53-56. 被引量：1
3赵立新,甄创家,张斌,李烁.基于FLAC^3D的车场支护方案数值模拟[J].四川建材,2020,46(9):82-83.
4田本强.浅析溜煤上山联合煤仓在急倾斜煤层中的应用[J].中国设备工程,2020(11):211-212.
5《山东煤炭科技》征稿简则[J].山东煤炭科技,2021,39(2).
6张亮,张志忠,方运买,汪海波,娄培杰,陶健康.泥质胶结软岩巷道锚注支护技术[J].煤炭技术,2020,39(10):10-13. 被引量：9
7王炎宾,朱士强,赵文岭.厚泥岩层大跨度巷道支护设计及巷修技术实践应用[J].内蒙古科技与经济,2020,0(7):87-88. 被引量：2
8郭坤,武曲,张义.基于PPO的机械臂控制研究方法[J].电脑知识与技术,2021,17(4):222-225. 被引量：1
9徐麒皓,李波.基于NRU网络的肺结节检测方法[J].计算机工程与应用,2021,57(4):83-90. 被引量：2
10蒋大峰,梁旭超.芦岭煤矿Ⅲ4采区巷道布置方案比选[J].现代矿业,2020,36(2):57-59. 被引量：2

黑龙江科技大学学报

2021年第1期

浏览历史

内容加载中请稍等...

基于SAC算法的矿山应急救援智能车快速避障控制被引量：6

参考文献3

二级参考文献10

共引文献25

同被引文献52

引证文献6

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

基于SAC算法的矿山应急救援智能车快速避障控制 被引量：6

参考文献3

二级参考文献10

共引文献25

同被引文献52

引证文献6

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

基于SAC算法的矿山应急救援智能车快速避障控制被引量：6