离散制造系统环境下基于深度Q学习的AGV路径规划被引量：2

Research on AGV Path Planning Based on Deep Q Learning under Discrete Manufacturing SystemEnvironment

下载PDF

导出

摘要针对传统深度Q学习算法在AGV路径规划问题容易过估计和收敛效果不好的问题,提出一种改进的双深度Q学习算法,通过引入优先经验回放机制和基于启发式信息的连续奖励函数,提高AGV智能体的有效训练,利用贪婪策略和玻尔兹曼策略结合的动作选择策略在与环境交互的训练中引导AGV智能体充分探索环境。仿真实验结果表明,所提出的算法能够规划出良好的AGV路径,而且在算法的稳定性和收敛速度上有所提升。 To solve the problem that the traditional deep Q learning algorithm is prone to overestimation and poor convergence in AGV path planning,we proposed an improved double deep Q learning algorithm.By introducing the preferential experience playback mechanism and continuous reward function based on heuristic information,we improved the training efficiency of AGV agents.Next,using the action selection strategy combining greed strategy and Boltzmann strategy,we guided the AGV agents to fully explore the environment during their interaction with it.The simulation result showed that the proposed algorithm can provide good AGV path planning results,and achieve better stability and convergence speed.

作者房殿军周彬彬赵春苗 ROLF Schmidt FANG Dianjun;ZHOU Binbin;ZHAO Chunmiao;SCHMIDT Rolf(School of Mechanical Engineering,Tongji University,Shanghai 200092;Qingdao Sino-German Institute of Intelligent Technologies,Qingdao 266000;Suzhou i-COW Intelligent Logistics Technology Co.,Ltd.,Suzhou 215000,China)

机构地区同济大学机械与能源工程学院青岛中德智能技术研究院苏州罗伯特木牛流马物流技术有限公司

出处《物流技术》 2023年第6期45-51,共7页 Logistics Technology

基金国家重点研发计划“政府间国际科技创新合作”重点专项项目(2022YFE0114300)。

关键词 AGV路径规划强化学习离散制造系统 DQN算法 AGV path planning reinforcement learning discrete manufacturing system DQN algorithm

分类号 TP242 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献6

1张新艳,邹亚圣.基于改进A^(*)算法的自动导引车无碰撞路径规划[J].系统工程理论与实践,2021,41(1):240-246. 被引量：34
2程满,杨光永,徐天奇,黄卓群,戈一航.基于电子地图的D^(*)补偿算法AGV路径规划[J].计算机与数字工程,2022,50(10):2187-2191. 被引量：3
3秦昌礼,张华强,刘林,陈雨,苏庆华.一种基于改进PSO-PIO算法的AGV路径规划方法[J].哈尔滨理工大学学报,2022,27(3):82-89. 被引量：8
4唐恒亮,唐滋芳,董晨刚,尹棋正,海秋茹.基于启发式强化学习的AGV路径规划[J].北京工业大学学报,2021,47(8):895-903. 被引量：9
5刘志荣,姜树海,袁雯雯,史晨辉.基于深度Q学习的移动机器人路径规划[J].测控技术,2019,38(7):24-28. 被引量：23
6郭心德,丁宏强.离散制造智能工厂场景的AGV路径规划方法[J].广东工业大学学报,2021,38(6):70-76. 被引量：4

二级参考文献55

1刘朝阳,穆朝絮,孙长银.深度强化学习算法与应用研究现状综述[J].智能科学与技术学报,2020(4):314-326. 被引量：45
2王学宁,陈伟,张锰,徐昕,贺汉根.增强学习中的直接策略搜索方法综述[J].智能系统学报,2007,2(1):16-24. 被引量：8
3郭广寒,王志刚.一种改进的粒子群算法[J].哈尔滨理工大学学报,2010,15(2):31-34. 被引量：20
4贺丽娜,楼佩煌,钱晓明,刘冉.基于时间窗的自动导引车无碰撞路径规划[J].计算机集成制造系统,2010,16(12):2630-2634. 被引量：44
5彭乐,张立民,邓向阳.基于种群多样性模糊控制的粒子群算法[J].计算机仿真,2012,29(4):255-258. 被引量：3
6巩敦卫,曾现峰,张勇.基于改进模拟退火算法的机器人全局路径规划[J].系统仿真学报,2013,25(3):480-483. 被引量：27
7童亮,王准.强化学习在机器人路径规划中的应用研究[J].计算机仿真,2013,30(12):351-355. 被引量：13
8周俊,陈钦,梁泉.基于强化学习的农业移动机器人视觉导航[J].农业机械学报,2014,45(2):53-58. 被引量：28
9陈乐,胡国清,杨光永.D*算法在柔性输送系统路径规划中的应用研究[J].科学技术与工程,2014,22(3):200-203. 被引量：6
10陈超,唐坚,靳祖光,杨洋,钱磊.一种基于可视图法导盲机器人路径规划的研究[J].机械科学与技术,2014,33(4):490-495. 被引量：51

共引文献72

1李辉,祁宇明.一种复杂环境下基于深度强化学习的机器人路径规划方法[J].计算机应用研究,2020,37(S01):129-131. 被引量：13
2赵元,张合新.基于目标状态距离简化Q-learning算法的迷宫路径规划[J].火箭军工程大学学报,2019(4):79-84.
3晋帅,李煊鹏,何嘉颖,李纾昶,周敬淞.基于强化学习的两轮模型车控制仿真分析[J].测控技术,2019,38(12):115-121. 被引量：3
4施杨洋,杨家富,布升强,朱林峰.基于RRT改进的智能车辆路径规划算法[J].计算技术与自动化,2019,38(4):81-86. 被引量：19
5李琼琼,施杨洋,布升强,杨家富.基于改进A*算法的无人车路径规划研究[J].林业机械与木工设备,2020,48(6):45-49. 被引量：14
6施杨洋,杨家富,梅淼,朱林峰.基于双向随机树改进的智能车辆路径规划研究[J].计算机工程与科学,2020,42(7):1287-1293. 被引量：6
7孙上杰,姜树海,崔嵩鹤,康玥,陈语唐.基于深度学习的森林消防机器人路径规划[J].森林工程,2020,36(4):51-57. 被引量：27
8封硕,舒红,谢步庆.基于改进深度强化学习的三维环境路径规划[J].计算机应用与软件,2021,38(1):250-255. 被引量：18
9董戈.基于深度学习和图像处理的水果收获机器人抓取系统[J].农机化研究,2021,43(3):260-264. 被引量：16
10王鼎新.基于改进Q-learning算法的AGV路径规划[J].电子设计工程,2021,29(4):7-10. 被引量：14

同被引文献21

1林新英.磁导航AGV结构设计与控制策略[J].吉林化工学院学报,2019,36(7):30-35. 被引量：6
2陈媛媛,陈菁,张守兴.AGV导航技术研究现状的探讨[J].机械管理开发,2020,35(5):249-250. 被引量：7
3李二超,王玉华.改进人工势场法的移动机器人避障轨迹研究[J].计算机工程与应用,2022,58(6):296-304. 被引量：31
4贺雪梅,匡胤,杨志鹏,杨亚乔.基于深度强化学习的AGV智能导航系统设计[J].计算机应用研究,2022,39(5):1501-1504. 被引量：8
5梅建华,杨彦辰,云利军,秦玲.多视角人体红外步态信息采集与处理[J].云南师范大学学报（自然科学版）,2022,42(4):36-40. 被引量：4
6官祥锦,陈娟,张为民.基于改进A^(*)算法的多AGV路径规划研究[J].航空制造技术,2023,66(5):76-85. 被引量：9
7彭道刚,周威仪,葛明,陈晨,潘俊臻.发电厂智能巡检机器人关键技术及应用发展趋势[J].自动化仪表,2023,44(7):1-7. 被引量：8
8李达,尚涛,高雪芹,刘建伟.基于深度强化学习的电力CPS联合防御方案[J].电力信息与通信技术,2023,21(9):23-29. 被引量：3
9陈骏,沈琦琦.自动导引车路径规划算法的研究综述[J].自动化与仪器仪表,2023(9):8-15. 被引量：3
10杨漾,刘博,任昊文,代昊琦,梁子键.基于边缘计算的弹性智能电网信息管理模型[J].云南师范大学学报（自然科学版）,2023,43(5):45-48. 被引量：5

引证文献2

1郭二东,李国华.基于改进遗传算法的AGV路径规划方法研究[J].信息技术与信息化,2024(8):36-39.
2向紫燕.基于改进智能优化算法的自主导航物流小车路径决策方法[J].集成电路与嵌入式系统,2024,24(9):74-80.

1陈威,王艳,纪志成.离散制造系统能耗动态建模与在线预测[J].系统仿真学报,2023,35(4):760-772. 被引量：1
2吴东领,魏群,刘心军.面向煤矿救援机器人路径规划的重回放机制DQN算法[J].煤炭技术,2023,42(5):237-240. 被引量：1
3广东工业大学智能信息处理团队[J].广东工业大学学报,2023,40(4).
4崔冰,张林鍹,欧阳亮,傅永康.面向生产过程调度的数字孪生系统体系架构研究[J].计算机仿真,2023,40(6):9-12.
5孙丹,高东,郑建华,韩鹏.示教知识辅助的无人机强化学习控制算法[J].北京航空航天大学学报,2023,49(6):1424-1433. 被引量：1
6孟红旗,李婷婷,王明仕.环境监测大气颗粒物采集实验教学改革[J].区域治理,2023(18):172-174.
7汪玲.自主游戏对幼儿经验记忆与学习效果影响的实证研究[J].炫动漫,2022(7):181-183.
8彭翔,许华,蒋磊,张悦,饶宁.一种基于深度强化学习的动态自适应干扰功率分配方法[J].电子学报,2023,51(5):1223-1234. 被引量：1
9黄淑萍,葛鈜晔,董建文.坊巷历史街区生理与心理感知效益研究[J].建筑科学,2023,39(6):219-225.

物流技术

2023年第6期

浏览历史

内容加载中请稍等...

离散制造系统环境下基于深度Q学习的AGV路径规划被引量：2

参考文献6

二级参考文献55

共引文献72

同被引文献21

引证文献2

相关作者

相关机构

相关主题

浏览历史

离散制造系统环境下基于深度Q学习的AGV路径规划 被引量：2

参考文献6

二级参考文献55

共引文献72

同被引文献21

引证文献2

相关作者

相关机构

相关主题

浏览历史

离散制造系统环境下基于深度Q学习的AGV路径规划被引量：2