基于深度强化学习的柑橘采摘机械臂路径规划方法被引量：5

Path planning method for citrus picking manipulator based on deep reinforcement learning

下载PDF

导出

摘要 [目的]为解决非结构化环境下采用深度强化学习进行采摘机械臂路径规划时存在的效率低、采摘路径规划成功率不佳的问题,提出了一种非结构化环境下基于深度强化学习(Deep reinforcement learning, DRL)和人工势场的柑橘采摘机械臂的路径规划方法。[方法]首先,通过强化学习方法进行采摘路径规划问题求解,设计了结合人工势场的强化学习方法;其次,引入长短期记忆(Longshort term memory,LSTM)结构对2种DRL算法的Actor网络和Critic网络进行改进;最后,在3种不同的非结构化柑橘果树环境训练DRL算法对采摘机械臂进行路径规划。[结果]仿真对比试验表明:结合人工势场的强化学习方法有效提高了采摘机械臂路径规划的成功率;引入LSTM结构的方法可使深度确定性策略梯度(Deep deterministic policy gradient,DDPG)算法的收敛速度提升57.25%,路径规划成功率提升23.00%;使软行为评判(Soft actor critic,SAC)算法的收敛速度提升53.73%,路径规划成功率提升9.00%;与传统算法RRT-connect(Rapidly exploring random trees connect)对比,引入LSTM结构的SAC算法使规划路径长度缩短了16.20%,路径规划成功率提升了9.67%。[结论]所提出的路径规划方法在路径规划长度、路径规划成功率方面存在一定优势,可为解决采摘机器人在非结构化环境下的路径规划问题提供参考。【Objective】In order to solve the problems of poor training efficiency and low success rate of picking path planning of manipulator using deep reinforcement learning(DRL),this study proposed a path planning method combined with DRL and artificial potential field for citrus picking manipulator in unstructured environments.【Method】Firstly,the picking path planning problem was solved by the DRL with artificial potential field method.Secondly,the longshort term memory(LSTM)structure was introduced to improve the Actor network and Critic network of two DRL algorithms.Finally,the DRL algorithms were trained in three different unstructured citrus growing environments to perform path planning for picking manipulator.【Result】The comparison of simulation experiments showed that the success rate of path planning was effectively improved by combining DRL with the artificial potential field method,the method with LSTM structure improved the convergence speed of the deep deterministic policy gradient(DDPG)algorithm by 57.25%and the success rate of path planning by 23.00%.Meanwhile,the method improved the convergence speed of the soft actor critic(SAC)algorithm by 53.73%and the path planning success rate by 9.00%.Compared with the traditional algorithm RRT-connect(Rapidly exploring random trees connect),the SAC algorithm with LSTM structure shortened the planned path length by 16.20%and improved the path planning success rate by 9.67%.【Conclusion】The proposed path planning method has certain advantages for path planning length and path planning success rate,which can provide references for solving path planning problems of picking robots in unstructured environments.

作者熊春源熊俊涛杨振刚胡文馨 XIONG Chunyuan;XIONG Juntao;YANG Zhengang;HU Wenxin(College of Mathematics and Informatics,South China Agricultural University,Guangzhou 510642,China)

机构地区华南农业大学数学与信息学院

出处《华南农业大学学报》 CAS CSCD 北大核心 2023年第3期473-483,共11页 Journal of South China Agricultural University

基金国家自然科学基金(32071912) 广州市基础研究计划(202102080337)。

关键词采摘机械臂柑橘路径规划深度强化学习非结构化环境 LSTM Picking manipulator Citrus Path planning Deep reinforcement learning Unstructured environment LSTM

分类号 S666 [农业科学—果树学] S233.4 [农业科学—农业机械化工程]

引文网络
相关文献

参考文献16

1熊俊涛,李中行,陈淑绵,郑镇辉.基于深度强化学习的虚拟机器人采摘路径避障规划[J].农业机械学报,2020,51(S02):1-10. 被引量：25
2郑嫦娥,高坡,GAN Hao,田野,赵燕东.基于分步迁移策略的苹果采摘机械臂轨迹规划方法[J].农业机械学报,2020,51(12):15-23. 被引量：13
3尹建军,武传宇,Yang Simon X,Gauri S Mittal,毛罕平.番茄采摘机器人机械臂避障路径规划[J].农业机械学报,2012,43(12):171-175. 被引量：34
4杨长辉,刘艳平,王毅,熊龙烨,许洪斌,赵万华.自然环境下柑橘采摘机器人识别定位系统研究[J].农业机械学报,2019,50(12):14-22. 被引量：51
5毕松,张潞.自然环境下的柑橘采摘点识别方法研究[J].计算机仿真,2021,38(12):227-231. 被引量：3
6谢龙,刘山.基于改进势场法的机械臂动态避障规划[J].控制理论与应用,2018,35(9):1239-1249. 被引量：27
7史亚飞,张力,刘子煊,吕一平.基于速度场的人工势场法机械臂动态避障研究[J].机械传动,2020,44(4):38-44. 被引量：12
8刘可,李可,宿磊,王琨,张秋菊.基于蚁群算法与参数迁移的机器人三维路径规划方法[J].农业机械学报,2020,51(1):29-36. 被引量：26
9张强,陈兵奎,刘小雍,刘晓宇,杨航.基于改进势场蚁群算法的移动机器人最优路径规划[J].农业机械学报,2019,50(5):23-32. 被引量：52
10张敦凤,赵皓,徐亮,刘满禄,张静.基于栅格法的机械臂工作空间解析方法研究[J].制造业自动化,2019,41(4):69-70. 被引量：3

二级参考文献124

1林依凡,陈彦杰,何炳蔚,黄益斌,王耀南.无碰撞检测RRT^*的移动机器人运动规划方法[J].仪器仪表学报,2020(10):257-267. 被引量：41
2谌海云,陈华胄,刘强.基于改进人工势场法的多无人机三维编队路径规划[J].系统仿真学报,2020,32(3):414-420. 被引量：38
3曹如月,张振乾,李世超,张漫,李寒,李民赞.基于改进A^(*)算法和Bezier曲线的多机协同全局路径规划[J].农业机械学报,2021,52(S01):548-554. 被引量：29
4赵真明,孟正大.基于加权A~*算法的服务型机器人路径规划[J].华中科技大学学报（自然科学版）,2008,36(S1):196-198. 被引量：32
5樊征,曹其新,杨扬,李长勇.面向移动机器人的拓扑地图自动生成[J].华中科技大学学报（自然科学版）,2008,36(S1):163-166. 被引量：5
6朱庆保,张玉兰.基于栅格法的机器人路径规划蚁群算法[J].机器人,2005,27(2):132-136. 被引量：123
7蔡健荣,赵杰文,Thomas Rath,Macco Kawollek.水果收获机器人避障路径规划[J].农业机械学报,2007,38(3):102-105. 被引量：43
8陈靖波,赵猛,张珩.空间机械臂在线实时避障路径规划研究[J].控制工程,2007,14(4):445-447. 被引量：24
9LOZANO-PEREZ T.Automatic planning of manipulator transfer movement[J].IEEE Transaction on Systems Man.and Cybernetics,1981,SMC-ll(lO):681-698.
10LOZANO-PEREZ T.Spatial planning:A configuration space approach[J].IEEE Transaction on Computers,1983,C-32(2):108-120.

共引文献515

1白帅帅.弥雾植保机具的正确使用[J].青海农技推广,2020(2):83-83.
2张益辉,王长宁,孙玲.基于A^*算法的机器人路径规划与避障研究[J].微型电脑应用,2020,0(2):120-123. 被引量：14
3刘慧,张世义,段云鹏,贾卫东,沈跃.基于改进双向RRT^(*)的果园机器人运动规划算法[J].农业机械学报,2022,53(11):31-39. 被引量：9
4文朝武,龙洁花,张宇,郭文忠,林森,梁晓婷.基于3D视觉的番茄授粉花朵定位方法[J].农业机械学报,2022,53(8):320-328. 被引量：4
5郝琨,张慧杰,李志圣,刘永磊.基于改进避障策略和双优化蚁群算法的机器人路径规划[J].农业机械学报,2022,53(8):303-312. 被引量：24
6刘琪,兰玉彬,单常峰,毛越东.航空植保喷施参数对苹果树雾滴沉积特性影响[J].农机化研究,2020,42(9):173-180. 被引量：15
7贾庆轩,袁博楠,陈钢,符颖卓.关节锁定空间机械臂负载操作能力评估与轨迹规划[J].控制与决策,2020,35(1):243-249. 被引量：9
8高其远,陈丽.基于自运动的冗余机械臂实时避障轨迹规划[J].智能计算机与应用,2022,12(6):116-120. 被引量：2
9韩强,何利力.智能仓储车间中多AGV路径优化算法研究[J].智能计算机与应用,2022,12(5):43-49. 被引量：2
10孟祥永,游彩霞,严运兵.基于节点过滤及运动学约束改进的RRT算法[J].智能计算机与应用,2022,12(1):16-20.

同被引文献60

1陈善峰,尹建军,王玉飞,杨自栋.果实采摘机械手多关节求解方法与避障规划[J].农机化研究,2012,34(7):24-28. 被引量：3
2熊俊涛,叶敏,邹湘军,彭红星,林桂潮,朱梦思.多类型水果采摘机器人系统设计与性能分析[J].农业机械学报,2013,44(S1):230-235. 被引量：40
3蔡健荣,赵杰文,Thomas Rath,Macco Kawollek.水果收获机器人避障路径规划[J].农业机械学报,2007,38(3):102-105. 被引量：43
4苑严伟,张小超,胡小安.苹果采摘路径规划最优化算法与仿真实现[J].农业工程学报,2009,25(4):141-144. 被引量：20
5尹建军,武传宇,Yang Simon X,Gauri S Mittal,毛罕平.番茄采摘机器人机械臂避障路径规划[J].农业机械学报,2012,43(12):171-175. 被引量：34
6卢军,王贤锋,后德家.水果采摘机器人视觉系统研究进展[J].湖北农业科学,2012,51(21):4705-4708. 被引量：23
7姬伟,程风仪,赵德安,陶云,丁世宏,吕继东.基于改进人工势场的苹果采摘机器人机械手避障方法[J].农业机械学报,2013,44(11):253-259. 被引量：76
8祁若龙,周维佳,王铁军.一种基于遗传算法的空间机械臂避障轨迹规划方法[J].机器人,2014,36(3):263-270. 被引量：66
9邹宇星,李立君,高自成.基于改进PRM的采摘机器人机械臂避障路径规划[J].传感器与微系统,2019,38(1):52-56. 被引量：26
10于宏涛,高立群,韩希昌.求解旅行商问题的离散人工萤火虫算法[J].华南理工大学学报（自然科学版）,2015,43(1):126-131. 被引量：24

引证文献5

1马萧杰,施新宇,肖文星,任梦涛,鲍秀兰.基于TSP_RRT算法的柑橘多目标连续采摘路径规划[J].江西农业大学学报,2024,46(2):490-501. 被引量：1
2解晓乐.基于深度强化学习的智慧物流园区长途配送路径规划方法[J].广州航海学院学报,2024,32(1):30-34.
3杨淑华,谢晓波,邴振凯,郝建军,张秀花,袁大超.基于HER-TD3算法的青皮核桃采摘机械臂路径规划[J].农业机械学报,2024,55(4):113-123.
4郭自良,殷程凯,吴玄博,陈青,王金鹏,周宏平.水果采摘机械手关键技术研究现状与展望[J].江苏农业学报,2024,40(6):1142-1152. 被引量：1
5荣蓉.基于人工智能算法的机械臂避障路径选择研究[J].九江学院学报（自然科学版）,2024,39(3):94-98.

二级引证文献2

1郝洁.专利视角下的采摘机器人技术创新与发展研究[J].机器人产业,2024(5):6-13.
2滕超凡,王路平.基于改进A^(*)算法的机器人路径规划[J].自动化应用,2024,65(18):183-187.

1张之红.基于非线性方程组有限元的采摘机械臂摇杆模拟研究[J].农机化研究,2023,45(9):36-39.
2张志威,贾云伟,王永霞,付邦鹏.基于改进的快速扩展随机树的快速路径规划算法[J].天津理工大学学报,2022,38(3):14-19. 被引量：4
3荀一,李道政,王勇,黄旭婷,王志恒,杨庆华.基于VS-IRRT算法的采摘机械臂路径规划[J].农业机械学报,2023,54(2):129-138. 被引量：4
4陈贤凤.苍溪县:电商人才进村山货俏卖出山[J].四川党的建设,2023(3):30-31.
5杨立爽,吴波,潘相龙,史博文,岳俊伟,何琪,张嵩.全地形智能农业采摘机器人的设计[J].南方农机,2023,54(9):4-6. 被引量：2
6刘贾贾,刘志辉,李凤.基于遥感影像的城镇建筑物群分类[J].自然灾害学报,2021,30(6):61-66. 被引量：4
7王敏竹,罗永华,宁芊.基于预训练深度强化学习的星地网络SDN部署策略[J].现代计算机,2023,29(5):45-50.
8吴绍锋,武时会.基于柑橘机器采摘的最优化技术研究[J].中文科技期刊数据库（文摘版）工程技术,2021(1):438-438.
9李成健,卫勇,乔佳,任子昂,李名博.草莓采摘机器人控制系统设计与实现[J].变频器世界,2023,26(3):97-103.
10于永顺,杨云福,杨永发,李锐风.食用玫瑰花采摘机械手的设计与分析[J].林业机械与木工设备,2023,51(2):66-72.

华南农业大学学报

2023年第3期

浏览历史

内容加载中请稍等...

基于深度强化学习的柑橘采摘机械臂路径规划方法被引量：5

参考文献16

二级参考文献124

共引文献515

同被引文献60

引证文献5

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的柑橘采摘机械臂路径规划方法 被引量：5

参考文献16

二级参考文献124

共引文献515

同被引文献60

引证文献5

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的柑橘采摘机械臂路径规划方法被引量：5