-
题名基于梯度奖励的深度强化学习移动机器人路径规划
- 1
-
-
作者
喻凯旋
林富生
宋志峰
余联庆
-
机构
武汉纺织大学机械工程与自动化学院
三维纺织湖北省工程研究中心
湖北省数字化纺织装备重点实验室
-
出处
《机床与液压》
北大核心
2023年第17期32-38,共7页
-
文摘
针对目前深度强化学习移动机器人路径规划中稀疏奖励导致的效率低、收敛慢等问题,提出一种梯度奖励政策。使用区域分割将环境分割为缓冲区、探索区、临近区以及目标区,奖励的动态变化可以逐步缩小机器人的探索范围,同时在安全区域内也能获得正向奖励。首先输入机器人当前的位置坐标,经过神经网络后估计4个动作的Q值,随后通过去首动态贪婪策略达到最大化探索,最后采用基于均方误差的优先经验回放抽取样本进行梯度下降更新网络。实验结果表明:在小范围环境内探索效率可提升近40%,在大范围环境下成功率高于80%,而且在提高探索效率的同时增强了鲁棒性。
-
关键词
深度强化学习
路径规划
梯度奖励
区域分割
去首动态贪婪策略
-
Keywords
Deep reinforcement learning
Path planning
Gradient reward
Region segmentation
Decapitation dynamic greedy strategy
-
分类号
TP242
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名穿经机自动穿综系统设计
被引量:1
- 2
-
-
作者
曹国政
林富生
喻凯旋
石全
宋志峰
刘泠杉
-
机构
武汉纺织大学机械工程与自动化学院
三维纺织湖北省工程研究中心
湖北省数字化纺织装备重点实验室
-
出处
《毛纺科技》
CAS
北大核心
2022年第8期63-69,共7页
-
文摘
为了解决穿经机中穿综系统的结构复杂、运行稳定性差、效率低等问题,设计了一种结构简单的自动穿综系统。穿综系统包括上综、穿线和排综3个部分,首先对自动穿综系统的基本结构进行介绍和对穿综工艺流程进行规划,然后对电磁铁和调整挂针进行力学分析和优化设计。实验结果表明:穿综系统运动误差减小,稳定性得到提高,运行速度快、效率高,综丝穿线的速度平均可达160根/min,与人工穿综相比,速度提高近9倍,符合穿经机对自动穿综的要求,极大地提高了企业的生产效率。
-
关键词
穿综机构
穿经机
穿线
排综
-
Keywords
heddle-in mechanism
drawing-in machine
threading
discharging heddle
-
分类号
TS103.324.2
[轻工技术与工程—纺织工程]
-