-
题名基于PPO算法的机器人轴孔装配控制与仿真
- 1
-
-
作者
申玉鑫
刘晓明
肖逸
余德平
-
机构
四川大学机械工程学院
-
出处
《机械》
2023年第12期74-80,共7页
-
文摘
针对在管道运输和航空航天领域常见的大口径轴孔装配任务,设计一种基于PPO算法的装配控制方法。首先,建立强化学习算法与装配环境交互训练框架,设计两个网络用于拟合装配策略和评估值函数;其次,设计机器人输出的动作空间与装配环境输出的状态空间,保证学习过程中的有效探索;然后,设计非线性奖励函数以确保训练过程的快速收敛;最后,搭建基于MuJoCo物理引擎的机器人大口径轴孔装配仿真平台,并在仿真平台上对设计算法进行训练和实验。结果表明:基于PPO算法的训练框架能保证训练过程的快速收敛,改进后的优势函数估计方法提升了训练过程的稳定性,训练模型不仅能保证轴插入孔和法兰面贴合,还能保证装配过程的安全性。
-
关键词
装配
PPO算法
Mu
joco仿真
-
Keywords
assembly
PPO algorithm
Mujoco simulation
-
分类号
TP249
[自动化与计算机技术—检测技术与自动化装置]
-