-
题名基于深度强化学习的机械臂容错控制方法
被引量:9
- 1
-
-
作者
李铭浩
张华
刘满禄
李新茂
周祺杰
-
机构
西南科技大学信息工程学院
中国科学技术大学信息科学技术学院
-
出处
《传感器与微系统》
CSCD
2020年第1期53-55,59,共4页
-
基金
西南科技大学研究生创新基金资助项目(18YCX122)
西南科技大学研究生创新基金资助项目(17YCX122)
国家“十三五”核能开发项目(20161295)
-
文摘
针对机械臂突发单关节故障的情况,提出一种基于深度强化学习的机械臂容错控制方法。在建立环境模型和奖罚机制的基础上,针对机械臂正常运行和故障运行的情况,使用无模型的强化学习算法进行离线训练。在Rviz中建立机械臂模型并使用上述网络进行在线控制。实验证明:该算法可以有效完成机械臂的正常控制和容错控制。
-
关键词
机械臂关节故障
容错控制
深度神经网络
强化学习
-
Keywords
manipulator joint fault
fault tolerant control
deep neural network
reinforcement learning
-
分类号
TP242.2
[自动化与计算机技术—检测技术与自动化装置]
TP212
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名基于深度强化学习的固体放射性废物抓取方法研究
被引量:3
- 2
-
-
作者
周祺杰
刘满禄
李新茂
张华
-
机构
西南科技大学信息工程学院
中国科学技术大学信息科学技术学院
-
出处
《计算机应用研究》
CSCD
北大核心
2020年第11期3363-3367,共5页
-
基金
国家“十三五”核能开发项目(20161295)
西南科技大学研究生创新基金资助项目(19ycx0103)。
-
文摘
针对固体放射性废物分拣作业中,放射性废物杂乱无序、远程遥操作抓取效率低、人工分拣危险性大等典型问题,提出一种基于深度强化学习的放射性固体废物抓取方法。该方法使用改进深度Q网络算法,通过获取的图像信息,使机器人与环境不断进行交互并获得回报奖励,回报奖励由机械臂动作执行结果和放射性区域内放射性活度的高低构成,根据Q值的大小得到机械臂的最佳抓取位置。用V-REP软件对UR5机械臂建立仿真模型,在仿真环境中完成不同类型固体放射性废物抓取的训练与测试。仿真结果表明,固体废物在松散放置时该方法可使机械臂抓取成功率大于90%,在紧密放置时抓取成功率大于65%,机械臂不会受到废物堆叠的影响,并且会优先抓取放射性区域内具有高放射性活度的物体。
-
关键词
固体放射性废物
深度强化学习
机械臂抓取
回报奖励
-
Keywords
solid radioactive waste
deep reinforcement learning
robotic grasping
reward
-
分类号
TP393.04
[自动化与计算机技术—计算机应用技术]
-
-
题名基于深度强化学习的机械臂自适应阀门旋拧方法研究
被引量:1
- 3
-
-
作者
李新茂
刘满禄
王基生
周祺杰
-
机构
西南科技大学制造科学与工程学院
西南科技大学信息工程学院
中国科学技术大学信息科学技术学院
-
出处
《制造业自动化》
CSCD
北大核心
2021年第7期39-43,共5页
-
基金
国家“十三五”核能开发项目(20161295)
国家科技重大专项课题:CAP1400核电厂智能运维关键技术研究(2019ZX06002022)。
-
文摘
针对典型未知环境作业,提出一种基于深度强化学习的机械臂旋拧阀门自适应操控方法,使得机械臂能够在阀门手轮尺寸未知的情况下实现阀门旋拧任务。该方法基于马尔科夫决策过程框架设计阀门旋拧模型,并根据夹持器与阀门轮缘上标签之间的相对位置与姿态,建立模型的状态空间和奖励系统。由仿真与实验表明,该方法能够实现未知尺寸的阀门手轮的旋拧作业,轨迹误差小,具有良好的运动性能以及适应性。
-
关键词
深度强化学习
机械臂自适应控制
阀门操控
-
分类号
TP242.6
[自动化与计算机技术—检测技术与自动化装置]
-