期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于深度强化学习的机械臂容错控制方法 被引量:9
1
作者 李铭浩 张华 +2 位作者 刘满禄 李新茂 周祺杰 《传感器与微系统》 CSCD 2020年第1期53-55,59,共4页
针对机械臂突发单关节故障的情况,提出一种基于深度强化学习的机械臂容错控制方法。在建立环境模型和奖罚机制的基础上,针对机械臂正常运行和故障运行的情况,使用无模型的强化学习算法进行离线训练。在Rviz中建立机械臂模型并使用上述... 针对机械臂突发单关节故障的情况,提出一种基于深度强化学习的机械臂容错控制方法。在建立环境模型和奖罚机制的基础上,针对机械臂正常运行和故障运行的情况,使用无模型的强化学习算法进行离线训练。在Rviz中建立机械臂模型并使用上述网络进行在线控制。实验证明:该算法可以有效完成机械臂的正常控制和容错控制。 展开更多
关键词 机械臂关节故障 容错控制 深度神经网络 强化学习
下载PDF
基于深度强化学习的固体放射性废物抓取方法研究 被引量:3
2
作者 周祺杰 刘满禄 +1 位作者 李新茂 张华 《计算机应用研究》 CSCD 北大核心 2020年第11期3363-3367,共5页
针对固体放射性废物分拣作业中,放射性废物杂乱无序、远程遥操作抓取效率低、人工分拣危险性大等典型问题,提出一种基于深度强化学习的放射性固体废物抓取方法。该方法使用改进深度Q网络算法,通过获取的图像信息,使机器人与环境不断进... 针对固体放射性废物分拣作业中,放射性废物杂乱无序、远程遥操作抓取效率低、人工分拣危险性大等典型问题,提出一种基于深度强化学习的放射性固体废物抓取方法。该方法使用改进深度Q网络算法,通过获取的图像信息,使机器人与环境不断进行交互并获得回报奖励,回报奖励由机械臂动作执行结果和放射性区域内放射性活度的高低构成,根据Q值的大小得到机械臂的最佳抓取位置。用V-REP软件对UR5机械臂建立仿真模型,在仿真环境中完成不同类型固体放射性废物抓取的训练与测试。仿真结果表明,固体废物在松散放置时该方法可使机械臂抓取成功率大于90%,在紧密放置时抓取成功率大于65%,机械臂不会受到废物堆叠的影响,并且会优先抓取放射性区域内具有高放射性活度的物体。 展开更多
关键词 固体放射性废物 深度强化学习 机械臂抓取 回报奖励
下载PDF
基于深度强化学习的机械臂自适应阀门旋拧方法研究 被引量:1
3
作者 李新茂 刘满禄 +1 位作者 王基生 周祺杰 《制造业自动化》 CSCD 北大核心 2021年第7期39-43,共5页
针对典型未知环境作业,提出一种基于深度强化学习的机械臂旋拧阀门自适应操控方法,使得机械臂能够在阀门手轮尺寸未知的情况下实现阀门旋拧任务。该方法基于马尔科夫决策过程框架设计阀门旋拧模型,并根据夹持器与阀门轮缘上标签之间的... 针对典型未知环境作业,提出一种基于深度强化学习的机械臂旋拧阀门自适应操控方法,使得机械臂能够在阀门手轮尺寸未知的情况下实现阀门旋拧任务。该方法基于马尔科夫决策过程框架设计阀门旋拧模型,并根据夹持器与阀门轮缘上标签之间的相对位置与姿态,建立模型的状态空间和奖励系统。由仿真与实验表明,该方法能够实现未知尺寸的阀门手轮的旋拧作业,轨迹误差小,具有良好的运动性能以及适应性。 展开更多
关键词 深度强化学习 机械臂自适应控制 阀门操控
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部