期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于强化学习控制三连杆双足机器人实现节能周期步态
1
作者
潘泽邦
殷珊
+1 位作者
文桂林
谭朝
《Acta Mechanica Sinica》
SCIE
EI
CAS
CSCD
2023年第2期205-227,共23页
由于双足机器人有着强非线性和非光滑性的响应特性,为双足机器人设计高性能的步态控制器依旧是一个开放的研究领域.为了克服这些挑战,本文首先提出了一个包含躯干,并考虑碰撞与摩擦的三连杆双足机器人模型.随后,采用双延迟深度确定性策...
由于双足机器人有着强非线性和非光滑性的响应特性,为双足机器人设计高性能的步态控制器依旧是一个开放的研究领域.为了克服这些挑战,本文首先提出了一个包含躯干,并考虑碰撞与摩擦的三连杆双足机器人模型.随后,采用双延迟深度确定性策略梯度算法为该机器人设计了强化学习控制器.为了同时在下坡和上坡中实现节能周期步态,本文基于庞家莱截面法和幂函数构建了能为控制器提供学习指引的奖励函数.因此,所提出的控制器能够在不依赖于预先设计的参考轨迹或嵌入的不稳定周期步态的情况下,学会自适应输出精确的余弦力矩来实现控制目标.通过和神经网络比例微分控制器的对比研究表明,在不同的斜坡上,所提出的强化学习控制器均能实现精确、高效的周期步态,并具有较强的适应性和鲁棒性.
展开更多
关键词
Three-link
biped
robot
Deep
Reinforcement
learning
Periodic
gaits
Energy
optimization
原文传递
题名
基于强化学习控制三连杆双足机器人实现节能周期步态
1
作者
潘泽邦
殷珊
文桂林
谭朝
机构
State Key Laboratory of Advanced Design and Manufacture for Vehicle Body Hunan University
School of Mechanical Engineering
出处
《Acta Mechanica Sinica》
SCIE
EI
CAS
CSCD
2023年第2期205-227,共23页
基金
supported by the National Natural Science Foundation of China (Grant Nos.11832009 and 12102132)
China Postdoctoral Science Foundation (Grant No.2020M682545)
Science and Technology Innovation Program of Hunan Province (Grant No.2020RC2027).
文摘
由于双足机器人有着强非线性和非光滑性的响应特性,为双足机器人设计高性能的步态控制器依旧是一个开放的研究领域.为了克服这些挑战,本文首先提出了一个包含躯干,并考虑碰撞与摩擦的三连杆双足机器人模型.随后,采用双延迟深度确定性策略梯度算法为该机器人设计了强化学习控制器.为了同时在下坡和上坡中实现节能周期步态,本文基于庞家莱截面法和幂函数构建了能为控制器提供学习指引的奖励函数.因此,所提出的控制器能够在不依赖于预先设计的参考轨迹或嵌入的不稳定周期步态的情况下,学会自适应输出精确的余弦力矩来实现控制目标.通过和神经网络比例微分控制器的对比研究表明,在不同的斜坡上,所提出的强化学习控制器均能实现精确、高效的周期步态,并具有较强的适应性和鲁棒性.
关键词
Three-link
biped
robot
Deep
Reinforcement
learning
Periodic
gaits
Energy
optimization
分类号
TP242 [自动化与计算机技术—检测技术与自动化装置]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于强化学习控制三连杆双足机器人实现节能周期步态
潘泽邦
殷珊
文桂林
谭朝
《Acta Mechanica Sinica》
SCIE
EI
CAS
CSCD
2023
0
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部