期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于Safe-PPO算法的安全优先路径规划方法
1
作者
别桐
朱晓庆
+3 位作者
付煜
李晓理
阮晓钢
王全民
《北京航空航天大学学报》
EI
CAS
CSCD
北大核心
2023年第8期2108-2118,共11页
现有的路径规划算法对路径规划过程中的路径安全性问题考虑较少,并且传统的近端策略优化(PPO)算法存在一定的方差适应性问题。为解决这些问题,提出一种融合进化策略思想和安全奖励函数的安全近端策略优化(Safe-PPO)算法,所提算法以安全...
现有的路径规划算法对路径规划过程中的路径安全性问题考虑较少,并且传统的近端策略优化(PPO)算法存在一定的方差适应性问题。为解决这些问题,提出一种融合进化策略思想和安全奖励函数的安全近端策略优化(Safe-PPO)算法,所提算法以安全优先进行路径规划。采用协方差自适应调整的进化策略(CMA-ES)的思想对PPO算法进行改进,并引入危险系数与动作因子来评估路径的安全性。使用二维栅格地图进行仿真实验,采用传统的PPO算法和Safe-PPO算法进行对比;采用六足机器人在搭建的场景中进行实物实验。仿真实验结果表明:所提算法在安全优先导向的路径规划方面具有合理性与可行性:在训练时Safe-PPO算法相比传统的PPO算法收敛速度提升了18%,获得的奖励提升了5.3%;在测试时采用融合危险系数与动作因子的方案能使机器人学会选择更加安全的道路而非直观上最快速的道路。实物实验结果表明:机器人可以在现实环境中选择更加安全的路径到达目标点。
展开更多
关键词
机器人导航
路径规划
深度强化学习
近端策略优化
安全路径选择
下载PDF
职称材料
融合点线特征的视觉惯性SLAM算法
被引量:
6
2
作者
付煜
郑爽
+2 位作者
别桐
朱晓庆
王全民
《计算机应用研究》
CSCD
北大核心
2022年第2期349-355,共7页
为使移动机器人在昏暗场景中获得更高的定位精度以实现更好的建图效果,针对特征点稀疏、相机移动过快所导致的SLAM算法初始化困难、定位精度较低等问题,提出了一种融合点线特征的视觉惯性SLAM算法。通过EDLines线特征提取匹配算法来引...
为使移动机器人在昏暗场景中获得更高的定位精度以实现更好的建图效果,针对特征点稀疏、相机移动过快所导致的SLAM算法初始化困难、定位精度较低等问题,提出了一种融合点线特征的视觉惯性SLAM算法。通过EDLines线特征提取匹配算法来引入丰富的线特征,进而提升特征跟踪的鲁棒性;利用惯性传感器和视觉传感器的互补优势,通过视觉惯性分步联合初始化方法在初始化阶段分三步进行优化,进而提升初始化的精度和速度。实验表明,该算法所使用的线特征提取匹配算法相比传统的LSD算法具有了更快的匹配速度和更低的误匹配率,并且该算法在视觉惯性数据集中相机位姿的估计精度更高、鲁棒性更强。
展开更多
关键词
视觉同时定位与地图构建
视觉惯性融合
稀疏建图
点线特征提取
下载PDF
职称材料
基于奖励引导的六足机器人自主步态学习
被引量:
1
3
作者
朱晓庆
陈璐
+3 位作者
冉登宇
钱义肇
王明超
别桐
《北京工业大学学报》
EI
CAS
CSCD
北大核心
2021年第2期120-126,共7页
为提高机器人自主学习能力,提出一种基于奖励引导的机器人自主步态学习算法.首先给出自主设计的机械式步态同步六足机器人的机械结构,其独特的多层钢堆叠腿部设计方案和特有的机械同步传动方案为机器人后续步态学习研究奠定良好基础;接...
为提高机器人自主学习能力,提出一种基于奖励引导的机器人自主步态学习算法.首先给出自主设计的机械式步态同步六足机器人的机械结构,其独特的多层钢堆叠腿部设计方案和特有的机械同步传动方案为机器人后续步态学习研究奠定良好基础;接下来提出一种基于奖励引导的机器人步态学习算法,该算法可以让机器人在未知环境中进行技能学习;最后,在MATLAB和ADAMS联合仿真平台上进行算法验证实验,实验结果显示以速度和高度分别为主评价指标会呈现出2种合理的收敛结果,且在该算法下六足机器人可以自主学习到翻越木块的高难度技能.
展开更多
关键词
强化学习
六足机器人
自主学习
奖励引导
神经网络
步态学习
下载PDF
职称材料
题名
基于Safe-PPO算法的安全优先路径规划方法
1
作者
别桐
朱晓庆
付煜
李晓理
阮晓钢
王全民
机构
北京工业大学信息学部人工智能与自动化学院
北京工业大学计算智能与智能系统北京市重点实验室
北京工业大学信息学部计算机学院
出处
《北京航空航天大学学报》
EI
CAS
CSCD
北大核心
2023年第8期2108-2118,共11页
基金
国家自然科学基金(61773027,62103009)
北京市自然科学基金(4202005)。
文摘
现有的路径规划算法对路径规划过程中的路径安全性问题考虑较少,并且传统的近端策略优化(PPO)算法存在一定的方差适应性问题。为解决这些问题,提出一种融合进化策略思想和安全奖励函数的安全近端策略优化(Safe-PPO)算法,所提算法以安全优先进行路径规划。采用协方差自适应调整的进化策略(CMA-ES)的思想对PPO算法进行改进,并引入危险系数与动作因子来评估路径的安全性。使用二维栅格地图进行仿真实验,采用传统的PPO算法和Safe-PPO算法进行对比;采用六足机器人在搭建的场景中进行实物实验。仿真实验结果表明:所提算法在安全优先导向的路径规划方面具有合理性与可行性:在训练时Safe-PPO算法相比传统的PPO算法收敛速度提升了18%,获得的奖励提升了5.3%;在测试时采用融合危险系数与动作因子的方案能使机器人学会选择更加安全的道路而非直观上最快速的道路。实物实验结果表明:机器人可以在现实环境中选择更加安全的路径到达目标点。
关键词
机器人导航
路径规划
深度强化学习
近端策略优化
安全路径选择
Keywords
robot navigation
path planning
deep reinforcement learning
proximal policy optimization
safe path selection
分类号
TP242.6 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
融合点线特征的视觉惯性SLAM算法
被引量:
6
2
作者
付煜
郑爽
别桐
朱晓庆
王全民
机构
北京工业大学信息学部
北京工业大学
出处
《计算机应用研究》
CSCD
北大核心
2022年第2期349-355,共7页
基金
国家自然科学基金资助项目(61773027)
北京市自然科学基金资助项目(4202005,4202004)
北京市教育委员会科技计划一般项目(KM201810005028)。
文摘
为使移动机器人在昏暗场景中获得更高的定位精度以实现更好的建图效果,针对特征点稀疏、相机移动过快所导致的SLAM算法初始化困难、定位精度较低等问题,提出了一种融合点线特征的视觉惯性SLAM算法。通过EDLines线特征提取匹配算法来引入丰富的线特征,进而提升特征跟踪的鲁棒性;利用惯性传感器和视觉传感器的互补优势,通过视觉惯性分步联合初始化方法在初始化阶段分三步进行优化,进而提升初始化的精度和速度。实验表明,该算法所使用的线特征提取匹配算法相比传统的LSD算法具有了更快的匹配速度和更低的误匹配率,并且该算法在视觉惯性数据集中相机位姿的估计精度更高、鲁棒性更强。
关键词
视觉同时定位与地图构建
视觉惯性融合
稀疏建图
点线特征提取
Keywords
visual SLAM
visual-inertial
sparse mapping
point and line feature extraction
分类号
TP242 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
基于奖励引导的六足机器人自主步态学习
被引量:
1
3
作者
朱晓庆
陈璐
冉登宇
钱义肇
王明超
别桐
机构
北京工业大学信息学部
北京工业大学樊恭烋荣誉学院
出处
《北京工业大学学报》
EI
CAS
CSCD
北大核心
2021年第2期120-126,共7页
基金
国家自然科学基金资助项目(61773027)
北京市教育委员会科技计划重点资助项目(KZ201610005010)
北京市自然科学基金资助项目(4202005).
文摘
为提高机器人自主学习能力,提出一种基于奖励引导的机器人自主步态学习算法.首先给出自主设计的机械式步态同步六足机器人的机械结构,其独特的多层钢堆叠腿部设计方案和特有的机械同步传动方案为机器人后续步态学习研究奠定良好基础;接下来提出一种基于奖励引导的机器人步态学习算法,该算法可以让机器人在未知环境中进行技能学习;最后,在MATLAB和ADAMS联合仿真平台上进行算法验证实验,实验结果显示以速度和高度分别为主评价指标会呈现出2种合理的收敛结果,且在该算法下六足机器人可以自主学习到翻越木块的高难度技能.
关键词
强化学习
六足机器人
自主学习
奖励引导
神经网络
步态学习
Keywords
reinforcement learning
hexapod robot
autonomous Learning
reward shaping
neural network
gait learning
分类号
TP13 [自动化与计算机技术—控制理论与控制工程]
TP242.6 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于Safe-PPO算法的安全优先路径规划方法
别桐
朱晓庆
付煜
李晓理
阮晓钢
王全民
《北京航空航天大学学报》
EI
CAS
CSCD
北大核心
2023
0
下载PDF
职称材料
2
融合点线特征的视觉惯性SLAM算法
付煜
郑爽
别桐
朱晓庆
王全民
《计算机应用研究》
CSCD
北大核心
2022
6
下载PDF
职称材料
3
基于奖励引导的六足机器人自主步态学习
朱晓庆
陈璐
冉登宇
钱义肇
王明超
别桐
《北京工业大学学报》
EI
CAS
CSCD
北大核心
2021
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部