检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到4篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于改进柔性演员评论家算法的研究被引量：2: 1; 作者胡仕柯赵海军《太原师范学院学报（自然科学版）》 2021年第3期48-52,共5页; 针对柔性演员评论家算法训练速度慢且训练过程不稳定的问题,提出了一种改进柔性演员评论家算法.通过在原有算法中引入内在好奇心机制,提高智能体探索能力与样本利用效率,并在仿真环境中用于求解倒立摆问题,实验结果表明文章算法具有更... 展开更多; 关键词深度强化学习柔性演员评论家算法内在好奇心样本利用效率; 下载PDF 职称材料

基于柔性演员-评论家算法的决策规划协同研究: 2; 作者唐斌刘光耀 +3 位作者江浩斌田宁米伟王春宏《交通运输系统工程与信息》 EI CSCD 北大核心 2024年第2期105-113,187,共10页; 为了解决基于常规深度强化学习(Deep Reinforcement Learning, DRL)的自动驾驶决策存在学习速度慢、安全性及合理性较差的问题,本文提出一种基于柔性演员-评论家(Soft Actor-Critic,SAC)算法的自动驾驶决策规划协同方法,并将SAC算法与... 展开更多; 关键词智能交通自动驾驶柔性演员-评论家算法决策规划协同深度强化学习; 下载PDF 职称材料

基于最大熵深度强化学习的双足机器人步态控制方法被引量：1: 3; 作者李源潮陶重犇王琛《计算机应用》 CSCD 北大核心 2024年第2期445-451,共7页; 针对双足机器人连续直线行走的步态稳定控制问题,提出一种基于最大熵深度强化学习(DRL)的柔性演员-评论家(SAC)步态控制方法。首先,该方法无需事先建立准确的机器人动力学模型,所有参数均来自关节角而无需额外的传感器;其次,采用余弦相... 展开更多; 关键词双足机器人步态控制深度强化学习最大熵柔性演员-评论家算法; 下载PDF 职称材料

基于改进强化学习的移动机器人动态避障方法被引量：5: 4; 作者徐建华邵康康 +1 位作者王佳惠刘学聪《中国惯性技术学报》 EI CSCD 北大核心 2023年第1期92-99,共8页; 针对未知环境下移动机器人动态避障存在规划轨迹长、行驶速度慢和鲁棒性差等问题,提出一种基于改进强化学习的移动机器人动态避障方法。移动机器人根据自身速度、目标位置和激光雷达信息直接得到动作信号,实现端到端的控制。基于距离梯... 展开更多; 关键词移动机器人动态避障强化学习柔性演员评论家算法卷积神经网络; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部