检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到9篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

结合APF和改进DDQN的动态环境机器人路径规划方法被引量：1: 1; 作者孙传禹张雷 +1 位作者辛山刘悦《小型微型计算机系统》 CSCD 北大核心 2023年第9期1940-1946,共7页; 针对动态环境的机器人路径规划,人工势场法(APF)易陷入局部最小陷阱;强化学习深度双重Q网络(DDQN)算法存在盲目探索过多、收敛较慢和规划路径不平滑的问题,本文提出一种基于人工势场法和改进DDQN的动态环境机器人路径规划算法(PF-IDDQN)... 展开更多; 关键词人工势场法改进ddqn算法路径规划动态环境; 下载PDF 职称材料

基于DDQN算法的混流车间作业动态自适应调度的研究: 2; 作者陈晓航王美林 +1 位作者吴耿枫梁凯晴《现代信息科技》 2021年第24期133-137,141,共6页; 大规模生产的混流车间制造系统存在资源规模大、约束多等问题,快速找到合适的调度策略是实现高效生产的关键。为解决传统数学规划算法和启发式算法存在的策略求解效率低、自适应性差等问题,文章提出一种基于DDQN的智能车间动态自适应调... 展开更多; 关键词深度强化学习 ddqn算法动态自适应调度; 下载PDF 职称材料

B-Spline-Based Curve Fitting to Cam Pitch Curve Using Reinforcement Learning 被引量：1: 3; 作者 Zhiwei Lin Tianding Chen +3 位作者 Yingtao Jiang Hui Wang Shuqin Lin Ming Zhu 《Intelligent Automation & Soft Computing》 SCIE 2023年第5期2145-2164,共20页; Directly applying the B-spline interpolation function to process plate cams in a computer numerical control(CNC)system may produce verbose tool-path codes and unsmooth trajectories.This paper is devoted to addressing ... 展开更多; 关键词 B-splineﬁtting radial error ddqn RL algorithm global optimal policy; 下载PDF 职称材料

基于深度双Q网络的权值时变路网路径规划: 4; 作者何鑫马萍《电子测量技术》北大核心 2023年第17期23-29,共7页; 针对传统路径规划方法无法根据城市路网权值时变特性规划最优路径的问题,提出了基于深度双Q网络的权值时变路网路径规划方法。首先,构建权值时变的城市路网模型,其中,路段各时间段权值由随机函数产生。然后,设计了状态特征、交互动作和... 展开更多; 关键词路径规划权值时变路网 ddqn算法深度强化学习; 下载PDF 职称材料

Deep reinforcement learning for UAV swarm rendezvous behavior: 5; 作者 ZHANG Yaozhong LI Yike +1 位作者 WU Zhuoran XU Jialin 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2023年第2期360-373,共14页; The unmanned aerial vehicle(UAV)swarm technology is one of the research hotspots in recent years.With the continuous improvement of autonomous intelligence of UAV,the swarm technology of UAV will become one of the mai... 展开更多; 关键词 double deep Q network(ddqn)algorithms unmanned aerial vehicle(UAV)swarm task decision deep reinforcement learning(DRL) sparse returns; 下载PDF 职称材料

基于深度强化学习的Boost变换器控制策略: 6; 作者戴宇轩崔承刚《系统仿真学报》 CAS CSCD 北大核心 2023年第5期1109-1119,共11页; 针对Boost变换器母线电压稳定控制存在模型不确定性和非线性的问题,提出了一种基于无模型深度强化学习的智能控制策略。结合强化学习DDQN(double DQN)算法与DDPG算法设计了Boost变换器控制器,包括了状态、动作空间、奖励函数以及神经网... 展开更多; 关键词 BOOST变换器深度强化学习 ddqn算法 DDPG算法协同仿真; 下载PDF 职称材料

基于深度强化学习的平滑车速控制系统: 7; 作者徐延军陈建雄《上海船舶运输科学研究所学报》 2023年第3期35-41,共7页; 为调整不同路段的限速值,平滑交通流,从而提升高速公路车辆通行的安全性和效率,针对交通瓶颈区设计一种基于深度强化学习的平滑车速管控系统。该系统主要包含动态限速启动、限速值确定与更新和情报板动态发布等3个模块。将深度强化学习... 展开更多; 关键词平滑车速控制交通瓶颈区深度强化学习(ddqn)算法元胞传输模型(CTM) 神经网络; 下载PDF 职称材料

基于Double Deep Q Network的无人机隐蔽接敌策略被引量：9: 8; 作者何金丁勇高振龙《电光与控制》 CSCD 北大核心 2020年第7期52-57,共6页; 基于深度强化学习的连续状态空间无人机隐蔽接敌问题,提出了基于马尔可夫决策过程的隐蔽接敌双深度Q网络(DDQN)方法。利用DDQN生成目标值函数的方法解决了传统DQN的过拟合问题;采用按优先级随机抽样的方法获取训练样本,加速了神经网络... 展开更多; 关键词隐蔽接敌策略空战决策马尔可夫决策过程双神经网络结构 ddqn算法; 下载PDF 职称材料

基于卡尔曼滤波和DDQN算法的无人机机动目标跟踪被引量：5: 9; 作者李琳张修社 +1 位作者韩春雷马浩《战术导弹技术》北大核心 2022年第2期98-104,共7页; 为使无人机能够自主、准确地预测目标状态,进而对敌方机动目标进行跟踪,基于卡尔曼滤波和深度强化学习DDQN算法提出了一种在线决策算法。通过构建无人机机动目标跟踪模型和马尔科夫决策过程框架,结合卡尔曼滤波对目标状态进行了准确预... 展开更多; 关键词无人机卡尔曼滤波深度强化学习 ddqn 机动目标跟踪自主跟踪控制在线决策算法; 原文传递

	题名	作者	出处	发文年	被引量	操作
1	结合APF和改进DDQN的动态环境机器人路径规划方法	孙传禹张雷辛山刘悦	《小型微型计算机系统》 CSCD 北大核心	2023	1	下载PDF 职称材料
2	基于DDQN算法的混流车间作业动态自适应调度的研究	陈晓航王美林吴耿枫梁凯晴	《现代信息科技》	2021	0	下载PDF 职称材料
3	B-Spline-Based Curve Fitting to Cam Pitch Curve Using Reinforcement Learning	Zhiwei Lin Tianding Chen Yingtao Jiang Hui Wang Shuqin Lin Ming Zhu	《Intelligent Automation & Soft Computing》 SCIE	2023	1	下载PDF 职称材料
4	基于深度双Q网络的权值时变路网路径规划	何鑫马萍	《电子测量技术》北大核心	2023	0	下载PDF 职称材料
5	Deep reinforcement learning for UAV swarm rendezvous behavior	ZHANG Yaozhong LI Yike WU Zhuoran XU Jialin	《Journal of Systems Engineering and Electronics》 SCIE EI CSCD	2023	0	下载PDF 职称材料
6	基于深度强化学习的Boost变换器控制策略	戴宇轩崔承刚	《系统仿真学报》 CAS CSCD 北大核心	2023	0	下载PDF 职称材料
7	基于深度强化学习的平滑车速控制系统	徐延军陈建雄	《上海船舶运输科学研究所学报》	2023	0	下载PDF 职称材料
8	基于Double Deep Q Network的无人机隐蔽接敌策略	何金丁勇高振龙	《电光与控制》 CSCD 北大核心	2020	9	下载PDF 职称材料
9	基于卡尔曼滤波和DDQN算法的无人机机动目标跟踪	李琳张修社韩春雷马浩	《战术导弹技术》北大核心	2022	5	原文传递

已选择0条

导出题录引用分析

统计分析

使用帮助返回顶部