检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到5篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于多步信息辅助的Q-learning路径规划算法: 1; 作者王越龙王松艳晁涛《系统仿真学报》 CAS CSCD 北大核心 2024年第9期2137-2148,共12页; 为提升静态环境下移动机器人路径规划能力,解决传统Q-learning算法在路径规划中收敛速度慢的问题,提出一种基于多步信息辅助机制的Q-learning改进算法。利用ε-greedy策略中贪婪动作的多步信息与历史最优路径长度更新资格迹,使有效的资... 展开更多; 关键词路径规划 Q-LEARNING 收敛速度动作选择策略栅格地图; 下载PDF 职称材料

连通约束下的经验增强多智能体路径规划算法: 2; 作者张李《福建电脑》 2023年第3期1-8,共8页; 避障与通信连通约束下的多智能体路径规划问题是多智能体领域的一个热点问题。本文研究了智能体从起始区域出发,在仅指定目标区域而不指定每个智能体具体目标点的场景,多智能体需要在保持避障约束与通信连通约束下找到最优的路径和各自... 展开更多; 关键词强化学习多智能体系统路径规划动作选择策略经验增强; 下载PDF 职称材料

基于启发式强化学习的AGV路径规划被引量：9: 3; 作者唐恒亮唐滋芳 +2 位作者董晨刚尹棋正海秋茹《北京工业大学学报》 CAS CSCD 北大核心 2021年第8期895-903,共9页; 针对传统算法、智能算法与强化学习算法在自动引导小车(automated guided vehicle,AGV)路径规划中收敛速度慢、学习效率低的问题,提出一种启发式强化学习算法,并针对传统Q(λ)算法,设计启发式奖励函数和启发式动作选择策略,以此强化智... 展开更多; 关键词自动引导小车(automated guided vehicle AGV) 强化学习 Q(λ)算法启发式奖励函数启发式动作选择策略路径规划; 下载PDF 职称材料

基于深度强化学习的网络攻击路径规划方法被引量：2: 4; 作者高文龙周天阳 +1 位作者赵子恒朱俊虎《信息安全学报》 CSCD 2022年第5期65-78,共14页; 攻击路径规划对实现自动化渗透测试具有重要意义,在现实环境中攻击者很难获取全面准确的网络及配置信息,面向未知渗透测试环境下的攻击路径规划,提出了基于深度强化学习的攻击路径规划方法。首先,对渗透测试问题的状态空间和动作空间进... 展开更多; 关键词深度强化学习路径启发信息深度优先渗透的动作选择策略攻击路径规划; 下载PDF 职称材料

存在危险区域的路径规划问题研究被引量：1: 5; 作者张震臧兆祥 +1 位作者郭鸿村田佩《长江信息通信》 2022年第4期14-19,共6页; 为解决标准强化学习算法无法直接应用于存在危险区域的兵棋推演路径规划这一问题,文章提出了一种特殊的奖励机制,用来引导强化学习算法解决该问题。在此基础上,设计了一种探索率递减变化的方法,并在不同难度的实验环境中对Q学习算法的ε... 展开更多; 关键词陆战兵棋推演强化学习路径规划 Q学习动作选择策略; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部