检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到4篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于Q学习和TD误差的传感器节点任务调度算法被引量：1: 1; 作者徐祥伟魏振春 +1 位作者冯琳张岩《合肥工业大学学报（自然科学版）》 CAS 北大核心 2017年第4期470-475,521,共7页; 针对现有合作学习算法存在频繁通信、能量消耗过大等问题,应用目标跟踪建立任务模型,文章提出一种基于Q学习和TD误差(Q-learning and TD error,QT)的传感器节点任务调度算法。具体包括将传感器节点任务调度问题映射成Q学习可解决的学习... 展开更多; 关键词无线传感器网络(WSNs) 传感器节点任务调度 Q学习 td误差协作机制; 下载PDF 职称材料

基于改进优先经验回放的SAC算法路径规划被引量：1: 2; 作者崔立志钟航董文娟《空间控制技术与应用》 CSCD 北大核心 2023年第5期55-64,共10页; 为解决智能体在复杂环境下的路径规划问题,提出一种基于改进优先经验回放方法的在线异策略深度强化学习算法模型.该模型采用柔性动作评价算法,通过设计智能体的状态空间、动作空间及奖励函数等实现智能体无碰撞路径规划;利用样本状态优... 展开更多; 关键词状态优先度 td误差离散度优先经验回放学习效率; 下载PDF 职称材料

基于优先经验回放的多智能体协同算法被引量：5: 3; 作者黄子蓉甯彦淞王莉《太原理工大学学报》 CAS 北大核心 2021年第5期747-753,共7页; 针对多智能体协同训练中存在的经验缓存机制构建和回放问题,提出一种基于优先经验回放的多智能体协同算法(prioritized experience replayfor multi-agent cooperation,PEMAC)。该算法在MAAC(actor-attention-critic for multi-agent re... 展开更多; 关键词深度强化学习多智能体协同优先经验缓存回放 td误差; 下载PDF 职称材料

基于概率型支持向量分类机的Q学习被引量：1: 4; 作者程玉虎高阳王雪松《中国矿业大学学报》 EI CAS CSCD 北大核心 2010年第3期408-413,共6页; 按TD误差标准,把Q学习系统的状态-动作空间粗略地划分为正负2类.为了描述分类的不确定性和避免简单分类导致的学习精度下降问题,利用概率型支持向量分类机(PSVCM)来使得样本的分类同时具有定性的解释和定量的评价.PSVCM的输入为系统的... 展开更多; 关键词概率支持向量分类机 td误差 Q学习; 原文传递

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部