检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到3篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于改进DQN强化学习算法的弹性光网络资源分配研究: 1; 作者尚晓凯韩龙龙翟慧鹏《光通信技术》 2023年第5期12-15,共4页; 针对光网络资源分配中频谱资源利用率不高的问题,提出了一种改进的深度Q网络(DQN)强化学习算法。该算法基于ε-greedy策略,根据动作价值函数和状态价值函数的差异来设定损失函数,并不断调整ε值,以改变代理的探索率。通过这种方式,实现... 展开更多; 关键词弹性光网络改进深度q网络强化学习算法资源分配; 下载PDF 职称材料

基于改进深度Q网络算法的多园区综合能源系统能量管理方法被引量：3: 2; 作者薛溟枫毛晓波 +2 位作者肖浩浦骁威裴玮《电力建设》 CSCD 北大核心 2022年第12期83-93,共11页; 多园区综合能源系统可通过多能互补互济显著提升运行经济性,然而园区之间的复杂互动、多能耦合决策会给多园区综合能源系统的能量管理带来决策空间庞大、算法难以收敛等挑战性问题。为解决上述问题,提出了一种基于改进深度Q网络(modifie... 展开更多; 关键词园区综合能源系统深度强化学习能量管理改进深度q网络(MDqN)算法; 原文传递

双足机器人步态控制的深度强化学习方法被引量：8: 3; 作者冯春张祎伟 +2 位作者黄成姜文彪武之炜《计算机集成制造系统》 EI CSCD 北大核心 2021年第8期2341-2349,共9页; 针对双足机器人行走过程中的步态稳定控制问题,提出一种改进深度Q网络的深度强化学习方法。首先,将深度Q网络算法与确定性策略梯度相结合,提出用修正Double-Q网络优化操作—评论网络的评论网络,给出一种改进的深度Q网络;然后,建立双足... 展开更多; 关键词双足机器人步态控制深度强化学习智能体操作—评论改进深度q网络算法; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部