检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到3篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于SumTree采样结合Double DQN的非合作式多用户动态功率控制方法被引量：1: 1; 作者刘骏王永华 +1 位作者王磊尹泽中《电讯技术》北大核心 2023年第10期1603-1611,共9页; 为了保证认知无线网络中次用户本身的通信服务质量,同时降低次用户因发射功率不合理而造成的功率损耗,提出了一种基于SumTree采样结合深度双Q网络(Double Deep Q Network,Double DQN)的非合作式多用户动态功率控制方法。通过这种方法,... 展开更多; 关键词认知无线网络(CRN) 功率控制 sumtree采样深度强化学习; 下载PDF 职称材料

基于深度强化学习的SDN服务质量智能优化算法: 2; 作者廖岑卉珊陈俊彦 +2 位作者梁观平谢小兰卢小烨《物联网学报》 2023年第1期73-82,共10页; 深度强化学习具有较强的决策能力和泛化能力,常被应用于软件定义网络(SDN,software defined network)的服务质量(QoS,quality of service)优化中。但传统深度强化学习算法存在收敛速度慢和不稳定等问题。提出一种基于深度强化学习的服... 展开更多; 关键词深度强化学习软件定义网络服务质量数据中心网络 sumtree; 下载PDF 职称材料

采用DDPG的双足机器人自学习步态规划方法被引量：6: 3; 作者周友行赵晗妘 +2 位作者刘汉江李昱泽肖雨琴《计算机工程与应用》 CSCD 北大核心 2021年第6期254-259,共6页; 为解决多自由度双足机器人步行控制中高维非线性规划难题,挖掘不确定环境下双足机器人自主运动潜力,提出了一种改进的基于深度确定性策略梯度算法(DDPG)的双足机器人步态规划方案。把双足机器人多关节自由度控制问题转化为非线性函数的... 展开更多; 关键词双足机器人步态规划深度确定性策略梯度算法(DDPG) 径向基函数(RBF)神经网络 sumtree Gazebo; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部