检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到3篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于深度强化学习的高频交易优化算法被引量：2: 1; 作者饶瑞潘志松 +3 位作者黎维刘松仪张磊李云波《南京理工大学学报》 CAS CSCD 北大核心 2022年第3期304-312,共9页; 为解决高频交易的高额交易费用问题,该文提出了一种融合长短期记忆(LSTM)网络细胞结构的深度确定性策略梯度交易算法。该算法利用细胞结构对当前信息和历史特征进行环境特征提取和保存,用于指导交易决策。通过深度确定性策略梯度算法实... 展开更多; 关键词深度强化学习高频交易长短期记忆深度确定性策略梯度交易交易费率收盘价格奖励函数; 下载PDF 职称材料

基于随机森林强化学习的干扰智能决策方法研究被引量：8: 2; 作者裴绪芳陈学强 +3 位作者吕丽刚张双义刘松仪汪西明《通信技术》 2019年第9期2118-2124,共7页; 电磁频谱的主导权是现代化电子战制胜的关键。传统的通信对抗中干扰方的干扰模式相对固定单一,干扰效率低下。因此,研究频谱对抗环境中利用强化学习智能选择干扰信道策略对用户通信进行干扰,将干扰方的信道决策过程建模为一个马尔科夫... 展开更多; 关键词电磁频谱强化学习智能干扰 MDP; 下载PDF 职称材料

基于多智能体深度强化学习的多域协同抗干扰方法研究被引量：4: 3; 作者张彪汪西明 +4 位作者徐逸凡李文韩昊刘松仪陈学强《物联网学报》 2022年第4期104-116,共13页; 动态的传输需求和有限的缓存空间给恶意干扰环境下的无线数据传输带来巨大挑战。针对上述问题,从频域和时域的角度出发,研究了面向分布式物联网的协同抗干扰信道选择和数据调度联合决策方法,构建了基于多用户马尔可夫决策过程的数据传... 展开更多; 关键词协同抗干扰信道选择数据调度多智能体强化学习深度学习; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部