检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到2篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于深度强化学习的股市操盘手模型研究被引量：2: 1; 作者韩道岐张钧垚 +1 位作者周玉航刘青《计算机工程与应用》 CSCD 北大核心 2020年第21期145-153,共9页; 股票市场具有变化快、干扰因素多、周期数据不足等特点,股票交易是一种不完全信息下的博弈过程,单目标的监督学习模型很难处理这类序列化决策问题。强化学习是解决该类问题的有效途径之一。提出了基于深度强化学习的智能股市操盘手模型I... 展开更多; 关键词深度强化学习双价值网络的深度强化学习(DDQN) 单步确定性动作值量化策略; 下载PDF 职称材料

基于规则引导DDPG的多目标电网调度算法被引量：4: 2; 作者黄尽云罗倩成梁成《北京信息科技大学学报（自然科学版）》 2022年第2期56-61,共6页; 设计了一种多目标的电网调度模型,在保障电网安全运行的基础上,实现最大化新能源消纳和最小化运行成本的目标。引入深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法与环境交互得到最优调度策略。针对DDPG算法存在的... 展开更多; 关键词深度确定性策略梯度规则引导函数电网调度多目标双价值网络新能源消纳; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部