期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于DDQN的三元多级散列异步流量调度方法
1
作者 张皓瀚 易晶晶 《网络新媒体技术》 2024年第5期42-48,共7页
数据中心网络(DCNs)中Web访问和分布式计算的短消息业务占据大部分的流量,为解决数据中心短消息的长尾效应,提出一种接收端驱动的基于强化学习面向动态优先级的流量调度算法。该算法基于双重深度Q网络(DDQN)强化学习设置动态调度门限,... 数据中心网络(DCNs)中Web访问和分布式计算的短消息业务占据大部分的流量,为解决数据中心短消息的长尾效应,提出一种接收端驱动的基于强化学习面向动态优先级的流量调度算法。该算法基于双重深度Q网络(DDQN)强化学习设置动态调度门限,完成动态优先级分配,并在发送队列按照差额轮询极大地降低了低优先级长消息的尾部延时,在发送端将长度小于调度门限的短数据包直接发送,在接收端根据三元检测的信息给长度大于调度门限的数据包动态分配优先级队列,消除抢占延时,保证链路的高占用率和低传输时延。实验表明,本算法在链路95%以上的高负载情况下,对字节数小于Unscheduled Bytes的短消息流完成时间放缓比降低了85%。 展开更多
关键词 流量调度 数据中心网络 ddqn强化学习 带内优先级 三元检测
下载PDF
基于深度强化学习的平滑车速控制系统
2
作者 徐延军 陈建雄 《上海船舶运输科学研究所学报》 2023年第3期35-41,共7页
为调整不同路段的限速值,平滑交通流,从而提升高速公路车辆通行的安全性和效率,针对交通瓶颈区设计一种基于深度强化学习的平滑车速管控系统。该系统主要包含动态限速启动、限速值确定与更新和情报板动态发布等3个模块。将深度强化学习... 为调整不同路段的限速值,平滑交通流,从而提升高速公路车辆通行的安全性和效率,针对交通瓶颈区设计一种基于深度强化学习的平滑车速管控系统。该系统主要包含动态限速启动、限速值确定与更新和情报板动态发布等3个模块。将深度强化学习算法DDQN(Double Deep Q-Network)引入系统中,提出一种基于DDQN的平滑车速控制策略,从目标网络和经验回顾2个维度提升该算法的性能。基于元胞传输模型(Cellular Transmission Model,CTM)对宁夏高速公路某路段的交通流运行场景进行仿真,以车辆总通行时间和车流量为评价指标验证该系统的有效性,结果表明该系统能提高瓶颈区内拥堵路段车辆的通行效率。 展开更多
关键词 平滑车速控制 交通瓶颈区 深度强化学习(ddqn)算法 元胞传输模型(CTM) 神经网络
下载PDF
基于深度强化学习的股市操盘手模型研究 被引量:2
3
作者 韩道岐 张钧垚 +1 位作者 周玉航 刘青 《计算机工程与应用》 CSCD 北大核心 2020年第21期145-153,共9页
股票市场具有变化快、干扰因素多、周期数据不足等特点,股票交易是一种不完全信息下的博弈过程,单目标的监督学习模型很难处理这类序列化决策问题。强化学习是解决该类问题的有效途径之一。提出了基于深度强化学习的智能股市操盘手模型I... 股票市场具有变化快、干扰因素多、周期数据不足等特点,股票交易是一种不完全信息下的博弈过程,单目标的监督学习模型很难处理这类序列化决策问题。强化学习是解决该类问题的有效途径之一。提出了基于深度强化学习的智能股市操盘手模型ISTG(Intelligent Stock Trader and Gym),融合历史行情数据、技术指标、宏观经济指标等多数据类型,分析评判标准和优秀控制策略,加工长周期数据,实现可增量扩展不同类型数据的复盘模型,自动计算回报标签,训练智能操盘手,并提出直接利用行情数据计算单步确定性动作值的方法。采用中国股市1400多支的有10年以上数据的股票进行多种对比实验,ISTG的总体收益达到13%,优于买入持有总体−7%的表现。 展开更多
关键词 深度强化学习 双价值网络的深度强化学习(ddqn) 单步确定性动作值 量化策略
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部