期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
Dueling-DQN在空调节能控制中的应用 被引量:2
1
作者 李骏翔 李兆丰 +3 位作者 杨赛赛 陶洪峰 姚辉 吴超 《计算机系统应用》 2021年第10期271-279,共9页
针对电信机房空调运行耗电量大,空调自动控制系统设计困难的问题,提出了一种规则约束和DuelingDQN算法相结合的空调节能控制方法.该方法能根据不同机房环境自适应学习建模,在保证机房室内温度在规定范围的前提下,节省空调耗电量.同时针... 针对电信机房空调运行耗电量大,空调自动控制系统设计困难的问题,提出了一种规则约束和DuelingDQN算法相结合的空调节能控制方法.该方法能根据不同机房环境自适应学习建模,在保证机房室内温度在规定范围的前提下,节省空调耗电量.同时针对实际机房应用场景,设计节能控制算法中的状态,动作和奖励函数,并采用深度强化学习算法Dueling-DQN提高模型表达能力和学习效率.在电信机房实际验证结果表明:该控制方法与空调默认设定参数运行相比节能18.3%,并可以很方便推广到不同环境场景的机房环境中,为电信机房节能减排提供解决方案. 展开更多
关键词 节能控制 dueling-dqn 强化学习 机房空调调控
下载PDF
基于遗憾探索的竞争网络强化学习智能推荐方法研究 被引量:1
2
作者 洪志理 赖俊 +2 位作者 曹雷 陈希亮 徐志雄 《计算机科学》 CSCD 北大核心 2022年第6期149-157,共9页
近年来,深度强化学习在推荐系统中的应用受到了越来越多的关注。在已有研究的基础上提出了一种新的推荐模型RP-Dueling,该模型在深度强化学习Dueling-DQN的基础上加入了遗憾探索机制,使算法根据训练程度自适应地动态调整“探索-利用”... 近年来,深度强化学习在推荐系统中的应用受到了越来越多的关注。在已有研究的基础上提出了一种新的推荐模型RP-Dueling,该模型在深度强化学习Dueling-DQN的基础上加入了遗憾探索机制,使算法根据训练程度自适应地动态调整“探索-利用”占比。该算法实现了在拥有大规模状态空间的推荐系统中捕捉用户动态兴趣和对动作空间的充分探索。在多个数据集上进行测试,所提算法在MAE和RMSE两个评价指标上的最优平均结果分别达到了0.16和0.43,比目前的最优研究结果分别降低了0.48和0.56,实验结果表明所提模型优于目前已有的传统推荐模型和基于深度强化学习的推荐模型。 展开更多
关键词 推荐系统 深度强化学习 dueling-dqn RP-Dueling 动态兴趣 遗憾探索
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部