-
题名Dueling-DQN在空调节能控制中的应用
被引量:2
- 1
-
-
作者
李骏翔
李兆丰
杨赛赛
陶洪峰
姚辉
吴超
-
机构
浙江省邮电工程建设有限公司大数据研究院
浙江大学公共管理学院
-
出处
《计算机系统应用》
2021年第10期271-279,共9页
-
文摘
针对电信机房空调运行耗电量大,空调自动控制系统设计困难的问题,提出了一种规则约束和DuelingDQN算法相结合的空调节能控制方法.该方法能根据不同机房环境自适应学习建模,在保证机房室内温度在规定范围的前提下,节省空调耗电量.同时针对实际机房应用场景,设计节能控制算法中的状态,动作和奖励函数,并采用深度强化学习算法Dueling-DQN提高模型表达能力和学习效率.在电信机房实际验证结果表明:该控制方法与空调默认设定参数运行相比节能18.3%,并可以很方便推广到不同环境场景的机房环境中,为电信机房节能减排提供解决方案.
-
关键词
节能控制
dueling-dqn
强化学习
机房空调调控
-
Keywords
energy saving control
dueling-dqn
reinforcement learning
air conditioning control in telecommunication rooms
-
分类号
TB657.2
[一般工业技术—制冷工程]
TN80
[电子电信—信息与通信工程]
-
-
题名基于遗憾探索的竞争网络强化学习智能推荐方法研究
被引量:1
- 2
-
-
作者
洪志理
赖俊
曹雷
陈希亮
徐志雄
-
机构
陆军工程大学指挥控制工程学院
-
出处
《计算机科学》
CSCD
北大核心
2022年第6期149-157,共9页
-
文摘
近年来,深度强化学习在推荐系统中的应用受到了越来越多的关注。在已有研究的基础上提出了一种新的推荐模型RP-Dueling,该模型在深度强化学习Dueling-DQN的基础上加入了遗憾探索机制,使算法根据训练程度自适应地动态调整“探索-利用”占比。该算法实现了在拥有大规模状态空间的推荐系统中捕捉用户动态兴趣和对动作空间的充分探索。在多个数据集上进行测试,所提算法在MAE和RMSE两个评价指标上的最优平均结果分别达到了0.16和0.43,比目前的最优研究结果分别降低了0.48和0.56,实验结果表明所提模型优于目前已有的传统推荐模型和基于深度强化学习的推荐模型。
-
关键词
推荐系统
深度强化学习
dueling-dqn
RP-Dueling
动态兴趣
遗憾探索
-
Keywords
Recommendation system
Deep reinforcement learning
dueling-dqn
RP-Dueling
Dynamic interest
Regret exploration
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-