基于先验知识的HVAC系统深度Q网络控制方法

Priori Knowledge Based Deep Q-Network Control Method for HVAC System

下载PDF

导出

摘要强化学习方法在近年来被逐渐尝试应用于工程控制之中,并且展示出其强大的控制能力和潜力。强化学习算法虽然具有较好的控制性能,但是其控制策略的收敛需要建立在一段时间后的训练上,而这段时间在工程应用上可能会造成一些浪费。为了解决这一问题,提出了基于先验知识的DQN对暖通空调(HVAC)系统中的冷却水系统进行控制,将先验知识引入DQN算法的前期训练中,以减少训练时间,加速收敛,节约成本。基于先验知识的DQN算法不仅能够对系统进行有效的控制,并且能够比DQN更早地实现节能。 Reinforcement learning method has been gradually applied to engineering control in recent years,and has shown its strong control ability and potential.Although reinforcement learning algorithms have good control performance,the convergence of its control strategy needs to be established after a period of training,which may cause some unnecessary cost waste in engineering application.In order to solve this problem,this paper proposes DQN based on priori knowledge to control the cooling water system in HVAC system,and introduces priori knowledge into the early training of DQN algorithm,so as to reduce training time,accelerate convergence and save cost.DQN algorithm based on priori knowledge can not only effectively control the system,but also save energy earlier than DQN.

作者韩智聪王哲超李可马帅

机构地区苏州科技大学电子与信息工程学院苏州科技大学江苏省建筑智慧节能实验室

出处《工业控制计算机》 2023年第3期32-33,36,共3页 Industrial Control Computer

关键词强化学习先验知识加速收敛暖通空调 reinforcement learning priori knowledge accelerate convergence HVAC

分类号 TP18 [自动化与计算机技术—控制理论与控制工程] TU83 [建筑科学—供热、供燃气、通风及空调工程]

引文网络
相关文献

参考文献1

1刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进.深度强化学习综述[J].计算机学报,2018,41(1):1-27. 被引量：431

二级参考文献8

1魏英姿 ,赵明扬 .一种基于强化学习的作业车间动态调度方法[J].自动化学报,2005,31(5):765-771. 被引量：19
2高阳,周如益,王皓,曹志新.平均奖赏强化学习算法研究[J].计算机学报,2007,30(8):1372-1378. 被引量：38
3王皓,高阳,陈兴国.强化学习中的迁移:方法和进展[J].电子学报,2008,36(B12):39-43. 被引量：26
4孙志军,薛磊,许阳明,王正.深度学习研究综述[J].计算机应用研究,2012,29(8):2806-2810. 被引量：592
5余凯,贾磊,陈雨强,徐伟.深度学习的昨天、今天和明天[J].计算机研究与发展,2013,50(9):1799-1804. 被引量：590
6傅启明,刘全,王辉,肖飞,于俊,李娇.一种基于线性函数逼近的离策略Q(λ)算法[J].计算机学报,2014,37(3):677-686. 被引量：25
7黎亚雄,张坚强,潘登,胡惮.基于RNN-RBM语言模型的语音识别研究[J].计算机研究与发展,2014,51(9):1936-1944. 被引量：27
8杨钊,陶大鹏,张树业,金连文.大数据下的基于深度神经网的相似汉字识别[J].通信学报,2014,35(9):184-189. 被引量：28

共引文献430

1傅汇乔,唐开强,邓归洲,王鑫鹏,陈春林.基于深度强化学习的六足机器人运动规划[J].智能科学与技术学报,2020(4):361-371. 被引量：2
2刘朝阳,穆朝絮,孙长银.深度强化学习算法与应用研究现状综述[J].智能科学与技术学报,2020(4):314-326. 被引量：35
3韩志豪,汪益兵,张宇,郝永志.基于深度强化学习的船舶航线自动规划[J].中国航海,2021,44(1):100-105. 被引量：9
4李茹杨,彭慧民,李仁刚,赵坤.强化学习算法与应用综述[J].计算机系统应用,2020,29(12):13-25. 被引量：35
5周瑶瑶,李烨.基于排序优先经验回放的竞争深度Q网络学习[J].计算机应用研究,2020,37(2):486-488. 被引量：3
6李逊,李俊超,邓林忠,康旭云,欧启捷,劳恒辉.人工智能优化技术在钢筋混凝土结构的应用[J].建筑结构,2023,53(S02):1425-1430.
7刘洋,李建军.深度确定性策略梯度算法优化[J].辽宁工程技术大学学报（自然科学版）,2020(6):545-549. 被引量：1
8蒋方庆,陈自力,高喜俊,王春峰,贺道坤.基于改进TD3算法的无人机决策研究[J].信息化研究,2023,49(3):36-42.
9甘惟,吴志强,王元楷,徐浩文,严娟,何珍,赵紫辰.AIGC辅助城市设计的理论模型建构[J].城市规划学刊,2023(2):12-18. 被引量：6
10梁明兰,王峥,陈名松.基于可重构阵列架构的强化学习计算引擎[J].集成技术,2018,7(6):19-30.

1费毅辉.绿色节能技术在暖通设计方面的运用探讨[J].中文科技期刊数据库（文摘版）工程技术,2021(4):0361-0361.
2张艳.HVAC系统在洁净厂房施工中的应用[J].中文科技期刊数据库（全文版）工程技术,2022(1):0131-0134.
3唐明.智能化技术在电气自动化中的应用分析[J].中文科技期刊数据库（全文版）工程技术,2020(12):0068-0069.
4于建军.浅谈水利水电工程建筑的施工技术及管理策略[J].中文科技期刊数据库（文摘版）工程技术,2021(11):0083-0084.
5侯涛涛.PLC技术应用于电气工程控制的自动化设计[J].中国科技期刊数据库工业A,2021(2):0177-0177.
6王雪香.论初中历史教学中史料知识的合理运用[J].中文科技期刊数据库（引文版）教育科学,2020(12):0061-0061.
7周善强.基于数学思想的初中数学教学实践策略[J].中国科技期刊数据库科研,2022(6):0109-0112.
8张灿.试谈高层建筑暖通空调设计要点[J].中文科技期刊数据库（引文版）工程技术,2021(3):0008-0008.
9陈娟.高职院校学生开展“四史”学习教育的机制研究[J].中文科技期刊数据库（全文版）教育科学,2022(5):0100-0102.
10张继.PLC技术应用于电气工程控制的自动化设计研究[J].中国科技期刊数据库工业A,2022(11):0110-0112.

工业控制计算机

2023年第3期

浏览历史

内容加载中请稍等...

基于先验知识的HVAC系统深度Q网络控制方法

参考文献1

二级参考文献8

共引文献430

相关作者

相关机构

相关主题

浏览历史