一种面向建筑节能的强化学习自适应控制方法被引量：9

Building energy efficiency oriented reinforcement learning adaptive control method

下载PDF

导出

摘要针对建筑节能领域中传统控制方法对于建筑物相关设备控制存在收敛速度慢、不稳定等问题,结合强化学习中经典的Q学习方法,提出一种强化学习自适应控制方法——RLAC。该方法通过对建筑物内能耗交换机制进行建模,结合Q学习方法,求解最优值函数,进一步得出最优控制策略,确保在不降低建筑物人体舒适度的情况下,达到建筑节能的目的。将所提出的RLAC与On/Off以及Fuzzy-PD方法用于模拟建筑物能耗问题进行对比实验,实验结果表明,RLAC具有较快的收敛速度以及较好的收敛精度。 With respect to the problem of slow convergence and instability for the traditional methods, in the field of building energy efficiency, this paper proposes a new reinforcement learning adaptive control method, RLAC by combining Q-learning. The proposed method models the exchange mechanism of the building energy consumption, and tries to find the better control policy by solving the optimal value function. Furthermore, RLAC can decrease the energy consumption without losing the performance of good comfort of the building occupants. Compared with the On/Off and Fuzzy-PD, the proposed RLAC has a better convergence performance in speed and accuracy.

作者胡龄爻陈建平傅启明胡文倪庆文

机构地区苏州科技大学电子与信息工程学院江苏省建筑智慧节能重点实验室苏州市移动网络技术与应用重点实验室吉林大学符号计算与知识工程教育部重点实验室

出处《计算机工程与应用》 CSCD 北大核心 2017年第21期239-246,共8页 Computer Engineering and Applications

基金国家自然科学基金(No.61502329 No.61602334 No.61672371) 住房与城乡建设部科学技术项目(No.2015-K1-047) 江苏省自然科学基金(No.BK20140283) 苏州市体育局体育科研局管课题(No.TY2015-301) 苏州市科技计划项目(No.SYG201255 No.SZS201304)

关键词强化学习马尔科夫决策过程 Q学习建筑节能自适应控制 reinforcement learning Markov Decision Process（MDP） Q-learning building energy efficiency adaptive control

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

同被引文献49

1姚佳伟,黄辰宇,付斌,纪尧姆·卡尼奥.深度强化学习支持下风环境性能驱动的设计研究与实践[J].建筑学报,2022(S01):31-38. 被引量：2
2丁志梁,潘毅群(指导),谢建彤,王尉同,黄治钟.强化学习算法在空调系统运行优化中的应用研究[J].建筑节能,2020(7):14-20. 被引量：7
3蒋泽甫,李明辉.神经网络技术在直接转矩控制系统中的应用[J].自动化信息,2006(4):40-41. 被引量：3
4张会平,王小召.建筑节能及建筑节能措施[J].四川建筑科学研究,2006,32(4):178-180. 被引量：41
5尹伯悦,赖明,谢飞鸿.绿色建筑与智能建筑在世界和我国的发展与应用状况[J].建筑技术,2006,37(10):733-735. 被引量：29
6徐兴声.智能建筑的发展与可持续发展方向[J].建筑学报,1997(6):20-22. 被引量：35
7余涛,周斌,陈家荣.基于Q学习的互联电网动态最优CPS控制[J].中国电机工程学报,2009,29(19):13-19. 被引量：35
8张雪松.可持续建筑的智能、动态立面设计[J].新建筑,2010(2):107-110. 被引量：7
9吴宏杰,吕强,吴进珍,黄旭,罗小虎,钱培德.从头预测蛋白质骨架的一种并行蚁群方法及其在CASP8/9中的应用[J].中国科学：信息科学,2012,42(8):1034-1048. 被引量：7
10喻伟,李百战,杨明宇,杜秀媛.基于人工神经网络的建筑多目标预测模型[J].中南大学学报（自然科学版）,2012,43(12):4949-4955. 被引量：30

引证文献9

1闫军威,黄琪,周璇.基于Double-DQN的中央空调系统节能优化运行[J].华南理工大学学报（自然科学版）,2019,47(1):135-144. 被引量：10
2吴宏杰,杨茹,傅启明,陈建平,陆卫忠.基于强化学习的HP模型优化方法研究[J].计算机工程与应用,2019,55(12):132-139. 被引量：1
3陈建平,康怡怡,胡龄爻,陆悠,吴宏杰,傅启明.基于多线程并行强化学习的建筑节能方法[J].计算机工程与应用,2019,55(15):219-227. 被引量：1
4黄泽天,杨正霞.降维式自主迁移强化学习建筑能耗预测[J].电脑知识与技术,2019,15(9):205-208. 被引量：1
5李骏翔,李兆丰,杨赛赛,陶洪峰,姚辉,吴超.Dueling-DQN在空调节能控制中的应用[J].计算机系统应用,2021,30(10):271-279. 被引量：2
6闫军威,黄琪,周璇.基于DDPG的冷源系统节能优化控制策略[J].控制与决策,2021,36(12):2955-2963. 被引量：2
7殷雨竹,陈建平,傅启明,陆悠,吴宏杰.基于自监督网络的DDPG算法的建筑能耗控制[J].计算机系统应用,2022,31(2):161-167. 被引量：1
8牛茜,蒋琴,王瑶,赵宏宇,陈彦如.神经网络技术在高铁站多联机空调节能控制中的应用[J].计算机系统应用,2022,31(1):303-308. 被引量：3
9陈鑫星,宋晔皓.碳中和视角下的公共建筑主动感知与智能控制研究[J].艺术与设计（城市空间设计）,2022(4):6-9.

二级引证文献20

1杨琳.高层建筑空调节能设计及室内热舒适性研究[J].江西建材,2023(2):97-99. 被引量：1
2戴小燕,张映波,杲靖,王仁南.基于人工智能的节能控制物联网云平台的设计与实现[J].电气应用,2019,38(11):97-104. 被引量：7
3李骏翔,李兆丰,杨赛赛,陶洪峰,姚辉,吴超.Dueling-DQN在空调节能控制中的应用[J].计算机系统应用,2021,30(10):271-279. 被引量：2
4齐蓬勃,李凡,高雯.基于多智能体强化学习的分布式停电检修管控系统设计[J].电子设计工程,2021,29(23):41-45. 被引量：2
5万典典,刘智伟,陈语,池明.基于DDPG算法的冰蓄冷空调系统运行策略优化[J].控制工程,2022,29(3):441-446. 被引量：6
6吴磊,康英伟.基于深度强化学习的湿法脱硫系统运行优化[J].系统科学与数学,2022,42(5):1067-1087.
7纪甜甜.基于降维式自主迁移教学优化初中物理教学[J].中学物理,2022,40(20):17-19.
8叶锦潮.基于物联网智能感知的空调系统节能方案[J].绿色科技,2022,24(18):241-245. 被引量：2
9丁瑞华,崔承刚,王逸轩,张少迪.基于深度强化学习的数据中心空调系统优化控制[J].低温与超导,2022,50(9):79-85. 被引量：4
10焦焕炎,冯浩东,魏东,冉义兵,胡朝文.基于强化学习的地铁站空调系统节能控制[J].控制与决策,2022,37(12):3139-3148. 被引量：4

1刘跃军,苏静.基于Markov Decision Processes的可靠性定量分析实证研究[J].安阳师范学院学报,2017(5):14-18.
2刘阳,耿娜.面向多检查的门诊患者调度研究[J].运筹与管理,2017,26(9):78-87. 被引量：5
3刘剑飞,熊雄.主动配电网下多微电网间功率协调优化研究[J].电器与能效管理技术,2017(18):56-62. 被引量：1
4孔德因.改动维修创维42E615L液晶彩电背光不亮故障[J].家电维修,2017,0(9):42-43.
5敖珺,梁积卫,马春波,曹桂兴,李聪,沈宇飞.自由空间光通信中基于Q学习算法的Raptor10码译码策略[J].中国激光,2017,44(9):221-229. 被引量：3
6王利鑫,董小高,常春雷.城市绿地温湿效应研究进展[J].黑龙江农业科学,2017(9):133-136.
7熊丽荣,雷静之,金鑫.基于Q-learning的HTTP自适应流码率控制方法研究[J].通信学报,2017,38(9):18-24. 被引量：3
8谭弘颖,陈钢.ISO/TC184/SC1年会暨WG7工作组会议在京召开[J].制造技术与机床,2017,0(11):12-13.
9吕龙龙,冯进宝.基于STM32的烘焙监控系统设计[J].信息通信,2017,30(3):74-75.
10王磊,张林.基于节能要求分析建筑施工技术的改良[J].工程建设与设计,2017(18):161-162. 被引量：3

计算机工程与应用

2017年第21期

浏览历史

内容加载中请稍等...

一种面向建筑节能的强化学习自适应控制方法被引量：9

同被引文献49

引证文献9

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

一种面向建筑节能的强化学习自适应控制方法 被引量：9

同被引文献49

引证文献9

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

一种面向建筑节能的强化学习自适应控制方法被引量：9