基于强化学习的温度感知多核任务调度被引量：4

Temperature-aware Task Scheduling on Multicores Based on Reinforcement Learning

下载PDF

导出

摘要随着计算机中内核数量的增多,温度感知的多核任务调度算法成为计算机系统中的一个研究热点.近年来,机器学习在各个领域展现出巨大的潜力,很多基于机器学习的系统温度管理研究工作应运而生.其中,强化学习因其较强的自适应性,被广泛地运用于温度感知的任务调度算法中.然而,目前基于强化学习的温度感知任务调度算法系统建模不够准确,很难做到温度、性能和复杂度的较好权衡.因此,提出一种基于强化学习的多核温度感知调度算法——ReLeTA.在该算法中提出了更全面的状态建模方式和更加有效的奖励函数,从而帮助系统进一步降低温度.实验部分通过3个不同的真实计算机平台验证该方法,实验结果表明了该方法的有效性以及可扩展性,与现有方法相比,ReLeTA可以更好地控制系统温度. With the increase of the number of cores in computers,temperature-aware multi-core task scheduling algorithms have become a research hotspot in computer systems.In recent years,machine learning has shown great potential in various fields,and thus many work using machine learning techniques to manage system temperature have emerged.Among them,reinforcement learning is widely used for temperature-aware task scheduling algorithms due to its strong adaptability.However,the state-of-the-art temperature-aware task scheduling algorithms based on reinforcement learning do not effectively model the system,and it is difficult to achieve a better trade-off among temperature,performance,and complexity.Therefore,this study proposes a new multi-core temperature-aware scheduling algorithm based on reinforcement learning—ReLeTA.In the new algorithm,a more comprehensive state modeling method and a more effective reward function are proposed to help the system further reduce the temperature.Experiments are conducted on three different real computer platforms.The experimental results show the effectiveness and scalability of the proposed method.Compared with existing methods,ReLeTA can control the system temperature better.

作者杨世贵王媛媛刘韦辰姜徐赵明雄方卉杨宇刘迪 YANG Shi-Gui;WANG Yuan-Yuan;LIU Wei-Chen;JIANG Xu;ZHAO Ming-Xiong;FANG Hui;YANG Yu;LIU Di(School of Software,Yunnan University,Kunming 650504,China;Institute of Information Engineering,Chinese Academy of Sciences,Beijing 100093,China;School of Computer Science and Engineering,Nanyang Technological University,Singapore;School of Computer Science and Engineering,Northeastern University,Shenyang 110169,China;School of Cyber Security,University of Chinese Academy of Sciences,Beijing 100049,China)

机构地区云南大学软件学院中国科学院信息工程研究所 School of Computer Science and Engineering 东北大学计算机科学与工程学院中国科学院大学网络空间安全学院

出处《软件学报》 EI CSCD 北大核心 2021年第8期2408-2424,共17页 Journal of Software

基金国家自然科学基金(61902341)。

关键词温度感知多核系统强化学习 Q-LEARNING temperature-aware multicore system reinforcement learning Q-Learning

分类号 TP316 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

同被引文献42

1傅启明,刘全,王辉,肖飞,于俊,李娇.一种基于线性函数逼近的离策略Q(λ)算法[J].计算机学报,2014,37(3):677-686. 被引量：26
2张聪.罐头装箱组合式机械手设计[J].包装工程,2016,37(19):163-167. 被引量：3
3刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进.深度强化学习综述[J].计算机学报,2018,41(1):1-27. 被引量：472
4杨茂涛,陈福胜,刘谋海,黄瑞.基于S3C6410的低功耗手持抄表终端设计[J].湖南电力,2019,39(1):5-8. 被引量：1
5梁天新,杨小平,王良,韩镇远.基于强化学习的金融交易系统研究与发展[J].软件学报,2019,30(3):845-864. 被引量：14
6张海娇,孙文胜.Linux及OK6410环境下视频监控系统设计与实现[J].软件导刊,2019,18(3):121-125. 被引量：3
7史科,陆阳,刘广亮,毕翔,王辉.基于多隐层Gibbs采样的深度信念网络训练方法[J].自动化学报,2019,45(5):975-984. 被引量：8
8刘全,闫岩,朱斐,吴文,张琳琳.一种带探索噪音的深度循环Q网络[J].计算机学报,2019,42(7):1588-1604. 被引量：11
9任志刚,刘昊,李强.基于嵌入式Linux的远程视频实时监控系统设计[J].北京服装学院学报（自然科学版）,2019,39(2):56-61. 被引量：3
10张多利,陈楠,汪杨,宋宇鲲.粗粒度多核系统任务级多线程调度研究[J].微电子学与计算机,2020,37(1):46-52. 被引量：2

引证文献4

1结硕,张黎.基于ARM的室内安全系统设计[J].自动化与仪器仪表,2022(1):140-143.
2任银广,王平,毛金凤.深度Q-RBF网络下的瓶装食品装箱机械臂无碰轨迹规划[J].机床与液压,2023,51(5):89-95.
3张立华,刘全,黄志刚,朱斐.逆向强化学习研究综述[J].软件学报,2023,34(10):4772-4803. 被引量：2
4王晓莹,张仲雯,何海生.嵌入式多核多任务实时DVFS调度方法仿真[J].计算机仿真,2023,40(8):500-504.

二级引证文献2

1韩颖.基于卷积神经网络的电力设备故障预测模型的研究[J].自动化应用,2023,64(24):107-109. 被引量：1
2孙浩,黎海青,梁彦,马超雄,吴翰.基于知识辅助深度强化学习的巡飞弹组动态突防决策[J].兵工学报,2024,45(9):3161-3176.

1陈磊,李雅静.人工智能系统安全综述[J].信息通信技术与政策,2021(8):56-63. 被引量：2
2喻海燕,杨岩涛,逯楠楠.高可用环境下的网络监听技术研究与实现[J].现代通信技术,2021(2):34-38.
3崔运进,江帆,黄建德,阎峻,赵锋.抽水蓄能电站中基于边缘计算的任务卸载算法[J].计算机系统应用,2021,30(8):225-231. 被引量：1
4邵明莉,曹鹗,胡铭,章玥,陈闻杰,陈铭松.面向优先车辆感知的交通灯优化控制方法[J].软件学报,2021,32(8):2425-2438. 被引量：5
5陈胜裕,李辉.基于CNC人工蜂群算法的全电动注塑机料筒温控系统[J].塑料,2021,50(4):65-70. 被引量：1
6马凯,王斌,黄炘,高继东.电动汽车用PMSM最大电流测试的零转矩测试方法[J].中国新技术新产品,2021(12):40-42.

软件学报

2021年第8期

浏览历史

内容加载中请稍等...

基于强化学习的温度感知多核任务调度被引量：4

同被引文献42

引证文献4

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于强化学习的温度感知多核任务调度 被引量：4

同被引文献42

引证文献4

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于强化学习的温度感知多核任务调度被引量：4