基于决策树和由均匀分布改进Q学习的虚拟机整合算法被引量：4

Virtual Machine Consolidation Algorithm Based on Decision Tree and Improved Q-learning by Uniform Distribution

下载PDF

导出

摘要随着云数据中心规模的不断扩大,次优虚拟机整合算法所引起的高能耗、低资源利用率和用户服务质量下降等问题逐渐凸显。为此,提出了一种基于决策树和由均匀分布改进Q学习的虚拟机整合算法(DTQL-UD)。该算法采用决策树实现状态表征,并在评估下一时刻状态-动作价值时采用均匀分布选取下一时刻动作,可直接从云数据中心状态到虚拟机迁移的过程中通过实时反馈来不断优化决策。此外,针对强化学习中模拟器与真实场景中的差异问题,基于大量真实云数据中心负载跟踪数据,使用监督学习模型训练模拟器以增加模拟器的仿真度。仿真实验结果表明,DTQL-UD在能耗、资源利用率、用户服务质量、虚拟机迁移次数和剩余活跃主机数量方面分别优化了14%,12%,21%,40%和10%。同时,得益于决策树在表格型数据上更强的特征提取能力,DTQL-UD相比其他现有的深度强化学习方法可学到更优的整合策略,并且在本实验中随着云数据中心规模的增大,可将传统强化学习模型的训练耗时逐步减少60%~92%。 As the scale of cloud data centers expands,problems such as high energy consumption,low resource utilization,and reduced quality of service caused by sub-optimal virtual machine consolidation algorithm becomes increasingly prominent.Therefore,this paper proposes DTQL-UD,a virtual machine consolidation algorithm based on decision tree and improved Q-learning by uniform distribution.It uses the decision tree to characterize the states and selects the next action by uniform distribution when evaluating the next state-action value.At the same time,it can optimize decision-making with real-time feedback directly from the state of the cloud data center to the virtual machine migration process.Besides,aiming at the difference between the simulator and real world in reinforcement learning,we train the simulator by supervised learning model based on a large amount of real cluster load tracking data to enhance the degree of the simulator.Compared with the existing heuristic methods,experiment results show that DTQL-UD can optimize energy consumption,resource utilization,quality of service,number of virtual machine migrations,and remaining active hosts,by 14%,12%,21%,40%,and 10%,respectively.Meanwhile,due to the stronger feature extraction capability of decision tree on tabular data,DTQL-UD can learn better scheduling strategy than other existing deep reinforcement learning(DRL)methods.And in our experiments,as the cluster size increases,the proposed algorithm can gradually reduce the training time of traditional reinforcement learning models by 60%to 92%.

作者师亮温亮明雷声黎建辉 SHI Liang;WEN Liangming;LEI Sheng;LI Jianhui(Computer Network Information Center,Chinese Academy of Sciences,Beijing 100090,China;University of Chinese Academy of Sciences,Beijing 100049,China)

机构地区中国科学院计算机网络信息中心中国科学院大学

出处《计算机科学》 CSCD 北大核心 2023年第6期36-44,共9页 Computer Science

基金国家重点研发计划(2021YFE0111500) 中国科学院国际大科学计划培育专项(241711KYSB20200023)。

关键词云资源调度虚拟机整合算法强化学习决策树 Cloud resource scheduling Virtual machine consolidation algorithm Reinforcement learning Decision tree

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1胡志刚,肖慧,李克勤.云计算中基于多目标优化的虚拟机整合算法[J].湖南大学学报（自然科学版）,2020,47(2):116-124. 被引量：4
2余显,李振宇,孙胜,张广兴,刁祖龙,谢高岗.基于深度强化学习的自适应虚拟机整合方法[J].计算机研究与发展,2021,58(12):2783-2797. 被引量：8
3王珂,曲桦,赵季红.多域SFC部署中基于强化学习的多目标优化方法[J].计算机科学,2021,48(12):324-330. 被引量：5
4程泽凯,闫小利,程旺生,袁志祥.基于梯度提升决策树的焦炭质量预测模型研究[J].重庆工商大学学报（自然科学版）,2021,38(5):55-60. 被引量：8
5黄宁馨,尹翔,乐云亮,彭坤彦.一种基于元学习的改进深度强化学习算法[J].扬州大学学报（自然科学版）,2021,24(3):19-23. 被引量：2
6范静宇,刘全.基于随机加权三重Q学习的异策略最大熵强化学习算法[J].计算机科学,2022,49(6):335-341. 被引量：2
7欧冬秀,张馨尹,赵源,张雷,高博文,吴宇森.基于梯度提升决策树级联分类方法的城市轨道交通列车突发事件延误时间预测[J].城市轨道交通研究,2022,25(10):65-70. 被引量：5
8尹超英,邵春福,黄兆国,王晓全,王晟由.基于梯度提升决策树的多尺度建成环境对小汽车拥有的影响[J].吉林大学学报（工学版）,2022,52(3):572-577. 被引量：11
9刘瑾,赵晶,冯瑛敏,周超,姜美君,章辉.基于梯度提升决策树的电力物联网用电负荷预测[J].智慧电力,2022,50(8):46-53. 被引量：28

二级参考文献47

1胡瑞,徐传玲,冯永泰,文超,王全泉.广深高速铁路列车分类型晚点预测[J].中国安全科学学报,2019,29(S02):181-186. 被引量：5
2李茹杨,彭慧民,李仁刚,赵坤.强化学习算法与应用综述[J].计算机系统应用,2020,29(12):13-25. 被引量：39
3覃光华,李祚泳.BP网络过拟合问题研究及应用[J].武汉大学学报（工学版）,2006,39(6):55-58. 被引量：24
4薛改凤,项茹,陈鹏,刘尚超.炼焦煤质量指标评价体系的研究[J].武汉科技大学学报,2009,32(1):36-40. 被引量：35
5刘春梅.基于BP神经网络的炼焦煤质量预测研究[J].煤炭技术,2012,31(4):247-249. 被引量：2
6阳春华,沈德耀,吴敏,刘健勤.焦炉配煤专家系统的定性定量综合设计方法[J].自动化学报,2000,26(2):226-232. 被引量：43
7田陆峰,李志凯,张丽.影响焦炭性质的因素分析及质量预测模型研究现状[J].煤质技术,2014,29(1):41-43. 被引量：4
8苟雪银,郭立新,张连波.支持向量机和神经网络在粗糙面参数反演中的比较[J].计算物理,2014,31(1):75-84. 被引量：7
9蔡立军,何庭钦,孟涛,陈磊.基于层次拓扑树的虚拟机节能分配算法[J].湖南大学学报（自然科学版）,2017,44(2):137-148. 被引量：1
10袁正波,陶文华,王志峰.高炉焦炭质量的GA-SVM模型预测[J].测控技术,2017,36(11):57-60. 被引量：4

共引文献64

1陈世炳,潘晶晶,王斌,林金山,罗雁.基于改进梯度提升决策树的10 kV及以下配电网线损率预测[J].系统仿真技术,2023,19(2):120-123. 被引量：1
2李冰箫,张世伟,黄飞虎.基于LSTM和自注意力机制的电力负荷预测[J].中国测试,2022,48(S02):38-43. 被引量：1
3李志军,韩伟,王光辉.基于DASCN的重介质浅槽分选灰分预测[J].煤炭工程,2021,53(S01):122-126.
4杨占伟,姜振学,梁志凯,吴伟,王军霞,宫厚健,李维邦,苏展飞,郝绵柱,无.基于2种机器学习方法的页岩TOC含量评价——以川南五峰组—龙马溪组为例[J].岩性油气藏,2022,34(1):130-138. 被引量：5
5刘佳.VMware虚拟化环境下数据保护面临的挑战与保护方法[J].科技创新与应用,2022,12(7):131-133.
6王建军,王赛,宋明洋,李维佳,马驰骋,卢霄娟,李冬怡.大数据背景下城市建成环境对出行行为影响研究综述[J].长安大学学报（自然科学版）,2022,42(1):61-78. 被引量：5
7邓桦,宋甫元,付玲,欧露,尹辉,高毅,秦拯.云计算环境下数据安全与隐私保护研究综述[J].湖南大学学报（自然科学版）,2022,49(4):1-10. 被引量：31
8舒晓苓,吴雪琴.云计算网络下虚拟机负载均衡方法仿真[J].计算机仿真,2022,39(3):358-361.
9唐秋生,许浩.建成环境非线性作用下汽车客运站最高聚集人数模型[J].重庆理工大学学报（自然科学）,2022,36(6):216-223. 被引量：1
10张志业,葛志强,赵小娟,林永江.基于梯度提升决策树的气体传感阵列识别方法[J].电子设计工程,2022,30(18):142-145.

同被引文献41

1杨鸿雁,田英杰.机器学习在食品安全风险预警及抽检方案制订中的应用研究[J].管理评论,2022,34(11):315-323. 被引量：2
2王淑庆.基于ASP逻辑的偏好多语境系统[J].湖北大学学报（哲学社会科学版）,2014,41(5):44-49. 被引量：1
3朱喆.回答集编程在RoboCup中型组的应用[J].信息通信,2014,27(10):104-105. 被引量：1
4Kejing He,Zhibo Li,Dongyan Deng,Yanhua Chen.Energy-Efficient Framework for Virtual Machine Consolidation in Cloud Data Centers[J].China Communications,2017,14(10):192-201. 被引量：1
5谢小天,赵岭忠.基于逻辑程序的调机路径规划研究[J].计算机工程,2018,44(1):98-103. 被引量：1
6李旭青,李龙,庄连英,刘玮琦,刘湘南,李杰.基于小波变换和BP神经网络的水稻冠层重金属含量反演[J].农业机械学报,2019,50(6):226-232. 被引量：20
7朱利莎.食品安全全程追溯制度探析[J].中国调味品,2019,44(7):191-194. 被引量：20
8谭晨.食品安全法相关制度对产品质量法修订的启示[J].中国市场监管研究,2019(7):10-13. 被引量：1
9徐珩僭,王以松,冯仁艳.一种用于Slater与Kemeny选举求解的ASP方法[J].计算机工程,2019,45(9):198-203. 被引量：3
10卢海峰,顾春华,罗飞,丁炜超,袁野,任强.强化学习下能耗优化的虚拟机放置策略[J].计算机科学,2019,46(9):291-297. 被引量：5

引证文献4

1王卫舵,王以松,杨磊.云资源调度的回答集程序描述性求解[J].广西师范大学学报（自然科学版）,2024,42(2):94-104.
2赵峙尧,刘明昊,白林,任润涵,尚伟,孙颖,翁云宣.基于机器学习对食品安全的调控与分析[J].食品工业科技,2024,45(11):11-19.
3李丹阳,吴良基,刘慧,姜静清.基于深度强化学习的数据中心热感知能耗优化方法[J].计算机科学,2024,51(S01):726-733.
4何强,胡晓楠,陈超,张凡.基于改进决策树算法的智慧热力站能耗异常诊断方法[J].今日制造与升级,2024(5):11-13.

1葛磊.新课标下小学音乐教学中的跨学科整合策略研究[J].世纪之星—高中版,2022(35):67-69.
2马宇驰,扈飞.主机威胁取证溯源的实践与思考[J].金融电子化,2023(3):76-77.
3秦文国.小学科学教学中信息技术的应用[J].甘肃教育,2023(10):92-95. 被引量：2
4赵雪阳,岳延奇,王海晨.基于多资源协同优化的虚拟机整合方法[J].计算机技术与发展,2023,33(4):46-52.
5潘礼规,尹佳琪,徐春光.无人机集群多构型融合相对定位性能分析[J].兵器装备工程学报,2023,44(3):80-88.
6贾诗威,闫慧.算法偏见概念、哲理基础与后果的系统回顾[J].中国图书馆学报,2022,48(6):57-76. 被引量：15
7刘阳.客户关系管理在电力营销中的有效应用[J].中文科技期刊数据库（全文版）社会科学,2023(6):24-27.
8李硕.信息技术与中学英语教学整合策略研究[J].海外英语,2023(7):190-192.
9王哲,陈亚春,刘万鹏,孙宇浩.眼睛区域构型信息与特征信息的跨维共变增益效应及其加工特异性[J].复印报刊资料（心理学）,2022(7):3-15.
10陈璐.5G通信广播融合系统关键技术研究及应用[J].中文科技期刊数据库（全文版）工程技术,2023(3):9-12.

计算机科学

2023年第6期

浏览历史

内容加载中请稍等...

基于决策树和由均匀分布改进Q学习的虚拟机整合算法被引量：4

参考文献9

二级参考文献47

共引文献64

同被引文献41

引证文献4

相关作者

相关机构

相关主题

浏览历史

基于决策树和由均匀分布改进Q学习的虚拟机整合算法 被引量：4

参考文献9

二级参考文献47

共引文献64

同被引文献41

引证文献4

相关作者

相关机构

相关主题

浏览历史

基于决策树和由均匀分布改进Q学习的虚拟机整合算法被引量：4