应用程序属性感知的Yarn资源调度模型研究

Research on application attribute aware Yarn resource scheduling model

下载PDF

导出

摘要 Hadoop应用程序存在计算密集属性和调度时间属性,但是Hadoop大数据平台集成的第二代资源管理器Yarn内置的三种资源调度器无法将相同属性的应用程序均衡分配到计算节点上,导致部分节点负载过高,出现严重的计算任务长尾效应。文中提出了一种应用程序属性感知的Yarn负载均衡调度模型——APB Scheduler。APB Scheduler自动感知应用程序属性,将相同属性应用程序的Container按照动态资源计划均衡分配到集群计算节点上,并使用NSGA-Ⅲ算法完成最优分配方案计算。实验结果表明,APB Scheduler解决了相同属性应用程序的Container分配倾斜问题,大幅提升了集群的性能和稳定性。 Hadoop applications have computation intensive and scheduling time attributes.However,the three built-in resource schedulers of the second generation resource manager,which is integrated in Hadoop big data platform,are unable to evenly distribute applications with the same attributes to the computing nodes,resulting in excessive load on some nodes and serious long tail effect of computing tasks.This paper presents an application attribute aware yarn load balancing scheduling model-APB Scheduler.APB Scheduler automatically perceive the application attributes,evenly allocate the containers of the same attribute application to the cluster computing nodes according to the dynamic resource plan,and use the NSGA-III algorithm to complete the calculation of the optimal allocation scheme.Through experimental verification,APB Scheduler solves the container allocation skew problem of applications with the same content,and greatly improves the performance and stability of the cluster.

作者陈宁宁 CHEN Ning-ning(Department of Technology,Xi’an International University,Xi’an 710077,China)

机构地区西安外事学院工学院

出处《信息技术》 2024年第4期36-43,共8页 Information Technology

基金陕西省自然科学基金资助项目(2020JM-637) 陕西省教育科学“十四五”规划项目(SGH21Y0303) 陕西省高等教育教学改革研究项目(21ZY015) 陕西省教育科学“十三五”规划研究项目(SGH20Y1420)。

关键词 NSGA-Ⅲ算法 YARN 资源调度 NSGA-III Yarn resource scheduling

分类号 TP312 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献8

1彭宏恩.基于Yarn的资源调度算法研究[J].福建电脑,2017,33(4):104-106. 被引量：1
2郝志峰,黄泽林,蔡瑞初,傅正佳,温雯,唐凯麟.基于YARN的分布式资源动态调度与协同分配系统[J].计算机工程,2021,47(2):226-232. 被引量：7
3潘佳艺,王芳,杨静怡,谭支鹏.异构Hadoop集群下的负载自适应反馈调度策略[J].计算机工程与科学,2017,39(3):413-423. 被引量：13
4郭先超,林宗缪,姚文勇.大数据环境下产品质量安全风险评估研究[J].信息技术,2016,40(6):76-79. 被引量：6
5廉华,刘瑜.基于YARN资源调度器的MapReduce作业数调节方法[J].计算机系统应用,2020,29(3):218-222. 被引量：4
6吴岳.基于Hadoop平台的云计算节能研究[J].计算机系统应用,2015,24(11):235-241. 被引量：4
7何翔,李仁发,唐卓.一种异构环境下的基于MapReduce任务调度改进机制[J].计算机应用研究,2013,30(11):3370-3373. 被引量：8
8冯亮.差异分布式存储系统资源调度的优化仿真[J].计算机仿真,2016,33(3):343-346. 被引量：4

二级参考文献53

1刘正伟,文中领,张海涛.云计算和云数据管理技术[J].计算机研究与发展,2012,49(S1):26-31. 被引量：170
2董新华,李瑞轩,周湾湾,王聪,薛正元,廖东杰.Hadoop系统性能优化与功能增强综述[J].计算机研究与发展,2013,50(S2):1-15. 被引量：70
3BRYANT R E. Data intensive supercomputing: the case for DISC, CMU technical report CMU-CS- 07-128 [ R]. Pittsburgh: Department of Computer Science, Carnegie Mellon University,2007.
4PAVLO A,PAULSON E,RASIN A,et al. A comparison of approaches to large-scale data analysis [ C ]//Proc of SIGMOD International Conference on Management of Data. New York :ACM Press ,2009:165-178.
5DEAN J,GHEMAWAT .S. MapReduce : simplified data processing on large clusters[ C ]//Proc of the 6th Conference on Operating Systems De- sign & Implementation. Berkeley: USENIX Association ,21304:137-150.
6Apache Hadoop [ EB/OL ]. [ 2009 - 03- 06 ]. http://hadoop, apache. otg/.
7RAO B T,SRIDEVEI N V,REDDY V K,et, al. Performance issues of heterogeneous Hadoop clusters in cloud computing[ J]. Global dour- nal Computer Science & Technology,2011,11 (8) :81-87.
8ZAHARIA M, KONWINSKI A, JOSEPH A D, et al. Improving MapReduce performance in heterogeneous environments[ C ]//Proc of the 8th USENIX Conference on Operating Systems Design and Imple- mentation. Berkeley : USENIX Association,2008:29-42.
9GUO Lei-tao, SUN Hong-wei, LUO Zhi-guo. A data distribution aware task scheduling strategy for MapReduce system [ C ]//Proc of the 1 st International Conference on Cloud Computing. 2009:694-699.
10POLO J, CARRERA D, BECERRA Y,et aL Performance-driven task co-scheduling for MapReduce environments [ C ]//Proc of the 12th IEEE/IFIP Network Operations and Management Symposium. Piseataway : IEEE Press ,2010:373- 380.

共引文献37

1沈学利,盛方严.异构资源环境下Hadoop节点能力自适应调度算法[J].计算机应用研究,2020,37(2):547-550. 被引量：4
2李静梅,张宝权,丁楠.Yarn架构下基于GA的Web日志挖掘技术[J].计算机应用研究,2014,31(11):3388-3391. 被引量：2
3徐辉,王宁章,雷琳琳.一种海量中文地址转化与切割的方法研究[J].计算机技术与发展,2015,25(11):6-10.
4刘立军.粗糙集和支持向量机相融合的Web数据挖掘[J].内蒙古师范大学学报（自然科学汉文版）,2015,44(5):643-646.
5李亚如,刘建华.大数据环境下MapReduce准入控制的设计与实现[J].计算机测量与控制,2016,24(2):114-117. 被引量：4
6吴佳,苏丹,李环媛,袁卫国.一种基于交互式的Hadoop作业调度算法[J].计算机技术与发展,2016,26(11):45-48. 被引量：1
7戴宇欣,袁梦.大数据环境下产品质量风险评估系统的研究与设计[J].标准科学,2016(12):79-83. 被引量：4
8郭士琪.云计算环境下数据存储安全的关键技术研究[J].无线互联科技,2017,14(8):142-143. 被引量：3
9刘玉芳.大规模关系图增量计算框架研究[J].自动化与仪器仪表,2017(7):33-35.
10倪亚晖.大数据分析在质监工作中的应用——基于大数据的产品质量风险信息监测与应用[J].电脑知识与技术,2018,14(11Z):254-255. 被引量：1

1徐小庆.预重整之独立司法程序属性探讨——以中美破产程序比较为视角[J].广西政法管理干部学院学报,2023,38(6):95-107.
2郑若颖.程序法视野下家庭教育令的生成逻辑与制度完善[J].少年儿童研究,2024(2):52-62.
3段泽昊,李毅,王海洋,孙扬.基于分布式驱动汽车的分层式控制系统设计[J].技术与市场,2024,31(4):17-22.
4詹灵筠,刘畅.移动互联网国际传播策略——基于“洋网红”的分析[J].新闻前哨,2024(5):40-41.
5杨苏齐,罗建桥,宋瑞雪.基于人工智能的传统文化外宣平台设计[J].电脑知识与技术,2024,20(9):50-52.
6寇晨欢,冷志杰.水—能源—粮食耦合协调性测度及影响机理研究——基于对黑龙江省数据的分析[J].价格理论与实践,2023(6):66-71. 被引量：1
7杨伟.关于财产保险公司加强全面预算管理的探究[J].现代经济信息,2023(17):137-139.
8贺兰迪,纪德赞,董兴辰,苏明鑫,周卫东.使用动态数据增强和对比学习进行虹膜验证[J].Journal of Measurement Science and Instrumentation,2024,15(1):54-63.
9周莉.企业会计管理在提升企业经济效益中的重要性分析[J].中文科技期刊数据库（全文版）经济管理,2024(4):0150-0153.
10常玲玲,陆信礼.中国式现代化理论的三种资源及其地位关系[J].马克思主义文化研究,2023(2):80-89.

信息技术

2024年第4期

浏览历史

内容加载中请稍等...

应用程序属性感知的Yarn资源调度模型研究

参考文献8

二级参考文献53

共引文献37

相关作者

相关机构

相关主题

浏览历史