减少Hadoop集群中网络队头阻塞的调度算法被引量：2

Reducing Head-of-Line Blocking on Network in Hadoop Clusters

下载PDF

导出

摘要大数据分析系统的用户希望任务的执行时间尽可能短。然而,在任务执行期间,网络与计算时刻都可能成为阻碍任务执行的资源瓶颈。通过对大数据分析系统的观察与分析,得出如下结论:1)根据当前资源瓶颈的不同,数据并行框架应当在多种工作模式之间切换;2)子任务的调度应当充分考虑将来可能到达的新任务,而不能仅考虑当前已经提交的任务。基于上述观察,设计并实现了全新的任务调度系统Duopoly,其由感知计算资源的网络调度器cans与感知网络资源的子任务调度器nats两部分组成。通过小规模物理集群与大规模仿真实验对Duopoly的效果进行评估,实验结果表明,与现有工作相比,Duopoly可以将平均任务完成时间缩短37.30%~76.16%。 Users of big data analytics systems want the execution time of tasks to be as short as possible.However,during task execution,both network and computational moments may become resource bottlenecks that hinder task execution.Through the observation and analysis of the big data analysis system,the following conclusions are drawn:1)the data-parallel framework should switch between multiple working modes depending on the current resource bottlenecks;2)the scheduling of subtasks should fully consider the new tasks that may arrive in the future,not only the currently submitted tasks.Based on the above observations,a new task scheduling system Duopoly is designed and implemented,which consists of two parts:cans,a network scheduler that senses computational resources,and nats,a sub-task scheduler that senses network resources.The effectiveness of Duopoly is evaluated by small-scale physical clusters and large-scale simulation experiments,and the experimental results show that Duopoly can reduce the average task completion time by 37.30%~76.16%compared with existing work.

作者田冰川田臣周宇航陈贵海窦万春 TIAN Bing-chuan;TIAN Chen;ZHOU Yu-hang;CHEN Gui-hai;DOU Wan-chun(Department of Computer Science and Technology,Nanjing University,Nanjing 210023,China)

机构地区南京大学计算机科学与技术系

出处《计算机科学》 CSCD 北大核心 2022年第3期11-22,共12页 Computer Science

基金广东省重点研发计划(2020B0101390001) 国家自然科学基金(61772265,61802172,62072228)。

关键词 HADOOP集群队头阻塞网络调度任务调度 Hadoop cluster Head-of-line blocking Network scheduling Job scheduling

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献30

1吕欢欢,牛源艺,张漫,李寒.日光温室光照强度与空气温湿度变化趋势分析[J].农业机械学报,2021,52(S01):410-417. 被引量：4
2蔡春晓,李燕龙,陈晓.基于Hadoop的Java调用Matlab混合编程的车牌识别[J].桂林理工大学学报,2016,36(2):383-387. 被引量：2
3高祝宇,何妤斐,曾悠,陈晔峰,杨明,韩颂雨,王亚云.基于Spring的气象数据服务系统设计与实现[J].软件导刊,2020,19(9):110-114. 被引量：4
4廖德驹,沈韩,冯饶慧,崔新图,黄臻成,方奕忠.基于NI-myDAQ数据采集器的混沌电路实验系统[J].大学物理,2021,40(1):24-26. 被引量：5
5叶进,谢紫琪,肖庆宇,宋玲,李晓欢.数据中心网络中基于ELM的流簇大小推理机制[J].计算机科学与探索,2021,15(2):261-269. 被引量：1
6林霄,姬硕,岳胜男,孙卫强,胡卫生.面向跨数据中心网络的节点约束存储转发调度方法[J].计算机研究与发展,2021,58(2):319-337. 被引量：12
7廖伟志,张文强,吕清泉,王明松,王玮,周睿,周庆国.基于4G的高分辨率气象监测系统研究与设计[J].合肥工业大学学报（自然科学版）,2021,44(1):42-46. 被引量：11
8刘君,程凯,赵培刚,徐爽,马超.基于STM32微控制器和CH438Q数据采集器的设计与实现[J].仪表技术与传感器,2021(1):30-32. 被引量：8
9牛昊东,施云波,王天,时启衡.超声波相位比较法的风速风向传感器设计[J].哈尔滨理工大学学报,2021,26(1):122-129. 被引量：10
10殷娴,胡颖,尹丽云.低纬高原地区短时强降水与雷电活动相关性研究[J].热带气象学报,2021,37(1):25-33. 被引量：8

引证文献2

1陶淘,彭颖,张晨亮.基于Hadoop技术的气象数据实时传输监控系统设计[J].计算机测量与控制,2024,32(1):114-120.
2由春辉.基于策略梯度算法的工业数据中心通信调度性能评估[J].现代工业经济和信息化,2024,14(9):122-123.

1李学兵,陈阳,周孟莹,王新.互联网数据传输协议QUIC研究综述[J].计算机研究与发展,2020,57(9):1864-1876. 被引量：13
2汤晓栋.基于区域充电网络调度的虚拟储能系统及优化控制方法[J].现代建筑电气,2022,13(2):1-4. 被引量：1
3华新.对多动症儿童行为的观察与分析[J].国家通用语言文字教学与研究,2021(11):137-137.
4黄晓霞.“三加减”让作业走“心”更走“新”--“双减”背景下小学英语作业设计探究[J].新教师,2022(1):35-36. 被引量：6
5Yihe Zhang,Li Zhang,Guotao Yang,Yalin Yao,Xu Wei,Tianchi Pan,Juntao Wu,Moufeng Tian,Penggang Yin.Recent advances in recyclable thermosets and thermoset composites based on covalent adaptable networks[J].Journal of Materials Science & Technology,2021(33):75-87. 被引量：3
6付忠义.高中生物学观察与分析能力的培养策略[J].教学考试,2022(20):60-63.
7付忠义.高中生物学观察与分析能力的培养策略[J].教学考试,2022(16):65-67.
8张清.立体几何折叠问题的解题策略探析[J].中学生数理化（高二数学、高考数学）,2022(3):14-17. 被引量：1
9牛苗苗.新疆区域次枢纽机场发展研究[J].空运商务,2022(1):28-32. 被引量：2
10蒋晨,张韵,江海涛,米振莉,王彬,刘立辉,李磊.SPHC热轧带钢表面氧化铁皮缺陷观察与分析[J].天津冶金,2022(1):58-62. 被引量：5

计算机科学

2022年第3期

浏览历史

内容加载中请稍等...

减少Hadoop集群中网络队头阻塞的调度算法被引量：2

同被引文献30

引证文献2

相关作者

相关机构

相关主题

浏览历史

减少Hadoop集群中网络队头阻塞的调度算法 被引量：2

同被引文献30

引证文献2

相关作者

相关机构

相关主题

浏览历史

减少Hadoop集群中网络队头阻塞的调度算法被引量：2