一种基于Spark在线Web服务的高效低延迟调度资源算法被引量：2

A high efficient and low-latency resource scheduling method for Spark on Web service

下载PDF

导出

摘要 Spark作为流行的分布式数据处理框架,其资源的调度方式和资源的利用率直接关系到集群计算处理的效率和速度。针对Spark资源调度问题,在Spark自身考虑的资源因素内存和空余核数下,提出新的调度算法。算法通过实时监视工作节点资源利用情况,增加对节点CPU处理速度和CPU剩余利用率的考虑,重新调度与分配资源,为Spark作为Web服务高并发请求、低延迟响应提供优化,还可以减少传统方式没有考虑的资源因素导致出现的资源利用倾斜现象,提高资源的利用率。实验表明,改进的资源调度算法有较好的效果。 The processing speed of Spark which is a big data processing structure is highly influenced by resource scheduling modes and whether we can utilize the resource sufficiently. Taking memories and the number of free cores into consideration, we propose a new scalable resource scheduling method. In this method, we monitor the resource utilization of nodes in real time and examine CPU processing speed and CPU residual utilization. This method can be used to optimize Spark Web service so as to meet the requirements of high concurrent request and low latency response and efficiently reduce the imbalance of resource utilization, thus improving resource utilization. Experimental results show that our method can obtain better results.

作者丁晶晶张功萱

机构地区南京理工大学计算机科学与工程学院

出处《计算机工程与科学》 CSCD 北大核心 2016年第8期1550-1556,共7页 Computer Engineering & Science

基金国家自然科学基金(61272420)

关键词 SPARK WEB服务资源监视资源调度 Spark Web service resource monitoring resource scheduling

分类号 TP312 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献13

1Shi Heng-liang.Task scheduling of cloud computing[D].Nanjing:Nanjing University of Science and Technology,2012.(in Chinese).
2Wieczorek M, Hoheisel A, Prodan R. Towards a general model of the multi-criteria workflow scheduling on the grid[J].Future Generation Computer Systems,2009,25(3):237-256.
3Ma Dan. Inter task dependency based parallel job scheduling algorithm[D].Wuhan:Huazhong University of Science and Technology,2007.(in Chinese).
4Liang Qing-zhong. Multi-objective task scheduling algorithm based on hybrid cloud platform[D].Wuhan:China University of Geosciences,2015.(in Chinese).
5Chen H,Wang F Z. Spark on entropy: A reliable & efficient scheduler for low-latency parallel jobs in heterogeneous cloud[C]∥Proc of IEEE International Workshop on Cloud-based Networks and Applications(CloudNA 2015), 2015:708-713.
6Tang S,Lee B S,He B. Fair resource allocation for data-intensive computing in the cloud[J].IEEE Transactions on Services Computing,2016,99(1):1-1.
7Chen H, Wang F, Na H. A cost-efficient and reliable resource allocation model based on cellular automaton entropy for cloud project scheduling[J].International Journal of Advanced Computer Science & Applications,2013,4(4):7-14.
8Feng Lin. Implementation of memory optimization in cluster computing engine Spark[D].Beijing:Tsinghua University,2013.(in Chinese).
9Marcel K,Erickson J. Cloudera impala: Real time queries in apache hadoop,for real[EB/OL].[2012-11-13].http://blog.cloudera.com/blog/2012/10/cloudera-impala-real-time-queries-in-apachehadoop-for-real.
10Topcuoglu H,Hariri S,Wu M Y. Performance-effective and low-complexity task scheduling for heterogeneous computing[J].IEEE Transactions on Parallel & Distributed Systems,2002,13(3):260-274.

同被引文献13

1尹芳,冯敏,诸云强,刘睿.基于开源Hadoop的矢量空间数据分布式处理研究[J].计算机工程与应用,2013,49(16):25-29. 被引量：15
2雷德龙,郭殿升,陈崇成,巫建伟,吴小竹.基于MongoDB的矢量空间数据云存储与处理系统[J].地球信息科学学报,2014,16(4):507-516. 被引量：42
3梁海.MongoDB数据库中Sharding技术应用研究[J].计算机技术与发展,2014,24(7):60-62. 被引量：17
4温馨,罗侃,陈荣国.基于Shark/Spark的分布式空间数据分析框架[J].地球信息科学学报,2015,17(4):401-407. 被引量：22
5杨志伟,郑烇,王嵩,杨坚,周乐乐.异构Spark集群下自适应任务调度策略[J].计算机工程,2016,42(1):31-35. 被引量：19
6方金云,刘羽,姚晓,陈翠婷,张梦菲,肖茁建,张广发.基于Spark的空间数据实时访存技术的研究[J].地理信息世界,2015,22(6):24-31. 被引量：7
7曾强,缪力,秦拯.面向大数据处理的Hadoop与MongoDB整合技术研究[J].计算机应用与软件,2016,33(2):21-24. 被引量：14
8靳凤营,张丰,杜震洪,刘仁义,李荣亚.基于Spark的土地利用矢量数据空间叠加分析方法[J].浙江大学学报（理学版）,2016,43(1):40-44. 被引量：10
9詹剑锋,高婉铃,王磊,李经伟,魏凯,罗纯杰,韩锐,田昕晖,姜春宇.BigDataBench:开源的大数据系统评测基准[J].计算机学报,2016,39(1):196-211. 被引量：34
10廖湖声,黄珊珊,徐俊刚,刘仁峰.Spark性能优化技术研究综述[J].计算机科学,2018,45(7):7-15. 被引量：23

引证文献2

1周尧,刘超,徐树楠,曹振宇,耿丽丽,刘建川,廖一铧.基于Spark与MongoDB的地理空间大数据应用分析系统设计与实现[J].测绘与空间地理信息,2018,41(9):71-74. 被引量：3
2胡亚红,吴寅超,朱正东,李小轩.异构集群节点与作业特性感知资源分配算法[J].计算机工程与应用,2022,58(18):327-334.

二级引证文献3

1严哲,周斌雄,张祥燊,吴君雄.Spark计算框架在敏感地理信息检测中的应用研究[J].江西测绘,2021(1):46-49.
2韩萍,王浩,方澄,牛勇钢,贾云飞.基于WiFi数据的实时高效定位分析系统设计[J].现代电子技术,2020,43(4):43-47. 被引量：3
3徐丹滢,赵青,权文利,宋红壮.基于MongoDB的海量天文星表数据的快速时序重构研究[J].天文学进展,2022,40(2):298-314. 被引量：1

1张永德,宫志强.用.NET开发基于资源监视的入侵监测系统[J].计算机与现代化,2004(10):108-110.
2费菲,熊齐邦.在网格环境中基于移动代理的资源监视[J].计算机工程,2003,29(22):3-5. 被引量：1
3马胜甫,马国富,田俊峰,孟雅辉.基于Web的入侵检测资源监视系统的设计与实现[J].计算机工程与应用,2005,41(32):156-159.
4葛以踊,郭海龙.调度自动化系统资源统一监视功能研究与实现[J].江苏科技信息,2013(23):71-72.
5刘文才,黄薇.浅析算法优化[J].电子制作,2014,22(9X):152-153.
6徐肖,胡吉明.一种Hadoop中基于改进遗传算法的作业调度算法[J].计算机技术与发展,2013,23(3):10-13. 被引量：4
7朱树人,李伟琴.基于WEB资源监视的入侵检测系统设计与实现[J].计算机工程与应用,2003,39(7):32-35. 被引量：2
8夏春和,张欣.网络入侵检测系统RIDS的研究[J].系统仿真学报,2000,12(4):375-379. 被引量：7
9穆鹏.使用AIX资源监视与调优工具对系统进行优化[J].铁路计算机应用,2004,13(z1):10-12.
10杨华杰,张尧学,周悦芝,郭关飞.一种基于透明计算的动态负载平衡算法[J].计算机工程,2006,32(13):133-135. 被引量：2

计算机工程与科学

2016年第8期

浏览历史

内容加载中请稍等...

一种基于Spark在线Web服务的高效低延迟调度资源算法被引量：2

参考文献13

同被引文献13

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

一种基于Spark在线Web服务的高效低延迟调度资源算法 被引量：2

参考文献13

同被引文献13

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

一种基于Spark在线Web服务的高效低延迟调度资源算法被引量：2