众核处理器系统核资源动态分组的自适应调度算法被引量：14

Adaptive Scheduling Algorithm Based on Dynamic Core-Resource Partitions for Many-Core Processor Systems

下载PDF

导出

摘要针对众核处理器系统的核资源优化使用问题,提出了一种支持核资源动态分组的自适应调度算法CASM(core-partitioned adaptive scheduling for many-core systems).该算法通过对任务簇的拆分与合并,动态构建可弹性分区的核逻辑组,实现核资源的隔离优化访问.为了平衡核资源利用率及任务调度效率,CASM算法针对任务簇间和簇内的不同特点,分别采用公平性较好的均衡调度算法和资源利用率较高的自适应调度算法.在线竞争理论分析表明,CASM算法的任务执行时间在线竞争比为常数2,其性能可扩展性较好.实验结果表明,与WS(work-stealing),AGDEQ(adaptive greedy dynamic equi-partitioning)和EQUI?EQUI算法相比,CASM算法使任务集运行时间分别减少了近46%,32%和15%.在相同能耗情况下,CASM算法大幅度地提升了系统吞吐量. With the aim to address the increasing difficulty of efficiently using large number of cores in many-core processors, a core-partitioned adaptive scheduling algorithm, named CASM （core-partitioned adaptive scheduling for many-core systems）, is proposed. CASM dynamically aggregates cores into different partitions by splitting or merging task-clusters, which ensures the efficiency of isolated accessing in these core partitions. To improve the scheduling efficiency of CASM, equi-partitioning scheduling algorithm is adopted to reallocate the cores among task-clusters, and the feedback-driven adaptive scheduling algorithm is implemented within the task-clusters. Online competitive analysis shows that CASM achieves 2-competitiveness ratio with respect to the execution time of parallel jobs, which indicates that CASM has better performance and scalability. The experimental results demonstrate that compared with WS （work-stealing）, AGDEQ （adaptive greedy dynamic equi-partitioning） and EQUIoEQUI, CASM reduces the execution time of the same workload by nearly 46%, 32% and 15% respectively. Under the same power consumption, CASM greatly enhances the system throughput.

作者曹仰杰钱德沛伍卫国董小社

机构地区西安交通大学电子与信息工程学院北京航空航天大学计算机学院

出处《软件学报》 EI CSCD 北大核心 2012年第2期240-252,共13页 Journal of Software

基金国家自然科学基金(61073011 61133004 61173039) 国家高技术研究发展计划(863)(2008AA01A202 2009AA01A131) 中意国际合作项目(2009DFA12110)

关键词众核处理器分组调度自适应调度竞争分析高效能计算 many-core processor cluster-based scheduling adaptive scheduling competitive analysis powerefficient computing

分类号 TP316 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献1

1龙国平,张军超,范东睿.众核体系结构对Cilk语言的硬件支持及评测研究[J].计算机学报,2008,31(11):1975-1985. 被引量：7

二级参考文献29

1Wentzlaff D, Griffin P, Hoffmann H, Bao L, Edwards B, Ramey C, Mattina M, Miao C C, Brown J F, Agarwal A. On-chip interconnection architecture of the Tile processor. IEEE Micro, 2007, 27(5): 15-31
2Tan G, Fan D, Zhang J, Russo A, Gao G R. Experience on optimizing irregular computation for memory hierarchy in manycore architecture//Proceedings of the ACM SIGPLAN Symposium on Principles and Practice of Parallel Programming. Salt Lake City, Utah, USA, 2008: 279-280
3Long G P, Fan D R, Zhang J C, Song F L, Yuan N, Lin W. A performance model of dense matrix operations on manycore architectures//Proceedings of the European Conference on Parallel and Distributed Computing. 2008:120-129
4Lamport L. How to make a multiprocessor computer that correctly executes multiprocess programs. IEEE Transactions on Computers, 1979, 28(9): 690-691
5Adve S V, Gharachorloo K. Shared memory consistency models: A tutorial. IEEE Computer, 1996, 29(12): 66-76
6Lenoski D, Laudon J, Gharachorloo K, Gupta A, Hennessy J L. The directory-based cache coherence protocol for the DASH multiprocessor//Proceedings of the International Symposium on Computer Architecture. Seattle, WA, USA, 1990: 148-159
7Iftode L, Singh J P, Li K. Scope consistency: A bridge between release consistency and entry consistency. Theory Computing Systems, 1998, 31(4): 451-473
8胡伟武.共享存储体系结构.北京:高等教育出版社,2001
9Frigo M, Leiserson C E, Randall K H. The implementation of the Cilk-5 mnltithreaded language//Proceedings of the International Symposium on Programming Languages Design and Implementation. Montreal, Canada, 1998:212-223
10Blumofe R D, Leiserson C E. Scheduling multithreaded computations by work stealing//Proceedings of the Annual IEEE Symposium on Foundations of Computer Science. Santa Fe, New Mexico, 1994: 256-368

共引文献6

1余磊,刘志勇,马宜科,宋风龙,徐卫志,叶笑春.众核结构上分块LU分解算法的研究[J].高技术通讯,2011,21(3):248-253.
2曹仰杰,杨海兵,钱德沛,伍卫国.多核编程模型运行时环境的自适应性研究[J].西安交通大学学报,2011,45(6):130-134. 被引量：3
3余磊,刘志勇,宋风龙,叶笑春.LU分解在众核结构仿真器上的指令级调度研究[J].系统仿真学报,2011,23(12):2603-2610. 被引量：5
4王蕾,崔慧敏,陈莉,冯晓兵.任务并行编程模型研究与进展[J].软件学报,2013,24(1):77-90. 被引量：29
5罗章琪,黄昆,张大方,关洪涛,谢高岗.面向数据包处理的众核处理器核资源分配方法[J].计算机研究与发展,2014,51(6):1159-1166. 被引量：2
6李旺,潘谜,王巍.基于Cilk的不确定机械手主控LM算法并行化研究[J].集美大学学报（自然科学版）,2017,22(3):55-59.

同被引文献85

1钟诚,李显宁.异构机群系统上带返回信息的可分负载多轮调度算法[J].计算机研究与发展,2008,45(z1):99-104. 被引量：4
2刘洋,陈英武,谭跃进.卫星地面站系统任务调度的动态规划方法[J].中国空间科学技术,2005,25(1):44-47. 被引量：23
3黄海林,范东睿,许彤,唐志敏.嵌入式处理器中访存部件的低功耗设计研究[J].计算机学报,2006,29(5):815-821. 被引量：11
4王小非,方明.一种基于调度簇树的周期性分布实时任务调度算法[J].计算机科学,2007,34(3):256-261. 被引量：3
5NVIDIA. NVIDIA's Next Generation CUDA Compute Architecture: Fermi [Z]. 2009.
6NVIDIA. NVIDIA's Next Generation CUDA Compute Architecture: Kepler GK110 [Z]. 2012.
7许牧.可重构众核流处理器体系结构关键技术研究[D].合肥:中国科学技术大学,2012.
8邓志权.基于GPGPU的实时高质量光线投射算法研究[D].广州:华南理工大学,2012.
9FARBERR0b.高性能CUDA应用设计与开发:方法与最佳实践[M].玉龙,唐垄,译.北京:机械工业出版社,2013.
10NVIDIA Corparation. NVIDIA's next generation CUDA com- pute architecture: fermi [R]. San Jose: NVIDIA Corparation, 2009.

引证文献14

1宋立国,胡承秀,王亮.众核处理器研究技术综述和分析[J].计算机科学,2022,49(S02):900-906.
2李叶繁,张凯龙,周兴社.基于众核处理器的多计算模式构造技术研究[J].计算机测量与控制,2012,20(11):3098-3100. 被引量：1
3王蕾,崔慧敏,陈莉,冯晓兵.任务并行编程模型研究与进展[J].软件学报,2013,24(1):77-90. 被引量：29
4王可锋,吴晓,罗眉.众核多计算模式系统的构建[J].现代电子技术,2013,36(22):1-4.
5李静梅,王雪,吴艳霞.一种改进的优先级列表任务调度算法[J].计算机科学,2014,41(5):20-23. 被引量：24
6罗章琪,黄昆,张大方,关洪涛,谢高岗.面向数据包处理的众核处理器核资源分配方法[J].计算机研究与发展,2014,51(6):1159-1166. 被引量：2
7钟诚,蔡德霞,杨锋.多核机群主节点并发发送数据的可分负载调度[J].计算机研究与发展,2014,51(6):1281-1294.
8王寅峰,王龙翔.一种基于V^3模型的内存数据库性能分析研究[J].计算机技术与发展,2015,25(6):77-83. 被引量：2
9郭荣佐,郭进,黎明.绿色计算与绿色嵌入式系统[J].计算机科学,2015,42(8):13-21. 被引量：2
10罗眉,周兴社,张凯龙,胡英英.众核多态实时计算模型设计及应用[J].西北工业大学学报,2016,34(2):338-342.

二级引证文献61

1王亚茹,王鹏,王德志.基于MPI的多核并行模式的性能测试与分析[J].成都信息工程大学学报,2018,33(6):617-623. 被引量：4
2熊焕亮,曾国荪,吴沧海.一种等性能面积的并行计算可扩展性度量方法[J].计算机研究与发展,2014,51(11):2547-2558. 被引量：1
3吴建宇,彭蔓蔓.面向多线程应用的片上多核处理器私有LLC优化[J].计算机工程,2015,41(1):316-321.
4骆勇.基于RFID概率泛函的人体运动受力行为分解[J].科技通报,2015,31(2):116-118.
5巨涛,朱正东,董小社.异构众核系统及其编程模型与性能优化技术研究综述[J].电子学报,2015,43(1):111-119. 被引量：13
6李慧玲,连玮.基于融合特征空间的云数据离散调度逼近算法[J].科技通报,2015,31(4):70-72.
7尚建贞,张咪.基于污点数据聚类的攻击调频信号虚警预估计[J].科技通报,2015,31(4):118-120.
8张薇薇,张鑫.光照并行算法的研究与实现[J].西安工程大学学报,2015,29(2):181-186. 被引量：1
9王翠娥.基于分簇能耗聚集的云计算多目标任务调度算法[J].石家庄学院学报,2015,17(3):49-54.
10徐红梅.大功率干扰下LVS负载均衡集群抗扰动算法[J].科技通报,2015,31(6):187-189. 被引量：1

1李清.大规模高效能计算之体系软件主要技术研讨[J].电脑知识与技术,2015,11(2X):228-229.
2张晓,新和(图).中国“天河二号”成为全球最快超级计算机[J].青少年科苑,2013(10).
3我国成功研制世界首台高效能计算机[J].中国科技财富,2013(9):4-4.
4刘卫威.Internet/Intranet市场的竞争分析[J].今日电子,1997(10):122-123.
5姚余梁.B2C商业模型与竞争分析[J].中国电子商务,2002(2):78-79.
6陈小军,张璟.面向高效能计算的虚拟化技术研究综述[J].系统仿真学报,2012,24(4):741-747. 被引量：8
7罗章琪,黄昆,张大方,关洪涛,谢高岗.面向数据包处理的众核处理器核资源分配方法[J].计算机研究与发展,2014,51(6):1159-1166. 被引量：2
8张潮.中国移动Widget应用现状及竞争分析[J].移动通信,2009(11):75-78. 被引量：2
9胡雨亭.Word表格之拆分与合并轻松应对[J].电子乐园,2010(10):27-28.
10李玉林.Word表格之拆分与合并轻松应对[J].电脑入门,2011(12):73-73.

软件学报

2012年第2期

浏览历史

内容加载中请稍等...

众核处理器系统核资源动态分组的自适应调度算法被引量：14

参考文献1

二级参考文献29

共引文献6

同被引文献85

引证文献14

二级引证文献61

相关作者

相关机构

相关主题

浏览历史

众核处理器系统核资源动态分组的自适应调度算法 被引量：14

参考文献1

二级参考文献29

共引文献6

同被引文献85

引证文献14

二级引证文献61

相关作者

相关机构

相关主题

浏览历史

众核处理器系统核资源动态分组的自适应调度算法被引量：14