面向多核集群的数据流程序层次流水线并行优化方法被引量：8

Multi-Level Pipelining Parallelism for Dataflow Programs on Multi-Core Cluster

下载PDF

导出

摘要数据流编程语言是一种面向领域的编程语言,它能够将计算与通信分离,暴露应用程序的并行性.多核集群中计算、存储和通信等底层资源的复杂性对数据流程序的性能提出了新的挑战.针对数据流程序在多核集群上执行存在资源利用低和扩展性差等问题,利用同步数据流图作为中间表示,文中提出并实现了面向多核集群的层次性流水线并行优化方法.方法包含任务划分与调度、层次流水线调度和数据局部性优化,经过编译优化后生成基于MPI的可并行执行的目标代码.其中任务划分与调度是利用程序中数据和任务并行性将任务映射到计算核上,实现负载均衡和低通信同步开销;层次性流水线调度是利用程序中的并行性构造低延迟流水线调度;数据局部性优化是针对数据访问存在的Cache伪共享做面向存储的优化.实验以X86架构多核处理器组成的集群为平台,选取媒体处理领域的典型应用算法作为测试程序,对层次流水线优化进行实验分析.实验结果表明了优化方法的有效性. As a domain specific programming model,data flow programming combines the features of media applications and programming languages and offers an attractive way to express the parallelism.However,the complexity of underlying computation,storage and communication in the cluster systems puts forward new challenge to the performance of data flow application.For the problems of current data flow programming,the compiler translates the code to the data flow graph as a middle representation.The paper proposed an efficient data flow compilation framework,namely multi-level pipelining parallelism optimization framework,for cluster architecture to optimize the execution of data flow applications.The framework is composed of three optimization phases：（1）task partitioning and scheduling,which maps a data flow graph to agiven cluster for loading balance and low communication cost,（2）multi-level pipelining scheduling,which constructs a low communication and synchronization cost pipeline scheduling for data flow programs,and（3）data locality aware optimization,which judiciously repeats actor executions to eliminate false sharing and improve locality.We choose multi-core cluster as the experimentplatform and the common algorithms in media processing applications as benchmarks and evaluated the performance of multi-level pipelining parallelism.Our experiments show that its scalability and performance are good.

作者于俊清张维维陈文斌涂浩何云峰

机构地区华中科技大学计算机科学与技术学院华中科技大学网络与计算中心

出处《计算机学报》 EI CSCD 北大核心 2014年第10期2071-2083,共13页 Chinese Journal of Computers

基金国家"八六三"高技术研究发展计划重点项目基金(2012AA010902) 高等学校博士学科点专项科研基金(20120142110089)资助

关键词多核集群数据流编程编译流水线 COStream multi-core cluster data flow programs compilation pipeline COStream

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献22

1Taylor M,Kim J,Miller J,et al.The raw microprocessor:A computational fabric for software circuits and general purpose programs.IEEE Micro,2002,22(2):25-35.
2Tan G,Fan D,Zhang J,et al.Experience on optimizing irregular computation for memory hierarchy in manycore architecture//Proceedings of the 13th ACM SIGPLAN Symposium on Principles and Practice of Parallel Program ming.New York,USA,2008:279-280.
3Khailany B,Dally W,Kapasi U,et al.Imagine:Media processing with streams.IEEE Micro,2001,21(2):35-46.
4Dally W,Labonte F,Das A,et al.Merrimac:Supercomputing with streams//Proceedings of the 2003 ACM/IEEE Conference on Supercomputing.New York,USA,2003:35-42.
5Hofstee H.Power efficient processor design and the cell processor//Proceedings of the 11th International Symposium on High-Performance Computer Architecture.San Francisco,USA,2005:258-262.
6Thies W,Karczmarek M,Amarasinghe S.StreamIt:A language for streaming applications//Proceedings of the 11th Compiler Construct.London,UK,2002:179-196.
7Mark W,Glanville R,Akeley K,et al.Cg:A system for programming graphics hardware in a C-like language.ACM Transactions on Graphics,2003,22(3):896-907.
8张维维,魏海涛,于俊清,李鹤,黎昊,杨秋吉.COStream:一种面向数据流的编程语言和编译器实现[J].计算机学报,2013,36(10):1993-2006. 被引量：10
9Gordon M,Thies W,Amarasinghe S.Exploiting coarse grained task,data,and pipeline parallelism in stream programs//Proceedings of the 14th International Conference on Architectural Support for Programming Languages and Operating Systems.New York,USA,2006:151-162.
10Berger S,Stamatakis A.Assessment of barrier implementa tions for fine grain parallel regions on current multi-core architectures//Proceedings of the 2010 IEEE International Conference on Cluster Computing.Heraklion,Crete,2010:1-8.

二级参考文献24

1Gordon M I, Thies W, Karczmarek M, et al. A stream com- piler for communication-exposed architectures//Proceedings of the 10th International Conference of Architectural Support for Programming Languages and Operating Systems. New York, NY, USA, 2002: 291-303.
2Wei Hai-Tao, Qin Ming-Kang, Zhang Wei Wei, et al. Stre amTMC Stream compilation for tiled multi core arehitec tures. Journal of Parallel and Distributed Computing, 2013 73(4) :484-494.
3Dally W, Labonte F, Das A, et al. Merrimac: Supercomput ing with Streams//Proceedings of the ACM/IEEE Confer ence on Supercomputing. New York, NY, USA, 2003 35-42.
4Hofstee H. Power efficient processor architecture and the Cell processor//Proceedings of the 11th International Symposium on High-Performance Computer Architecture. Washington, DC, USA, 2005: 258-262.
5Thies W, Karczmarek M, Amarasinghe S. StreamIt: A language for streaming applications//Proceedings of the llth International Conference on Compiler Construction. London, UK, 2002:179-196.
6Buck I, Foley T, Horn D, et al. Brook for GPUs: Stream computing on graphics hardware. ACM Transactions on Graphics, 2004, 23(3): 777 -786.
7Mark W, Steven R, Kurt G, et al. Cg: A system for programming graphics hardware in a C-like language. ACM Transactions on Graphics, 2003, 22(3): 893-907.
8Wei Hai-Tao, Yu Jun-Qing, Yu Hua-Fei, et al. Minimizing communication in rate optimal software pipelining for stream programs//Proceedings of the 8th Annual IEEE/ACM Inter national Symposium on Code Generation and Optimization. New York, NY, USA, 2010 : 210-217.
9Mernik M, Heering J, Sloane A. When and how to develop domain-specific languages. ACM Computing Surveys, 2005, 37(4) : 316-344.
10ETI. SWARM: Scalable performance optimization for multi core/multi-node. White paper, 2011.

共引文献9

1刘磊,李振国,高艳华,丁岩,申春,刘雷.特定领域语言MISPC及其编译框架实现技术[J].吉林大学学报（理学版）,2016,54(4):805-812. 被引量：3
2杨秋吉,于俊清,莫斌生,何云峰.面向Storm的数据流编程模型与编译优化方法研究[J].计算机工程与科学,2016,38(12):2409-2418. 被引量：3
3陈文斌,杨瑞瑞,于俊清.基于GPU/CPU混合架构的流程序多粒度划分与调度方法研究[J].计算机工程与科学,2017,39(1):15-26. 被引量：4
4杨胜哲,于俊清,唐九飞.数据流程序动态调度与优化[J].计算机工程与科学,2017,39(7):1201-1210. 被引量：3
5彭城,魏乐.直觉思维在编译器开发中的应用[J].成都信息工程学院学报,2014,29(S1):45-47.
6邹骁锋,阳王东,容学成,李肯立,李克勤.面向大数据处理的数据流编程模型和工具综述[J].大数据,2020,6(3):57-72. 被引量：2
7彭军.跨函数全局数据流分析算法在Java编程中的应用研究[J].中国宽带,2020(5):96-96.
8王中华,柴小丽.基于Storm平台的多任务分组调度策略与实现[J].计算机系统应用,2021,30(2):250-254. 被引量：1
9范志华,李文明,叶笑春,范东睿.数据流计算研究进展与概述[J].数据与计算发展前沿,2021,3(5):65-81. 被引量：1

同被引文献43

1郑逢斌,张哲,余涛,赖积保,徐辉,张谦.一种支持多任务高效处理的遥感产品生产线架构研究[J].计算机科学,2012,39(S3):181-184. 被引量：6
2沈轶炜,曾国荪.异构计算中一种图的非均衡划分算法[J].计算机科学,2006,33(6):260-263. 被引量：7
3尹杨美,徐成,刘彦.改进的异构多处理器的实时任务调度算法研究[J].计算机应用研究,2010,27(4):1236-1238. 被引量：3
4桑红燕,潘全科,武磊,潘玉霞.批量流水线调度问题的混合差分进化算法[J].计算机工程与应用,2010,46(21):47-50. 被引量：3
5曹倩,胡长军,李士刚.Cell异构多核处理器上流水并行优化技术[J].计算机应用研究,2011,28(9):3344-3347. 被引量：1
6周兵,李家国,吴贯锋,刘扬.面向遥感产品生产的可视化数据流模型[J].河南大学学报（自然科学版）,2013,43(1):74-78. 被引量：9
7王晋年,顾行发,明涛,周翔.遥感卫星数据产品分类分级规则研究[J].遥感学报,2013,17(3):566-577. 被引量：26
8张维维,魏海涛,于俊清,李鹤,黎昊,杨秋吉.COStream:一种面向数据流的编程语言和编译器实现[J].计算机学报,2013,36(10):1993-2006. 被引量：10
9李士刚,胡长军,王珏,李建江.异构多核上多级并行模型支持及性能优化[J].软件学报,2013,24(12):2782-2796. 被引量：4
10刘嘉,夏路京.中国电信全网计费资料数据实时同步方案研究[J].电信科学,2014,30(5):145-150. 被引量：1

引证文献8

1陈文斌,杨瑞瑞,于俊清.基于GPU/CPU混合架构的流程序多粒度划分与调度方法研究[J].计算机工程与科学,2017,39(1):15-26. 被引量：4
2郑逢斌,朱青,臧文乾.一种XML驱动的遥感产品生产并发数据流模型[J].计算机工程与应用,2018,54(24):266-270. 被引量：2
3杨平平,岳春生,胡泽明.异构信号处理平台中层次性流水线调度算法[J].计算机工程,2018,44(11):83-89. 被引量：5
4林钰杰,吴丽贤.基于DEC的应用层与数据层数据同步问题的研究[J].微型电脑应用,2019,35(7):96-98. 被引量：1
5骆亮.多核平台两级抢占式固定优先级DAG递归调度[J].微电子学与计算机,2020,37(4):70-75. 被引量：1
6薛亚非,冯钧.基于时隙堆栈搜索的异构集群DAG调度策略[J].计算机工程与设计,2020,41(6):1725-1732.
7陈莹,黄永彪,谢瑾.基于可靠性的多核系统硬实时任务并行调度[J].控制工程,2021,28(1):176-182. 被引量：4
8赵二虎,吴济文,肖思莹,晋振杰,徐勇军.嵌入式异构智能计算系统并行多流水线设计[J].电子学报,2023,51(11):3354-3364.

二级引证文献17

1王建林,赵青杰,孙彻,谢毅.XML驱动的遥感产品生产定制框架研究[J].河南大学学报（自然科学版）,2021,51(2):176-182.
2彭培,张云雷,李轲,席泽敏.基于CPU/GPU处理器的雷达脉冲压缩算法并行机制研究[J].舰船电子工程,2017,37(10):30-32. 被引量：8
3庄跃迁.一种基于高性能GPU的实时脉内分析实现方案[J].电子设计工程,2019,27(19):100-104. 被引量：2
4林显宁.基于语言信息一致性调整算法的数据产品选择[J].计算机工程与应用,2019,55(21):129-134.
5李治,孙锐.社会互动对推荐系统用户感知及信息采纳的影响研究[J].情报学报,2019,38(11):1138-1149. 被引量：9
6薛亚非,冯钧.基于时隙堆栈搜索的异构集群DAG调度策略[J].计算机工程与设计,2020,41(6):1725-1732.
7李娜,高博,谢宗甫.分层异构信号处理平台调度方法研究[J].电子科技,2022,35(2):7-13. 被引量：3
8程帅棋,陈伟.大数据下软件工程技术的运用探讨[J].石河子科技,2022(1):20-22. 被引量：2
9谢石木林,白杰,张翔,汤泽毅,粘为帆,刘旭杰.基于5G+MEC的电网边缘计算平台任务安全性调度方法[J].电信科学,2022,38(12):78-85.
10李春雪,陈霖,邓博文.一种基于复制的高效任务调度算法[J].计算机与网络,2023,49(12):44-49.

1魏海涛,于俊清,余华飞,秦明康.一种面向数据流程序的软件流水并行化方法[J].计算机学报,2011,34(5):889-898. 被引量：5
2刘小宪,魏海涛,于俊清.面向X10的数据流程序编译优化算法[J].小型微型计算机系统,2013,34(10):2239-2245. 被引量：1
3陈文斌,杨瑞瑞,于俊清.基于GPU/CPU混合架构的流程序多粒度划分与调度方法研究[J].计算机工程与科学,2017,39(1):15-26. 被引量：4
4郭青,陈国良,陈意云.数据流程序设计语言[J].计算机研究与发展,1990,27(4):22-30. 被引量：2
5杨秋吉,于俊清,莫斌生,何云峰.面向Storm的数据流编程模型与编译优化方法研究[J].计算机工程与科学,2016,38(12):2409-2418. 被引量：3
6刘松强.数据流编程的图形软件Lab　VIEW及其应用[J].小型微型计算机系统,1994,15(10):30-34. 被引量：5
7张维维,魏海涛,于俊清,李鹤,黎昊,杨秋吉.COStream:一种面向数据流的编程语言和编译器实现[J].计算机学报,2013,36(10):1993-2006. 被引量：10
8唐九飞,李鹤,于俊清.面向X86多核处理器的数据流程序任务调度与缓存优化[J].中国科学技术大学学报,2016,46(3):200-207. 被引量：2
9钟颖莉,玄萍,李金宝.基于机群的并行多连接查询处理机分布算法[J].黑龙江大学自然科学学报,2009,26(2):211-215. 被引量：1
10钱进.大数据下属性约简算法研究进展[J].数码设计,2016,5(3):8-14.

计算机学报

2014年第10期

浏览历史

内容加载中请稍等...

面向多核集群的数据流程序层次流水线并行优化方法被引量：8

参考文献22

二级参考文献24

共引文献9

同被引文献43

引证文献8

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

面向多核集群的数据流程序层次流水线并行优化方法 被引量：8

参考文献22

二级参考文献24

共引文献9

同被引文献43

引证文献8

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

面向多核集群的数据流程序层次流水线并行优化方法被引量：8