一种基于推测代价评估的推测多线程并行粒度调节方法被引量：4

A PARALLEL GRANULARITY TUNING APPROACH FOR SPECULATIVE MULTITHREADING BASED ON SPECULATIVE COST EVALUATION

下载PDF

导出

摘要传统的推测多线程技术总是假定程序的并行粒度大小应该随着处理器核资源数目的增加而增大,未考虑不同数目的处理器核资源对程序自身并行性能的影响作用。针对这个问题,提出一种自适应的循环并行粒度调节方法用于优化处理器核资源的分配过程。以推测级为单位,通过动态收集循环中所有推测线程的性能量化分析结果,进行推测代价评估。并利用评估结果动态调整循环的并行粒度大小,优化所分配到的处理器核资源的数目,以减少不必要的推测代价。实验表明,该方法不但在SPEC CPU基准测试程序集上能取得较好的性能提升,而且进一步优化了推测时的能耗开销。 Traditional speculative multithreading always assumes that the size of program's parallel granularity should increase as the number of processor core resources increases. It doesn't consider the effect of different number of processor core resources on the parallel performance of a program. Therefore, we proposed a self-adaptive parallel granularity adjustment for loops to optimize the allocation of their processor core resources. This approach took the speculative level as the unit, and performed the speculative cost evaluation by mean of dynamically collecting the results of performance quantitative analysis for all speculative threads within a loop. The results of cost evaluation were used to dynamically adjust the size of loop's parallel granularity and optimize the number of their allocated processor core resources to reduce the unnecessary cost for speculation. The experimental results show that our approach not only achieves better performance on SPEC CPU benchmark assemblies, but also optimizes the power consumption for speculation.

作者李美蓉赵银亮 Li Meirong;Zhao Yinliang(Xi’an Aeronautical University, Xi’an 710077,Shaanxi, China;Xi’an Jiaotong University, Xi’an 710049,Shaanxi,China)

机构地区西安航空学院西安交通大学

出处《计算机应用与软件》北大核心 2019年第4期29-36,90,共9页 Computer Applications and Software

基金国家自然科学基金项目(61640219 61173040) 校级科研基金项目(2016KY1103)

关键词推测多线程代价评估并行粒度 Speculative multithreading Cost evaluation Parallel granularity

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献4

1王家龙,刘艳红,沈立.线程级猜测并行系统代码自动生成工具的设计与实现[J].计算机科学,2017,44(11):114-119. 被引量：1
2李美蓉,赵银亮,陶悠,王启明.A Static Greedy and Dynamic Adaptive Thread Spawning Approach for Loop-Level Parallelism[J].Journal of Computer Science & Technology,2014,29(6):962-975. 被引量：1
3Li Shen Fan Xu Zhi-Ying Wang.Optimization Strategies Oriented to Loop Characteristics in Software Thread Level Speculation Systems[J].Journal of Computer Science & Technology,2016,31(1):60-76. 被引量：3
4刘斌,赵银亮,韩博,李玉祥,吉烁,冯博琴,武万杰.基于性能预测的推测多线程循环选择方法[J].电子与信息学报,2014,36(11):2768-2774. 被引量：7

二级参考文献57

1Yang L and Zhai A. Dynamically dispatching speculative threads to improve sequential execution[J]. ACM Transactions on Architecture and Code Optimization, 2012, 9(3): 13:1-13:31.
2Vijaykumar T N and Sohi G S. Task selection for a multiscalar processor[C]. Proceedings of the 31st Annual ACM/IEEE International Symposium on Microarchitecture, Dallas, 1998: 81-92.
3Hammond L, Hubbert B A, Siu M, et al.. The stanford hydra cmp[J]. IEEE Micro, 2000, 20(2): 71-84.
4Liu W, Tuck J, Ceze L, et al.. POSH: a TLS compiler that exploits program structure[C]. Proceedings of the 8th ACM SIGPLAN Symposium on Principles and Practice of Parallel Programming, New York, 2006: 158-167.
5Madriles C, García-Qui?ones C, Sánchez J, et al.. Mitosis: a speculative multithreaded processor based on precomputation slices[J]. IEEE Transactions on Parallel and Distributed Systems, 2008, 19(7): 914-925.
6Jialu H, Jablin T B, Beard S R, et al.. Automatically exploiting cross-invocation parallelism using runtime information[C]. Proceedings of the 2013 IEEE/ACM International Symposium on Code Generation and Optimization, Shenzhen, 2013: 1-11.
7Gao L, Li L, Xue J, et al.. SEED: a statically greedy and dynamically adaptive approach for speculative loop execution[J]. IEEE Transactions on Computers, 2013, 62(5): 1004-1016.
8Sharafeddine M, Jothi K, and Akkary H. Disjoint out-of-order execution processor[J]. ACM Transactions on Architecture and Code Optimization, 2012, 9(3): 19:1-19:32.
9Wang S Y, Yew P C, and Zhai A. Code transformations for enhancing the performance of speculatively parallel threads[J]. Journal of Circuits, Systems and Computers, 2012, 21(2): 1-23.
10Du Z H, Lim C C, Li X F, et al.. A cost-driven compilation framework for speculative parallelization of sequential programs[J]. Association for Computing Machinery Special Interest Group Programming Languages Notices, 2004, 39(6): 71-81.

共引文献8

1黄艳,张启坤,段赵磊,古志民.基于缓存行为特征的线程数据预取距离控制策略[J].电子与信息学报,2015,37(7):1633-1638. 被引量：1
2冯晓,戴紫彬,李伟,蔡路亭.基于Amdahl定律的多核密码处理器性能模型研究[J].电子与信息学报,2016,38(4):827-833. 被引量：5
3冯晓,戴紫彬,蔡路亭,李伟.基于Amdahl定律扩展的多核处理器性能模型研究[J].电子学报,2017,45(6):1424-1430. 被引量：2
4王家龙,刘艳红,沈立.线程级猜测并行系统代码自动生成工具的设计与实现[J].计算机科学,2017,44(11):114-119. 被引量：1
5陈胜,姬源,陈刚,施武作.便携式变电站远动信息调试装置研究及应用[J].电力大数据,2018,21(1):43-47.
6盛红雷,贾崟.基于人工神经网络的线程数据加速划分[J].舰船电子工程,2019,39(1):85-89.
7卜得庆,王耀彬,李凌,杨洋,程一鸣,刘志勤,吴亚东.嵌入式应用中的循环级线程推测并行性分析[J].计算机应用研究,2019,36(9):2691-2695.
8孟慧玲,王耀彬,李凌,杨洋,王欣夷,刘志勤.TACLeBench中内核程序循环级推测并行性分析[J].计算机应用,2021,41(9):2652-2657.

同被引文献31

1王耀彬,安虹,郭锐,闫洁,路璐.用线程级推测技术在多核体系结构上并行化科学计算应用[J].小型微型计算机系统,2010,31(2):264-270. 被引量：2
2晁志霞,许婕,徐毅.用于大范围纳米测量的法布里-珀罗干涉仪[J].计量学报,1999,20(4):241-246. 被引量：14
3魏海涛,于俊清,余华飞,秦明康.一种面向数据流程序的软件流水并行化方法[J].计算机学报,2011,34(5):889-898. 被引量：5
4戴晨,陈鹏,杨冬蕾,张为华.面向多核的并行编程和优化研究[J].计算机应用与软件,2013,30(12):198-202. 被引量：11
5刘斌,赵银亮,韩博,李玉祥,吉烁,冯博琴,武万杰.基于性能预测的推测多线程循环选择方法[J].电子与信息学报,2014,36(11):2768-2774. 被引量：7
6郑志月,施玉书,高思田,李东升,李伟,李适,李庆贤.高精度电容式位移传感器校准方法的研究[J].计量学报,2015,36(1):14-18. 被引量：13
7魏康,杨晓元,刘龙飞,袁宏博.爬山算法对一阶相关免疫函数非线性度的优化研究[J].计算机应用研究,2015,32(5):1500-1502. 被引量：4
8黄日胜.异构并行系统中高时效性任务的节能调度方法[J].计算机应用与软件,2015,32(11):329-333. 被引量：2
9邓嘉,吉萌,雷升平.基于多核处理器BFD协议的设计与实现[J].电子设计工程,2016,24(12):90-92. 被引量：3
10王一拙,陈旭,计卫星,苏岩,王小军,石峰.一种支持容错的任务并行程序设计模型[J].软件学报,2016,27(7):1789-1804. 被引量：1

引证文献4

1闵帅博,崔建军,严利平,王冬,束红林,陈恺.基于轻量级并行编程的微位移测量系统设计研究[J].计算机应用与软件,2020,37(9):1-7.
2孟慧玲,王耀彬,李凌,杨洋,王欣夷,刘志勤.TACLeBench中内核程序循环级推测并行性分析[J].计算机应用,2021,41(9):2652-2657.
3丁艳,张海文,孙永彦.基于多网格技术的电网工程造价数据信息分析方法研究[J].电子设计工程,2021,29(19):35-39. 被引量：5
4杜梅,黄艳.基于深度神经网络框架的运行时系统调度策略研究[J].无线电工程,2023,53(6):1303-1310. 被引量：1

二级引证文献6

1周浩臻.基于全寿命周期成本的电网工程造价管控研究[J].工程与建设,2022,36(6):1850-1852. 被引量：4
2黄沈海,金显,马婷婷,张黛妮,窦金月.基于灰色关联模型的LSSVM在变电工程快速报价中的研究[J].价值工程,2023,42(1):7-9. 被引量：3
3刘士李,周远科,施晓敏,高象.基于改进RF算法的低压配电工程信息识别技术[J].电子设计工程,2023,31(20):177-181. 被引量：2
4文志,杨丽丽,扈燕博,李守鹏,唐宁宁.大数据下电网工程造价数据信息分析方法[J].办公自动化,2024,29(1):31-33.
5刘文展,齐小谦,李兴力,冯士妥,刘孟翰.飞行训练场景构建与评估系统设计[J].计算机与网络,2024,50(1):33-38.
6何琳,黄博,申亚波,李爽.基于混合智能优化算法的输变电工程全环节关键数据处理方法[J].沈阳工业大学学报,2024,46(3):263-269.

1朱天星.为了祖国的能源与国防安全——记东华理工大学核资源与环境国家重点实验室[J].国防科技工业,2018,0(12):68-70.
2李俊.探讨SPEC技术在项目管理中的应用[J].中国工程咨询,2019(5):69-72.
3李萍.球形纳米氧化镁的制备及其粒度影响因素[J].化学研究与应用,2019,31(4):747-752. 被引量：6
4曹鹏涛,卞兆娥.辐射环境监测自动站供电系统的配置及维护[J].环境与发展,2019,31(3):109-110. 被引量：1
5顾理平,俞立根.手机应用模糊地带的公民隐私信息保护——基于五大互联网企业手机端的隐私政策分析[J].当代传播,2019,0(2):77-80. 被引量：14
6朱靓.桂东南地方特色档案资源体系建设研究[J].兰台世界,2019,0(5):89-90. 被引量：2
7盛建明.5G时代的新一代智能存储技术及其标准化的突破——从华为全闪存存储获得全球标准化组织SPEC的背书说起[J].中国标准化,2019(9):20-25. 被引量：3
8付朝江,王天奇,林悦荣.基于有效并行求解策略的显式有限元分析并行算法[J].计算机应用,2018,38(4):1072-1077. 被引量：4
9刘振伟.辽宁省阜新二道岭金矿矿石特征及金的赋存状态[J].世界有色金属,2019,44(4):111-112. 被引量：2
10温娅檬,余胜,游成铭,王旭熙,袁吉,曾合州,黄美玉,吴福忠.不同物候时期华西雨屏区四个树种新鲜凋落物可提取腐殖质碳动态[J].广西植物,2019,39(3):411-418.

计算机应用与软件

2019年第4期

浏览历史

内容加载中请稍等...

一种基于推测代价评估的推测多线程并行粒度调节方法被引量：4

参考文献4

二级参考文献57

共引文献8

同被引文献31

引证文献4

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

一种基于推测代价评估的推测多线程并行粒度调节方法 被引量：4

参考文献4

二级参考文献57

共引文献8

同被引文献31

引证文献4

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

一种基于推测代价评估的推测多线程并行粒度调节方法被引量：4