面向多核结构的自适应选择性指令主动推送技术被引量：1

An Adaptive and Selective Instruction Active Push Technique for Multi-core Architecture

下载PDF

导出

摘要正确有效的指令预取策略是避免指令缺失的关键技术,程序流程改变时指令预取方向正确率不高、指令预取准确度和存储器带宽有效利用率较低是导致指令缺失的主要因素.本文提出基于置信度评估的自适应选择性指令主动推送技术ASIAP,一方面减少无效指令预取的数量,进行精确指令预取,在避免Cache污染的同时提升指令预取的有效性;另一方面采用指令主动推送部件自适应选择性地完成部分非顺序指令预取请求,减少了取入错误路径上无用指令的可能.通过与Next_Line、Target_Line、Wrong_Path、BTA、Markov和CFGP等策略的对比,在2-16内核配置下,ASIAP策略相对于其它策略准确性平均提升3.7%-28.71%;L1 I-cache缺失率平均下降3.3%-14.39%. Correct and effective instruction prefetching strategy is key technique to avoid instruction miss.Unfortunately,correctness and accuracy of instruction prefetching is not very precise,and the utilization ratio of memory bandwidth is relative low,which lead to instruction miss.This paper proposes an adaptive and selective instruction active push technique for multi-core architecture,called ASIAP.On one hand,in order to avoid the cache pollution and increase the prefetching validity,we perform instruction prefetching precisely as far as possible;on the other hand,part of non-sequential type prefetching are responded preferentially by a specific instruction active push unit adaptively and selectively,which decreases the possibility of fetching the useless instructions in the wrong path.We evaluate ASIAP with other prefetching strategies such as Next_Line、Target_Line、Wrong_Path、BTA、Markov and CFGP.Simulation result indicates that,under the configuration of 2 cores to 16 cores,relative to other strategies,ASIAP improves prefetching accuracy by average 3.7%-28.71%,and reduces of L1 I-Cache miss rate by average 3.3%-14.39%.

作者张骏梅魁志赵季中

机构地区西安交通大学电子与信息工程学院

出处《小型微型计算机系统》 CSCD 北大核心 2013年第3期636-643,共8页 Journal of Chinese Computer Systems

基金国家"核高基"科技重大专项课题项目(2009ZX01039-003-001-03 2009ZX01023-004)资助国家自然科学(60905007)资助

关键词片上多核处理器存储系统置信度评估自适应指令预取主动推送 chip multi-core memory system confidence estimation adaptation instruction prefetching active push

分类号 TP303 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献2

1沈立,王志英,鲁建壮,戴葵.基于控制流的混合指令预取[J].电子学报,2003,31(8):1141-1144. 被引量：8
2沈立,戴葵,王志英.以基本块为单位的非顺序指令预取[J].计算机工程与科学,2003,25(4):94-98. 被引量：4

二级参考文献15

1R Colwell, R Nix, J O' Donnell, et al. A VLIW Architecture for a Trace Scheduling Compiler[ A ]. Proc of the 2nd Int' 1 Conf on Architectural Support for Programming Languages and Operating Systems[C]. 1987.180 - 192.
2W Hwu, S Mahlke, W Chen, et al. The Superblock: An Effective Technique for VLIW and Superscalar Compilation[ J]. The Journal of Supercomputing, 1993,7:229 - 248.
3C Xia, J Torrellas. Instruction Prefetching of Systems Codes with Layout Optimized for Reduced Cache Misses[ A] .23rd Annual Int' l Symp on Computer Architecture[ C]. 1996.
4N Jouppi. Improving Direct-Mapped Cache Performance by the Addition of a Small Fully Associative Cache and Prefetch Buffers[ A].Proc of the 17th Annual Int'l Symp on Computer Architecture[ C].1990.
5J Pieroe, T Mudge. Wrong-Path Instruction Prefetching[ A ]. 29th Int'l Symp on Microarchitecture[ C]. 1996.165 - 175.
6D Joseph, D Grunwald. Prefetching Using Markov Predictors[ A ].24th Annual Int'l Symp on Computer Architecture[C]. 1990.
7G Reinman, B Calder,T Austin. Fetch directed instruction prefetching[A] .In Proceedings of the 32nd Annual International Symposium on Microarchitecture [ C]. Haifa: IEEF. Computer Society Press, 1999.16- 27.
8D Krfft. Lockup-free instruction fetch/prefetch cache organization.[A] .In 8th Annual lntermational Symposium of Computer Arehiteeture[C]. Minneapolis: IEEE, Congsater Society Press, 1981.81 - 87.
9K Faxkas, N Jouppi. Complexity/performance trdeoffs with non-blocking loads [A]. In 21st Annual International Symposium on Computer Architecture [ C ]. Chicago: IEEE Computer Society Press, 1994.211 -222.
10J Pierce, T Mudge. Wrong-path instruction prefetching [ A ]. The 29th International Symposium on Microarchitecture [ C]. Paris:IEEE. Computer Society Press, 1996.165 - 175.

共引文献9

1扈啸,陈书明.面向指令Cache周期预取的代码排布方法[J].计算机研究与发展,2009,46(5):747-755.
2郭建军,戴葵,王志英.同步数据触发体系结构中指令预取技术研究[J].计算机工程与科学,2009,31(8):77-81.
3杨惠,孙永节.高性能低功耗FT-XDSP的指令缓存队列[J].小型微型计算机系统,2010,31(7):1350-1354.
4吴俊杰,杨学军.面向非一致Cache的任意步长预提升技术[J].计算机科学与探索,2010,4(7):577-588. 被引量：4
5靳强,郭阳,鲁建壮.一种步长自适应二级cache预取机制[J].计算机工程与应用,2011,47(29):56-59. 被引量：5
6谢子超,史秦青.HIP:一种基于提示值索引的间接转移预测技术[J].电子学报,2012,40(8):1523-1531. 被引量：1
7刘松鹤,宋焕生,亓淑敏,李文敏.无污染Cache访问控制技术[J].计算机工程与应用,2013,49(10):5-9.
8琚魁,谢憬,毛志刚.一种VLIW循环指令的预取和优化策略[J].微电子学与计算机,2013,30(5):19-22.
9方皓,吴礼发,吴志勇.基于符号执行的Return-to-dl-resolve利用代码自动生成方法[J].计算机科学,2019,46(2):127-132. 被引量：8

同被引文献14

1赵新勇,安实.伴随车检测技术应用研究[J].交通运输系统工程与信息,2012,12(3):36-40. 被引量：7
2宗威,吴锋.大数据时代下数据质量的挑战[J].西安交通大学学报（社会科学版）,2013,33(5):38-43. 被引量：140
3金培权,郝行军,岳丽华.面向新型存储的大数据存储架构与核心算法综述[J].计算机工程与科学,2013,35(10):12-24. 被引量：39
4程学旗,靳小龙,王元卓,郭嘉丰,张铁赢,李国杰.大数据系统和分析技术综述[J].软件学报,2014,25(9):1889-1908. 被引量：739
5张国伍.大数据与智慧物流——“交通7+1论坛”第三十七次会议纪实[J].交通运输系统工程与信息,2015,15(1):2-10. 被引量：24
6俞士汶,朱学锋,耿立波.自然语言处理技术与语言深度计算[J].中国社会科学,2015(3):127-135. 被引量：24
7陆化普,孙智源,屈闻聪.大数据及其在城市智能交通系统中的应用综述[J].交通运输系统工程与信息,2015,15(5):45-52. 被引量：158
8祝若鑫,卢建伟,李风光,崔晓杰,喻博韡.使用自然语言处理和分层匹配方法的地理信息服务语义发现[J].测绘科学技术学报,2015,32(5):525-529. 被引量：4
9刘超,胡成玉,姚宏,梁庆中,颜雪松.面向海量非结构化数据的非关系型存储管理机制[J].计算机应用,2016,36(3):670-674. 被引量：8
10李克强.智能网联汽车现状及发展战略建议[J].经营者,2016,0(4):170-175. 被引量：16

引证文献1

1赵新勇,李珊珊,夏晓敬.大数据时代新技术在智能交通中的应用[J].交通运输研究,2017,3(5):1-7. 被引量：31

二级引证文献31

1贾沛源.新基建环境下智慧高速发展浅析[J].中国交通信息化,2022(S01):28-30. 被引量：2
2王祥刚.浅析人工智能在交通领域的运用及发展[J].产业科技创新,2019,1(5):37-38.
3王建强,王昕.智能网联汽车体系结构与关键技术[J].长安大学学报（社会科学版）,2017,19(6):18-25. 被引量：16
4陆莲芳.浅析大数据时代新技术在智能交通中的应用[J].数字技术与应用,2018,36(5):223-223. 被引量：3
5杨志华.交通信控无线运维系统设计与实现[J].交通运输研究,2018,4(2):44-49. 被引量：1
6赵明明.智能检测技术在汽车性能检测中的应用分析[J].南方农机,2018,49(16):116-116. 被引量：2
7王胜.数据技术在智慧交通中的应用价值分析[J].数据通信,2018(4):48-49. 被引量：2
8高金虎,邢小高,梁国凤.基于公共出行矛盾变化分析未来交通影响[J].交通世界,2018(25):8-10. 被引量：1
9刘滢.基于大数据平台的智能交通系统架构及功能设计[J].综合运输,2018,40(9):86-90. 被引量：6
10王光宇.浅析人工智能在交通领域的的主要技术及应用前景[J].中国新通信,2018,20(21):100-101. 被引量：13

1刘兴堂,王青歌.仿真系统置信度评估中的辨识方法[J].计算机仿真,2003,20(3):25-26. 被引量：5
2刁烈森.8088／286／386微处理器XT／AT系统指令预取的失效[J].上海微型计算机,1991(5):52-62.
3刁烈燊,季鹏翔.8088／286／386XT／AT系统指令预取效果分析[J].新浪潮,1991(4):4-7.
4曾国荪.XT/AT系统中8088/286/386微处理器指令预取失效的分析[J].微处理机,1991,12(4):24-30.
5沈立,王志英,鲁建壮,戴葵.基于控制流的混合指令预取[J].电子学报,2003,31(8):1141-1144. 被引量：8
6周宏伟,张民选.高性能微处理器中采用多种预取技术的指令Cache设计[J].计算机工程与科学,2004,26(11):103-105. 被引量：2
7郑炜暘,黄文强,王柳新.基于Socket长连接的面向民航移动终端的数据推送技术[J].民航科技,2010(4):134-136.
8王宁,曹丛华,黄娟,吴凤丛.Ajax长连接主动推送技术在海洋观测网管理信息系统中的应用[J].计算机应用,2012,32(A02):134-135. 被引量：2
9张骏,梅魁志,赵季中.基于置信度评估的Cache污染过滤技术[J].高技术通讯,2011,21(6):644-651. 被引量：1
10董立岩,朱琪,隋鹏,孙鹏,李永丽.基于最大差距的置信度评估算法[J].吉林大学学报（理学版）,2015,53(6):1217-1222.

小型微型计算机系统

2013年第3期

浏览历史

内容加载中请稍等...

面向多核结构的自适应选择性指令主动推送技术被引量：1

参考文献2

二级参考文献15

共引文献9

同被引文献14

引证文献1

二级引证文献31

相关作者

相关机构

相关主题

浏览历史

面向多核结构的自适应选择性指令主动推送技术 被引量：1

参考文献2

二级参考文献15

共引文献9

同被引文献14

引证文献1

二级引证文献31

相关作者

相关机构

相关主题

浏览历史

面向多核结构的自适应选择性指令主动推送技术被引量：1