基于节点预测的直接Cache一致性协议被引量：33

Node Predicting Based Direct Cache Coherence Protocol for Chip Multi-processor

下载PDF

导出

摘要处理器性能的提升依赖于对存储系统性能的挖掘．随着片上集成内核数量的不断增大和特征尺寸的持续缩小，延迟、存储可扩展的Cache一致性协议已经成为提升访存效率的关键性因素．文中提出一种基于节点预测的直接Cache一致性协议-NPP协议，研究一致性交互延迟隐藏和目录存储开销减少技术．针对读、写缺失中存在的间接性问题和现有解决方案破坏已有数据局部性、无法获得最近数据副本等问题，分别提出节点挂起技术和直接写缺失处理技术，有效隐藏了目录访问延迟．为了实现准确的节点预测，作者还提出基于“签名”回收的历史信息更新算法，避免了冗余更新和不完整更新．使用SPLASH-2测试程序集，在基于2DMESHNoC互联的64核CMP下，相对于全映射目录协议，NPP协议的平均执行时间降幅为21．78％～31．11％；平均读缺失延迟降低14．22％～18．9％；平均写缺失延迟降低17．89％～21．13％．而获得上述性能提升的代价是网络流量平均增加6．62％～7．28％． The performance promotion of modern processor depends on the excavation of memory system. Along with the booming of cores integrated in chip and the continual shrink of critical size, the cache coherence protocol with good scalability of latency and memory overhead has become the key factor to increase the memory access efficiency. This paper proposes a node predicting based direct cache coherence protocol--NPP, which mainly focuses on the research of techniques for cache coherence transaction latency hiding and memory overhead reduction. To solve the indirection problem in read/write miss transaction and overcome the shortcomings of data locality broken and inability to get the nearest valid copy in existing proposals, we propose the node hanging technique and direct write-miss processing technique to hide the directory access latency in read miss and write miss. In addition, we also propose a signature collection based history information update algorithm to avoid the superfluous or incomplete update. Simulation results show that for a 2D MESH NoC based 64-core CMP, compared to flat full map directory protocol, NPP reduces average execution time by 21.78%-31.11% ,average read miss latency by 14.22%- 18.9% and average write miss latency by 17.89% - 21.13%. Besides the above performance promotion, price of NPP is increasing of on-chip network traffic by 6.62%- 7.28% on average.

作者张骏田泽梅魁志赵季中

机构地区中国航空工业集团公司西安航空计算技术研究所西安交通大学电子与信息工程学院

出处《计算机学报》 EI CSCD 北大核心 2014年第3期700-720,共21页 Chinese Journal of Computers

基金国家"核高基"科技重大专项(2009ZX01039-003-001-03 2009ZX01023-004) 国家自然科学基金(60905007)资助~~

关键词单芯片多处理器(CMP) 预测一致性协议目录可扩展中图法 chip multi-processor prediction coherence protocol directory scalable

分类号 TP303 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献3

1黄安文,张民选.多核处理器Cache一致性协议关键技术研究[J].计算机工程与科学,2009,31(A01):104-108. 被引量：5
2王钰.多机可缩放性高速缓冲存储器一致性协议分析[J].计算机技术与发展,2009,19(2):94-97. 被引量：2
3胡伟武,施巍松,唐志敏.基于新型Cache一致性协议的共享虚拟存储系统[J].计算机学报,1999,22(5):467-475. 被引量：15

二级参考文献27

1Lenoski D. The DASH Prototype: Implementation and Performance[C]// In: Proceedings of 19th Annual International Symposium on Computer Architecture. Gold Coast, Australia:[s.n. ], 2000:92-103.
2Agarwal A. The MIT Alewife Machine:Architecture and Performance[C]//In. Proceedings of 22nd Annual International Symposium on Computer Architecture. Gold Coast, Australia:[s. n. ] ,1999:2- 13.
3Yousif M S, Thazhuthaveetil M J, DAS C R. Cache Coherence in Multiprocessors :A Survey[J]. In: Advanced in Computers, 1995,40: 56 - 101.
4Dubois M, Thakkar S. Scalable Shared Memory Multiprocessots[ M]. Norwell, MA: Kluwer Academic Publisher, 1992.
5Thaper M, Delagi B. Stanford Distributed- Directory Protocol[J]. Computer, 1990,23(6) :78- 79.
6Thapar M, Delagi B, Flynn M J. Linked List Cache Coherence for Scalable Shared Memory Multiproeessors[ C]//In: Proceedings of 7th International Parallel Processing Symposium. Newport Beach, CA, USA: [ s. n. ], 1993 : 34 - 43.
7Stallings W. Computer Organization and Architecture Design for Performance[ D]. [ s. l. ] : Prentice - Hall Internation Inc, 2002.
8Hennessy J L, Patterson D A. Computer Architecture: A Quantitative Approach[M]. 3rd ed. San Francisco: Morgan Kaufmann, 2004.
9Enright Jerger N D. Chip Multiprocessor Coherence and Interconnect System Design[D]. University of Wisconsin-Madison, 2008.
10Martin Milo M K. Token Coherence[D]. University of Wisconsin-Madison, 2003.

共引文献19

1吴少刚,章隆兵,蔡飞,顾丽红,唐志敏.机群Open MP系统的设计与实现[J].计算机学报,2004,27(7):904-912. 被引量：8
2章隆兵,吴少刚,蔡飞,胡伟武.适合机群OpenMP系统的制导扩展[J].计算机学报,2004,27(8):1129-1136. 被引量：2
3谢青峰.浅析高速缓冲存储器Cache在PC系统中的应用[J].福建电脑,2004,20(9):27-28. 被引量：1
4姚念民,舒继武,郑纬民.SAN中的分布式锁机制[J].计算机研究与发展,2005,42(2):338-343. 被引量：1
5许建卫,陈明宇,包云岗.高带宽远程内存结构中的预取研究[J].计算机科学,2005,32(8):15-20. 被引量：2
6刘广忠,肖钰,袁淑芳.基于外部共享Cache的多处理机Cache一致性协议[J].河北工程技术高等专科学校学报,2006(2):1-3. 被引量：1
7杨学军,窦勇,胡庆丰.Progress and Challenges in High Performance Computer Technology[J].Journal of Computer Science & Technology,2006,21(5):674-681. 被引量：7
8林伟,叶笑春,宋风龙,张浩.众核处理器中使用写掩码实现混合写回/写穿透策略[J].计算机学报,2008,31(11):1918-1928. 被引量：5
9王晓霞.放松的存储一致性模型[J].数学教学研究,2010(12):50-52.
10李静梅,杨鹏飞,张健沛,门朝光,吴艳霞.适用于多核环境的混合Cache一致性协议[J].计算机工程,2011,37(24):284-286.

同被引文献169

1庞征斌,李琼,李永进,张峻,徐炜遐.CC-NUMA系统分布共享I/O的数据一致性维护[J].计算机研究与发展,2007,44(z1):226-232. 被引量：1
2段宗涛,周兴社,董明峰.主存储器访问调度技术研究[J].微电子学与计算机,2004,21(10):55-59. 被引量：4
3代科学,李国辉,涂丹,袁见.监控视频运动目标检测减背景技术的研究现状和展望[J].中国图象图形学报,2006,11(7):919-927. 被引量：169
4朱鸿宇,刘瑰,唐福华,陈左宁.一种自适应的数据预取与缓冲算法[J].计算机工程与应用,2006,42(24):13-15. 被引量：6
5杨春贵,吴产乐,彭鸿雁.一种有效的Web代理缓存替换算法[J].计算机工程,2007,33(3):43-44. 被引量：13
6Hacer G G,Semra T,Raf J. A hybrid approach for the ca-pacitated lot sizing problem with setup carryover[J].Interna-tional Journal of Production Research,2012,50(6):1582-1597.
7SAJEEV G P,SEBASTIAN M P.Building semi-intelligent web cache systems with lightweight machine learning techniques[J].Computers&Electrical Engineering,2013,39(4):1174-1191.
8STANKOVIC M S,JOHANSSON K H,STIPANOVIC D M.Distributed seeking of Nash equilibria with applications to mobile sensor networks[J].IEEE Transaction on Automatic Control,2012,57(4):904-919.
9FRIHAUF P,KRSTIC M,BASAR T.Nash equilibrium seeking in Noncooperative games[J].IEEE Transaction on Automatic Control,2012,57(5):1192-1207.
10OLIVEIRA L M,RODRIGUES J J.Wireless sensor networks:a survey on environmental monitoring[J].Journal of Communications,2011,6(2):143-151.

引证文献33

1李小红.REST架构下作业线模糊贴近度支配集优化控制[J].科技通报,2014,30(12):205-207. 被引量：1
2董俊.MAC层信息平台解析引擎缓存数据预取算法[J].科技通报,2015,31(2):49-51.
3刘荷花.受经验约束的Web故障监测数据自适应重写算法[J].科技通报,2015,31(2):104-106.
4郑晓霞,聂阳,戈华.伪随机时频跳变网络谐振信号的信息容量估计[J].科技通报,2015,31(2):188-190.
5陆兴华,陈平华.基于定量递归联合熵特征重构的缓冲区流量预测算法[J].计算机科学,2015,42(4):68-71. 被引量：86
6高亮,金秋.网络威胁态势预测的抗体虚警概率阈值估计[J].科技通报,2015,31(6):64-66.
7吴丰,吕振雷,陈珂锐.基于时间尺度分析的云网格空间资源调度算法[J].计算机仿真,2015,32(8):131-135. 被引量：8
8马蕾,龚戈淬,刘建平.海量数据存储机制的研究——以海量金属数据为例[J].世界有色金属,2015,40(9):72-73.
9杨秀荣.并行数据库中异常数据优化分类挖掘方法研究[J].微电子学与计算机,2015,32(10):125-128. 被引量：4
10陈得友,茹金平.云计算中多源信息资源平台兼容性路由算法[J].科技通报,2015,31(10):175-177.

二级引证文献208

1吉晓宇,武玉国,张明慧.一种基于Logisim的LRU高速缓存仿真系统设计与实现[J].郑州师范教育,2022,11(4):17-20.
2赖倩.基于大数据技术的档案数据挖掘对策研究[J].企业改革与管理,2021(9):19-20. 被引量：2
3陈周牛.舰船电子通信网络群体节点位置自动预测方法[J].舰船科学技术,2019,0(22):169-171.
4葛仁燕.大数据视角下基建档案管理的信息化路径[J].现代企业文化,2020,0(1):91-91.
5石盛林.私营企业的发展战略[J].经济管理,2000,26(4):37-37.
6唐仁泉.小信号自动切换系统的技术改造[J].电视工程,2000(1):9-10.
7李亚梅.计算机数据挖掘技术开发及其在档案信息管理中的运用研究[J].中国新通信,2018,20(24):41-41. 被引量：10
8汤伟,杨铖.智能检索技术在电网调度本体知识库中的应用[J].自动化与仪器仪表,2019(1):178-180. 被引量：2
9曹曼曼,汪勉.关于分布式数据库准确分类仿真研究[J].计算机仿真,2019,36(1):354-357. 被引量：2
10汤伟,杨铖.智能检索技术在电网调度本体知识库中的应用[J].自动化与仪器仪表,2019(2):193-196. 被引量：1

1《电脑知识与技术》征稿细则[J].电脑知识与技术（过刊）,2009,15(5X):3843-3843.
2《电脑知识与技术》征稿细则[J].电脑知识与技术（过刊）,2009,15(9X):7583-7583.
3《电脑知识与技术》征稿细则[J].电脑知识与技术（过刊）,2009,15(4X):4611-4611.
4《电脑知识与技术》征稿细则[J].电脑知识与技术（过刊）,2009,15(2X):1281-1281.
5《电脑知识与技术》征稿细则[J].电脑知识与技术（过刊）,2009,15(10X):8351-8351.
6《电脑知识与技术》征稿细则[J].电脑知识与技术（过刊）,2009,15(1X):513-513.
7《电脑知识与技术》征稿细则[J].电脑知识与技术（过刊）,2009,15(7X):5591-5591.
8《电脑知识与技术》征稿细则[J].电脑知识与技术（过刊）,2009,15(8X):6593-6593.

计算机学报

2014年第3期

浏览历史

内容加载中请稍等...

基于节点预测的直接Cache一致性协议被引量：33

参考文献3

二级参考文献27

共引文献19

同被引文献169

引证文献33

二级引证文献208

相关作者

相关机构

相关主题

浏览历史

基于节点预测的直接Cache一致性协议 被引量：33

参考文献3

二级参考文献27

共引文献19

同被引文献169

引证文献33

二级引证文献208

相关作者

相关机构

相关主题

浏览历史

基于节点预测的直接Cache一致性协议被引量：33