硬件结构支持的基于同步的高速缓存一致性协议被引量：7

Architecture Supported Synchronization-Based Cache Coherence Protocol for Many-Core Processors

下载PDF

导出

摘要共享存储系统中如何高效地实现高速缓存一致性是体系结构设计面临的一个关键问题和难点问题.已有的基于目录的协议存在难于实现、验证复杂和存储空间开销大等问题.面向片上众核处理器,文中提出一种由硬件结构支持、基于同步的高速缓存一致性协议.该方案不使用目录,而是通过使用bloom-filter表示一致性信息,并在并行程序中的同步点维护高速缓存一致性.与现有的基于目录的高速缓存一致性协议相比,该方案可以降低目录协议的实现、验证复杂度.用SPLASH-2测试程序集评估表明,基于同步的协议可以获得与基于目录的协议相当的性能. The efficient support of cache coherence is extremely important to design and implement many-core processors. This paper proposes a synchronization-based coherence protocol to efficiently support cache coherence for shared memory of many-core processors. The unique feature of the scheme is that it doesn＇t use directory at all. Inspired by scope consistency memory model, the protocol maintains coherence at synchronization point. Within critical section, process cores record write sets （which lines have been written in critical sections） with bloom-filter functions. When the core releases the lock, the write set is transferred to a synchronization manager. When another core acquires the same lock, it gets the write set from the synchronization manager and invalidates stale data in its local cache. The scheme is evaluated using programs from SPLASH-2 benchmark. The results show that synchronization-based protocol can achieve similar performance in cost-effective way compared to a directory-based protocol that requires large amount of hardware resources and huge design verification effort.

作者黄河刘磊宋风龙马啸宇

机构地区中国科学院计算技术研究所计算机系统结构重点实验室中国科学院研究生院

出处《计算机学报》 EI CSCD 北大核心 2009年第8期1618-1630,共13页 Chinese Journal of Computers

基金国家自然科学基金重点项目(60736012) 国家"九七三"重点基础研究发展规划项目基金(2005CB321600)资助~~

关键词高速缓存一致性存储一致性模型多核处理器共享存储系统 cache coherence memory consistency many-core processors shared memory system

分类号 TP303 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献1

1黄琨,马可,曾洪博,张戈,章隆兵.一种分片式多核处理器的用户级模拟器[J].软件学报,2008,19(4):1069-1080. 被引量：6

二级参考文献3

1张福新,章隆兵,胡伟武.基于SimpleScalar的龙芯CPU模拟器Sim-Godson[J].计算机学报,2007,30(1):68-73. 被引量：24
2胡伟武,赵继业,钟石强,杨旭,Elio Guidetti,吴永强.Implementing a 1GHz Four-Issue Out-of-Order Execution Microprocessor in a Standard Cell ASIC Methodology[J].Journal of Computer Science & Technology,2007,22(1):1-14. 被引量：14
3高翔,张福新,汤彦,章隆兵,胡伟武,唐志敏.基于龙芯CPU的多核全系统模拟器SimOS-Goodson[J].软件学报,2007,18(4):1047-1055. 被引量：15

共引文献5

1段玮,章隆兵.片上实时功耗监控与估测的分析设计[J].计算机辅助设计与图形学学报,2010,22(11):2053-2060.
2朱晓静.一种递归定义的可扩展片上网络拓扑结构[J].计算机学报,2011,34(5):924-930. 被引量：3
3唐轶轩,吴俊敏,陈国良,朱小东,胡蝶.并行片上网络仿真器ParaNSim的设计及性能分析[J].西安交通大学学报,2012,46(2):24-30. 被引量：1
4曹非.环连接CMP模拟器:Godson-Ring[J].计算机工程与应用,2013,49(9):13-18.
5章隆兵,李磊,肖俊华,贺晓,王剑.一种基于硬件的快速确定性重放方法[J].高技术通讯,2017,27(6):487-494. 被引量：1

同被引文献100

1Martin M M K, Sorin Multifacet's general D J, Beckmann B M, et al. execution-driven multiprocessor simulator (GEMS) toolset [J]. SIGARCH Computer Architecture News, 2005, 33(4): 92-99.
2Xu M, Bodik R, Hill M D. A "flight data recorder" for enabling full system multiprocessor deterministic replay [C] //ProcoflEEEISCA'03. New York: ACM, 2003:122-135.
3Fidge C J. Time stamps in message-passing systems that preserve the partial ordering [C] //Proc of ACSC'88. New York: ACM, 1988: 56-66.
4Lamport L. Time, clocks, and the ordering of events in a distributed system [J]. Communications of the ACM, 1978, 21(7) : 558-565.
5Bacon D F, Goldstein S C. Hardware-assisted replay of multiprocessor programs [C] //Proc of ACM/ONR WPDD'91. New York: ACM, 1991:194-206.
6Xu M, Hill M D, Bodik R. A regulated transitive reduction (RTR) for longer memory race recording [C] //Proc of IEEE ASPLOS'06. New York: ACM, 2006:49-60.
7Narayanasamy S, Pereira C, Calder B. Recording shared memory dependencies using strata [C] //Proc of IEEE ASPLOS'06. New York: ACM, 2006: 229-240.
8Hower D R, Hill M D. Rerun: Exploiting episodes for lightweight memory race recording [C]//Proc of IEEE ISCA'08. Piscataway, NJ:IEEE, 2008: 265-276.
9Montesinos P, Ceze L, Torrellas J. DeLorean: Recording and deterministically replaying shared memory multiprocessor execution efficiently [C] //Proc of IEEE ISCA'08. Piscataway, NJ: IEEE, 2008 : 289-300.
10Ceze L, Tuck J, Montesinos P, et al. BulkSC: Bulk enforcement of sequential consistency [C] //Proc of IEEE ISCA'07. New York:ACM, 2007:278-289.

引证文献7

1刘磊,黄河,唐志敏.支持多核并行程序确定性重放的高效访存冲突记录方法[J].计算机研究与发展,2012,49(1):64-75. 被引量：5
2韩立敏,安建峰,高德远,樊晓桠,任向隆.众核处理器cache一致性研究综述[J].计算机应用研究,2012,29(11):4011-4016.
3张轮凯,宋风龙,王达,范东睿,孙凝晖.提升稀疏目录缓存一致性系统性能的方法[J].计算机研究与发展,2014,51(9):1955-1970. 被引量：3
4高剑刚.众核处理器研究现状及关键技术[J].高性能计算技术,2013,0(3):1-8.
5胡森森,计卫星,王一拙,陈旭,付文飞,石峰.片上多核处理器Cache一致性协议优化研究综述[J].软件学报,2017,28(4):1027-1047. 被引量：5
6何锡明,马胜,黄立波,陈微,王志英.一种基于自更新的简单高效Cache一致性协议[J].计算机研究与发展,2019,56(4):719-729. 被引量：4
7李宏亮,郑方,郝子宇,高红光,过锋,唐勇,吕晖,刘鑫,陈芳园.面向智能计算的国产众核处理器架构研究[J].中国科学：信息科学,2019,49(3):247-255. 被引量：2

二级引证文献19

1吉晓宇,武玉国,张明慧.一种基于Logisim的LRU高速缓存仿真系统设计与实现[J].郑州师范教育,2022,11(4):17-20.
2朱素霞,季振洲,李东.面向多核处理器的内存竞争记录研究综述[J].智能计算机与应用,2013,3(3):53-59. 被引量：1
3余攀峰.嵌入式多核平台调试技术[J].计算机系统应用,2013,22(11):187-189. 被引量：1
4温娜,郝永生,卢俊文.多核计算下气象研究程序的并行化研究[J].武汉理工大学学报（信息与管理工程版）,2014,36(6):739-742.
5郑龙,廖小飞,吴松,金海.一种用于多线程程序性能分析的重放系统[J].计算机研究与发展,2015,52(1):45-55. 被引量：2
6禹振,苏小红,王甜甜,马培军.虚拟时间及其在数据竞争检测中的应用[J].哈尔滨工业大学学报,2015,47(1):68-74.
7崔自峰,刘竹旺,闫修林.分布式系统缓存一致性设计与应用[J].指挥信息系统与技术,2015,6(6):101-106. 被引量：4
8胡森森,陈皇吉.一种新颖的面向数据流量特征的片上网络设计[J].电讯技术,2018,58(5):583-587.
9陈继承,赵雅倩,李一韩,王恩东,史宏志,唐士斌.MPD:结点具有多个并行缓存一致性域的CC-NUMA系统[J].计算机研究与发展,2017,54(4):775-786.
10吴健虢,陈海燕,刘胜,邓让钰,陈俊杰.多核Cache稀疏目录性能提升方法综述[J].计算机工程与科学,2019,41(3):385-392. 被引量：2

1纪丽婧,汪国锋,周晓慧.功能精确型多核处理器参考模型设计[J].杭州电子科技大学学报（自然科学版）,2013,33(2):53-56.
2王科兵,郭松柳,汪东升,崔光佐.基于片内WISHBONE总线的高速缓存一致性实现[J].电子技术应用,2004,30(5):4-6. 被引量：2
3郑志硕,郑存陆,曹宏徙.基于Simics的分布式一致性协议仿真[J].计算机与现代化,2011(9):105-108.
4吴俊敏,杨超,陈国良,张淼辉,门珂.存储模型仿真器的设计与实现[J].计算机研究与发展,2005,42(3):394-403. 被引量：2
5王时龙,张健,练煜.嵌入式系统高速缓存一致性优化解决方案[J].重庆工学院学报,2006,20(11):1-3.
6贺宁.多处理器系统缓存一致性的分析[J].电子工程师,2007,33(2):46-48. 被引量：1
7陈树清.“NUMA”的来龙去脉[J].中国经济和信息化,1998(50):21-22.
8刘道福,陈天石,郭琦.一种无目录的共享高速缓存一致性协议[J].高技术通讯,2015,25(5):445-452.
9ARM推出新版高性能系统IP[J].商业故事（数字通讯）,2012(21):6-6.
10刘妍,王达.多处理器高速缓存一致性分析与评价[J].科技信息,2008(15):66-66.

计算机学报

2009年第8期

浏览历史

内容加载中请稍等...

硬件结构支持的基于同步的高速缓存一致性协议被引量：7

参考文献1

二级参考文献3

共引文献5

同被引文献100

引证文献7

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

硬件结构支持的基于同步的高速缓存一致性协议 被引量：7

参考文献1

二级参考文献3

共引文献5

同被引文献100

引证文献7

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

硬件结构支持的基于同步的高速缓存一致性协议被引量：7