-
题名众核处理器中使用写掩码实现混合写回/写穿透策略
被引量:5
- 1
-
-
作者
林伟
叶笑春
宋风龙
张浩
-
机构
中国科学院计算技术研究所计算机体系结构重点实验室
中国科学院研究生院
-
出处
《计算机学报》
EI
CSCD
北大核心
2008年第11期1918-1928,共11页
-
基金
国家自然科学基金重点项目(60736012)
国家“九七三”重点基础研究发展规划项目基金(2005CB321600)资助.
-
文摘
高速缓存采用写回策略,能极大地节省对片上网络和访存带宽的消耗,这对于片上众核(大于16核)的结构尤为重要.与通常多核系统中基于目录/总线的写无效或写更新协议不同,文中给出了片上实现域一致性存储模型和基于硬件锁的缓存一致性协议的方案并提出了在L1高速缓存保存写掩码的方法,用以记录本地更新缓存块的字节位置,解决了写回策略下伪共享带来的缓存一致性问题.文中还进一步提出两种优化掩码存储空间开销的新方法:通过设定程序中较少出现的、长度为1-3字节的写指令为写穿透,在L1中每4字节设置一位写掩码,将写掩码的芯片面积开销压缩到字节粒度的27.9%;设计项数为L1缓存块总数12.5%的多路写掩码缓存,在不损失性能的情况下,将面积开销压缩到字节粒度的17.7%.搭建的众核平台Godson-T采用域一致性存储模型,使用写掩码实现混合写回/写穿透缓存策略(临界区内写穿透,临界区外写回).实验使用splash2的3个程序和2个生物计算程序进行评估.结果表明,相对于完全写穿透,混合写回策略在32和64线程的配置下普遍获得24%以上的性能提升,性能略优于完全写回,并且采用两种优化空间开销的新方法后性能无损失.
-
关键词
众核
写掩码
写掩码缓存
域一致性
伪共享
写无效
写更新
-
Keywords
many-core
write mask
write mask buffer
scope consistency
false sharing
write-invalid
write-update
-
分类号
TP302
[自动化与计算机技术—计算机系统结构]
-