期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
利用年龄编码的Bloom过滤算法降低Load-Store队列功耗 被引量:1
1
作者 赵雨来 佟冬 程旭 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第4期559-565,共7页
考虑Load-Store顺序违例和多线程及多处理器中的Load-Load顺序违例,对基于计数器的Bloom过滤算法进行改进,采用指令年龄编码消除过滤算法引起的错误判定,在不对流水线时序和性能产生影响的情况下,将过滤比率提高了5%以上。
关键词 load-store队列 消除存储序列违例 CACHE一致性 弱排序 同时多线程
下载PDF
一种基于AC-Bloom技术的多线程处理器数据存取队列机制设计
2
作者 田金 谢憬 +1 位作者 邹翠 毛志刚 《微电子学与计算机》 CSCD 北大核心 2015年第6期27-31,共5页
针对片上多线程处理器中数据存取队列的数据查找延迟和功耗问题,在传统的基于年龄编码的Bloom过滤技术基础上,对多核结构提出了年龄和计数器相结合的Bloom(AC-Bloom)过滤算法设计方案.该方案利用程序的顺序(年龄)信息设计增强的过滤算法... 针对片上多线程处理器中数据存取队列的数据查找延迟和功耗问题,在传统的基于年龄编码的Bloom过滤技术基础上,对多核结构提出了年龄和计数器相结合的Bloom(AC-Bloom)过滤算法设计方案.该方案利用程序的顺序(年龄)信息设计增强的过滤算法,从而降低了存取队列的访问次数,提高过滤百分比.利用仿真器与传统的过滤算法进行了对比,测得平均可提升4.5%~13%的过滤百分比. 展开更多
关键词 片上多线程处理器 存取队列 关联查找 AC-Bloom过滤算法
下载PDF
基于存储队列的Cache访问性能优化研究
3
作者 李玉发 高德远 黄小平 《计算机测量与控制》 CSCD 北大核心 2009年第11期2260-2262,2266,共4页
高性能处理器普遍采用片上集成大容量复杂结构的一级Cache提高处理器性能,但随着Cache容量和复杂度的增加,访问Cache所产生的访存延迟和功耗明显增加;基于存储队列,提出了一种通过减少Cache访问次数来降低功耗和延迟的方法,利用存储队... 高性能处理器普遍采用片上集成大容量复杂结构的一级Cache提高处理器性能,但随着Cache容量和复杂度的增加,访问Cache所产生的访存延迟和功耗明显增加;基于存储队列,提出了一种通过减少Cache访问次数来降低功耗和延迟的方法,利用存储队列来缓存Load/Store指令的数据,并且当存储队列不满时,通过空闲入口暂存已经完成的仿存数据,提高了连续访存数据的复用率,减少了Cache的访问次数;仿真结果显示,该方法在增加少量的控制逻辑基础上,显著减少了Cache的访问次数,降低了Cache的功耗,减少了访存延迟,加快了执行速度。 展开更多
关键词 存储队列 CACHE 低功耗 低延迟
下载PDF
Active Store Window: Enabling Far Store-Load Forwarding with Scalability and Complexity-Efficiency
4
作者 张栚滈 王箫音 +3 位作者 佟冬 易江芳 陆俊林 王克义 《Journal of Computer Science & Technology》 SCIE EI CSCD 2012年第4期769-780,共12页
Conventional dynamically scheduled processors often use fully associative structures named load/store queue (LSQ) to implement the value communication between loads and the older in-flight stores and to detect the s... Conventional dynamically scheduled processors often use fully associative structures named load/store queue (LSQ) to implement the value communication between loads and the older in-flight stores and to detect the store-load order violation. But this in-flight forwarding only occupies about 15% of all store-load communications, which makes the CAM-based micro-architecture the major bottleneck to scale store-load communication further. This paper presents a new micro-architecture named ASW (short for active store window). It provides a new structure named speculative active store window to implement more aggressively speculative store-load forwarding than conventional LSQ. This structure could forward the data of committed stores to the executing loads without accessing to L1 data cache, which is referred to as far forwarding in this paper. At the back-end of the pipeline, it uses in-order load re-execution filtered by the tagged SSBF (short for store sequence bloom filter) to verify the correctness of the store-load forwarding. The speculative active store window and tagged store sequence bloom filter are all set-associate structures that are more efficient and scalable than fully associative structures. Experiments show that this simpler and faster design outperforms a conventional load/store queue based design and the NoSO desien on most benchmarks by 10.22% and 8.71% respectively. 展开更多
关键词 store-load forwarding load/store queue value-based load re-execution
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部