-
题名基于程序访存模式的低功耗存储技术
被引量:6
- 1
-
-
作者
章铁飞
陈天洲
吴剑钟
-
机构
浙江工商大学计算机与信息工程学院
浙江大学计算机科学与技术学院
浙江大学城市学院计算机分院
-
出处
《软件学报》
EI
CSCD
北大核心
2014年第2期254-266,共13页
-
基金
国家自然科学基金(61379035)
浙江省自然基金(LQ12F02017)
+3 种基金
浙江省移动网应用技术重点实验室开放基金
新一代移动互联网软件服务浙江省重点科技创新团队资助项目
浙江工商大学人才引进科研启动项目
浙江工商大学(硕士)高级计算机系统结构建设经费
-
文摘
与不断提升的计算能力相适应,移动手持设备上的存储系统结构越来越复杂,容量越来越大.这种趋势导致存储系统,主要是片上缓存和主存,在系统总能耗的占比中不断攀升.在当前手持设备多由电池驱动并且电池容量十分有限的情况下,存储系统的低功耗设计就显得十分重要.虽然现有的存储器件提供了一定的硬件节能支持,但是只有与应用程序的访存行为的规律相结合,才能充分发挥硬件的节能潜力.对现有的各种低功耗存储技术进行了梳理和总结,给出程序的访存模式的概念,归纳出访存模式在3个方面的内涵,并进一步详细介绍了程序的访存模式在片上缓存和主存低功耗技术中的应用.最后,展望未来结合访存模式进行低功耗存储系统研发的可能方向.
-
关键词
低功耗
片上缓存
主存
程序的访存模式
-
Keywords
energy-efficient
on-chip cache
main memory
memory access patterns of program
-
分类号
TP316
[自动化与计算机技术—计算机软件与理论]
-
-
题名利用访存模式构建GPU高效率数据访问
- 2
-
-
作者
张瑞
田密
-
机构
延安大学教育科学学院
北京理工大学计算机学院
延安职业技术学院网络信息中心
-
出处
《延安大学学报(自然科学版)》
2020年第3期30-36,共7页
-
基金
国家自然科学基金地区科学基金项目(61866038)
陕西省教育厅科研项目(18JK0865)。
-
文摘
针对访存相对密集的应用,提出了一种基于访存模式高效率数据访问技术。该技术结合应用程序的访存特性和GPU的片上高速共享存储器特性减少应用程序对高延迟片外存储访问的次数从而提高系统数据访问的效率,通过在不同架构的GPU上进行了验证,分别取得了N卡最高9倍和A卡最高8倍的加速效果,并对各个优化策略在不同架构GPU上取得效果的原因进行了分析。
-
关键词
访存模式
GPU
数据饥饿
高效率数据访问
-
Keywords
access model
GPU
data undersupplied
efficient data access
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于指令流访存模式预测的缓存替换策略
被引量:1
- 3
-
-
作者
王玉庆
杨秋松
李明树
-
机构
中国科学院软件研究所基础软件国家工程研究中心
中国科学院大学
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2022年第1期31-46,共16页
-
基金
“核高基”国家科技重大专项基金项目(2014ZX01029101-002)
中国科学院战略性先导科技专项(XDA-Y01-01)。
-
文摘
传统的缓存替换策略主要基于经验主义,近年来研究者们使用预测技术推测访存行为,提高缓存替换的准确性,预测技术的应用是当前缓存替换策略研究的热点.由于访存行为自身的复杂性,直接在缓存系统中预测访存行为是困难的,要面对很大的不确定性.当前已有的研究为了解决该问题,使用越来越复杂的预测算法来分析访存行为之间的关联.然而这种方式并未真正减小不确定性,同时现有的缓存替换策略很难避免乱序执行和缓存预取对访存行为分析过程的干扰.为了解决以上问题,提出了一种新的预测缓存访问序列的方法IFAPP(instruction flow access pattern prediction),根据分支预测技术推测程序指令流,定位指令流中的访存指令,进而对其中访存指令的行为逐一进行预测.通过访存序列计算每个替换候选项的重用距离,将重用距离最远的候选项踢出.该方法可以避免乱序执行和缓存预取的干扰,预测对象是行为简单的独立访存指令,减少预测过程中所面对的不确定性.实验结果表明,该算法在一级数据缓存上比LRU算法平均减少3.2%的缓存缺失.相比经典的基于缓存预测的BRRIP和BIP算法,该算法在一级数据缓存上分别减少12.3%和14.4%的缓存缺失.
-
关键词
分支预测
缓存替换策略
提前预测
访存序列预测
访存模式
-
Keywords
branch prediction
cache replacement policy
ahead prediction
memory access sequence prediction
memory access pattern
-
分类号
TP302
[自动化与计算机技术—计算机系统结构]
-
-
题名面向非一致Cache的任意步长预提升技术
被引量:4
- 4
-
-
作者
吴俊杰
杨学军
-
机构
国防科学技术大学计算机学院并行与分布处理国家重点实验室
-
出处
《计算机科学与探索》
CSCD
2010年第7期577-588,共12页
-
基金
国家自然科学基金No.60921062
60873014~~
-
文摘
随着微电子工艺的不断进步,片上大容量非一致cache的研究受到广泛关注。提出了一种面向非一致cache的任意步长预提升技术,它能够优化非一致cache中的数据组织,使得即将访问的数据被放置在距离处理器较近的cachebank中,从而降低访存延迟,提升系统性能。详细介绍了任意步长预提升技术的设计,比较了预提升技术与预取技术的差别,并提出了二者的结合技术。通过对来自NPB和SPEC2000的11个基准测试程序在全系统模拟器上的实验评测,发现任意步长预提升技术能够有效减小访存延迟,在访存预测表尺寸为16和32的情况下,系统IPC分别平均增长4.17%和4.91%;在结合预提升和预取技术的情况下,系统IPC分别平均增长8.84%和11.06%。
-
关键词
预提升技术
非一致高速缓存结构
任意步长
访存模式
预取技术
-
Keywords
pre-promotion
non-uniform cache architecture
arbitrary stride
access pattern
pre-fetching
-
分类号
TP302
[自动化与计算机技术—计算机系统结构]
-
-
题名一种改进的多核处理器硬件预取技术
被引量:2
- 5
-
-
作者
方娟
张红波
-
机构
北京工业大学计算机学院
-
出处
《计算机科学》
CSCD
北大核心
2012年第S2期48-50,64,共4页
-
文摘
存储访问延迟一直是制约计算机系统整体性能的瓶颈,多核处理器的出现使"存储墙"问题更加严重。预取技术可以隐藏存储访问延迟,因此基于多核处理器的预取技术最近成为学术界研究的热点。研究了目前较为新颖的多核处理器预取技术Future execution,然后针对其缺陷提出改进,即提出了FE-Runahead架构,其减少了二级Cache访问缺失,提高了二级Cache命中率。实验结果表明,改进后的预取架构的二级Cache命中率提高了约9%,相对执行时间减少了8%。
-
关键词
CMP
访存模式
存储访问延迟
指令窗口
-
Keywords
CMP
Memory access patterns
Memory access latency
Instruction window
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-