异构内存系统全局优化的数据预取算法被引量：1

Data Prefetching Algorithm for Globally Optimizing Heterogeneous Memory System

下载PDF

导出

摘要鉴于现有的数据预取算法不能满足高效能异构计算系统对动态随机存取存储器(DRAM)和非易失性存储器(NVM)相结合的新型异构存储器高效访问的要求,提出了一种模拟退火的全局优化数据预取算法(SADPA)。该算法在启发式搜索模拟退火算法的基础上,引入了随机因子,以避免局部最优,从而确定了全局优化阈值以预取NVM页面的有效数量。实验结果表明,该算法相对于静态阈值调整算法,平均访问延时降低了4%,每个时钟周期内的平均指令数(IPC)增加了10.1%;对于cactusADM应用,该算法相对于软硬件协同的动态阈值调整算法,系统能耗降低了3.4%。 Due to the existing data prefetching algorithms can ’t meet the requirements of the novel heterogeneous memory system combining the dynamic random access memory (DRAM) with the nonvolatile memory (NVM) in high energy-efficiency heterogeneous computing systems,a simulated annealing data prefetching algorithm (SADPA) was proposed.It was a heuristic search inspired simulated annealing algorithm,in which a random factor was introduced to confirm the global optimal threshold and the valid number of prefetching NVM pages.The results show that the average accessing latency of SADPA is 4% lower than that of the static threshold adjustment algorithm,and the average instruction per cycle (IPC) of the SADPA is 10.1% greater than that of the static threshold adjustment algorithm.Besides,the systemic power supported by SADPA,as for the cactusADM,is reduced by 3.4% compared with the cooperative hardware/software dynamic threshold adjustment algorithm.

作者裴颂文赵梦旖姬燕飞 PEI Songwen;ZHAO Mengyi;JI Yanfei(School of Optical-Electrical and Computer Engineering,University of Shanghai for Science and Technology,Shanghai200093,China;School of Management,Fudan University,Shanghai 200433,China)

机构地区上海理工大学光电信息与计算机工程学院复旦大学管理学院

出处《上海理工大学学报》 CAS CSCD 北大核心 2019年第1期22-29,共8页 Journal of University of Shanghai For Science and Technology

基金中国博士后科学基金资助项目(2017M610230) 国家自然科学基金资助项目(61775139 61332009) 上海市自然科学基金资助项目(15ZR1428600) 上海市浦江人才计划项目(PJ1407600)

关键词异构内存系统数据预取模拟退火算法全局优化 heterogeneous memory system data prefetching simulated annealing algorithm global optimum

分类号 F830 [经济管理—金融学]

引文网络
相关文献

参考文献3

1连瑞琦,张兆庆,乔如良.指令级并行编译器的数据预取及优化方法[J].计算机学报,2000,23(6):576-584. 被引量：8
2裴颂文,吴小东,唐作其,熊乃学.异构千核处理器系统的统一内存地址空间访问方法[J].国防科技大学学报,2015,37(1):28-33. 被引量：2
3罗乐,刘轶,钱德沛.内存计算技术研究综述[J].软件学报,2016,27(8):2147-2167. 被引量：32

二级参考文献189

1Chen W Y W，博士学位论文，1993年
2Chen Tienfu，Proceedings of the 5th International Conference on Architectural Support for Pro，1992年，51页
3Borkar S. Thousand core chips : a technology perspective[ C ]// Proceedings of the 44th Annual Design Automation Conference (DAC) , San Diego, California, 2007:746-749.
4Chung E S, Milder P A, Hoe J C, et al. Single-chip heterogeneous computing: does the future include custom logic, FPGAs, and GPGPUs [ C l//Proceedings of the 2010 43rd Annual IEEE/ACM International Symposium on Microarchitecture ( MICRO), Adanta, GA, 2010 : 225 - 236.
5Brookwood N. AMD fusion family of APUs: enabling a superior, immersive PC experience [ EB/OL]. [ 2014 - 06 - 10]. http://www, amd. com.
6Intel haswell microarchitecture [ EB/OL ]. Intel Corpaoration. [2014 -06 - 10]. http://www, intel, com.
7Nvidia project denver[ EB/OL]. Nvidia Corporation. [ 2014 - 06 -101. http://www, nvidia, com.
8Big. LITTLE processing [ EB/OL ]. ARM Corporation [ 2014 - 06 - 10]. http://www, arm. com.
9Lustig D, Martonosi M. Reducing GPU offload latency via fine- grained CPU-GPU synchronization [ C ]//Proceedings of the IEEE 19th International Symposium on High-Performance Computer Architecture ( HPCA), Shenzhen, China, 2013 : 354 - 365.
10Daga M, Aji A M, Feng W. On the efficacy of a fused CPU + GPU processor ( or APU ) for parallel computing [ C ]// Proceedings of the 2011 Symposium on Application Accelerators in High-Performance Computing, Knoxville Tennessee, 2011 : 141 - 149.

共引文献39

1王立娜,唐川,徐婧.未来芯片技术发展态势分析[J].世界科技研究与发展,2020,42(1):47-56. 被引量：5
2王威,胡铭曾.核外计算中I／O优化策略的研究[J].哈尔滨商业大学学报（自然科学版）,2005,21(5):600-603. 被引量：3
3唐剑琪,方滨兴,胡铭曾,王威.核外计算中的几种I/O优化方法[J].计算机研究与发展,2005,42(10):1820-1825. 被引量：4
4杨学军,窦勇,胡庆丰.Progress and Challenges in High Performance Computer Technology[J].Journal of Computer Science & Technology,2006,21(5):674-681. 被引量：7
5靳雁霞,陈学艳.大型数据库中图像数据的存储方法研究[J].计算机与现代化,2007(7):87-89. 被引量：1
6靳雁霞,石立丽,刘园.程序自动编译系统的研制与实现[J].计算机与现代化,2007(9):134-136. 被引量：1
7董燕,黄晨,左万娟,于倩.基于编译器优化的嵌入式软件缺陷分析方法[J].航天控制,2016,34(5):64-69.
8陈涛,鲁萌,陈彦名.运营商大数据技术应用研究[J].电信科学,2017,33(1):130-134. 被引量：16
9周泉.学术汉语:“一带一路”背景下汉语国际教育的新发展[J].中国职业技术教育,2017,33(26):10-13. 被引量：5
10刘强,董小社,陈衡,王寅峰.通信密集环境下基于内存利用率的预计算方法[J].西安交通大学学报,2017,51(10):59-64. 被引量：1

同被引文献10

1沈凡凡,徐超,张军,何炎祥.基于Gem5模拟器的缓存存储体系实验方法[J].实验技术与管理,2020,37(1):75-77. 被引量：2
2刘东,张进宝,廖小飞,金海.面向混合内存体系结构的模拟器[J].华东师范大学学报（自然科学版）,2014(5):133-140. 被引量：2
3何炎祥,沈凡凡,张军,江南,李清安,李建华.新型非易失性存储器架构的缓存优化方法综述[J].计算机研究与发展,2015,52(6):1225-1241. 被引量：11
4张德志,万寿红,岳丽华.基于DRAM和PCM的混合主存模拟器[J].计算机系统应用,2017,26(9):16-23. 被引量：2
5李琪,钟将,李雪,李青.基于新型非易失存储器的混合内存架构的内存管理机制[J].电子学报,2019,47(3):664-670. 被引量：2
6杜娇,钱育蓉,侯海耀,张猛.基于RRAM的混合存储模型[J].计算机工程与设计,2018,39(10):3068-3072. 被引量：1
7张军,谢竟成,沈凡凡,谭海,汪吕蒙,何炎祥.通用图形处理器缓存子系统性能优化方法综述[J].计算机研究与发展,2020,57(6):1191-1207. 被引量：4
8廖军,张毅,王成良,罗西,刘礼.基于数据智能一体化的实验室云平台的建设与研究[J].实验技术与管理,2020,37(4):249-252. 被引量：38
9刘兵,汪令辉,张锐,崔莹,段峰.改进的偏向写调度的混合内存缓冲区调度策略[J].湖南工业大学学报,2020,34(4):48-53. 被引量：2
10刘伟,孙童心,杜薇.面向访问模式的混合内存缓存替换策略[J].计算机科学,2020,47(10):130-135. 被引量：1

引证文献1

1张军,胡廷贤,沈凡凡,谭海,何炎祥.基于Gem5+NVMain的混合存储体系结构模拟实验方法[J].实验技术与管理,2021,38(10):65-70. 被引量：2

二级引证文献2

1王今雨,安健,王龙翔,唐新龙,丁跃,陈睿佳.NAND闪存可靠性验证实验平台设计与应用[J].实验技术与管理,2024,41(2):186-192.
2周海,周子强.基于Flash混合存储的数据迁移技术研究[J].电子设计工程,2024,32(11):51-54.

1展旭升,包云岗,孙凝晖.优化内存系统能效的DRAM架构研究综述[J].高技术通讯,2018,28(9):794-812.
2西部数据发布全新Ultrastar内存固态盘[J].微型计算机,2018,0(35):88-88.
3谷克宏,黄岷,何江银.基于多核集群的MPI+OpenMP混合并行编程模型研究[J].甘肃科技,2018,34(19):10-13. 被引量：3
4许道强,夏冬,宋剑枫,葛崇慧.基于异构存储环境的标签化数据调度研究[J].信息系统工程,2019,0(1):152-152. 被引量：1
5李梦琳,马雯秋.基于TSP模拟退火的智能RGV动态调度问题[J].活力,2019,0(2):219-219. 被引量：1
6王伟祥,尚有林,王朵.求解带箱子集约束的非光滑全局优化问题的填充函数方法[J].运筹学学报,2019,23(1):28-34. 被引量：5
7刘海飞,张晓晨,陈婷,王成伟,左丰国.一种减小电源网络电阻影响的DRAM离线驱动器[J].中国集成电路,2018,27(11):17-20.
8郭超磊,陈军华.基于SA-SVM的中文文本分类研究[J].计算机应用与软件,2019,36(3):277-281. 被引量：19
9于金博.精简指令系统的优化技术探究[J].电脑迷,2018(2):89-90. 被引量：1
10王帅,张云洲,段强.基于RGB-D的云机器人3D SLAM实验系统[J].实验技术与管理,2019,36(3):121-127. 被引量：1

上海理工大学学报

2019年第1期

浏览历史

内容加载中请稍等...

异构内存系统全局优化的数据预取算法被引量：1

参考文献3

二级参考文献189

共引文献39

同被引文献10

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

异构内存系统全局优化的数据预取算法 被引量：1

参考文献3

二级参考文献189

共引文献39

同被引文献10

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

异构内存系统全局优化的数据预取算法被引量：1