-
题名面向异构并行计算系统的流水线式压缩检查点
被引量:2
- 1
-
-
作者
刘勇鹏
王锋
卢凯
刘勇燕
-
机构
国防科学技术大学计算机学院
中国科技部信息中心
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2012年第2期223-229,共7页
-
基金
国家863高技术研究发展计划重大项目(No.2009AA01A128)
高效能服务器和存储技术国家重点实验室开放基金(No.2009HSSA04)
国家自然科学基金(No.60603061)
-
文摘
在大规模并行计算系统中,并行检查点触发大量结点同时保存计算状态,造成巨大文件存储空间开销,以及对通信和存储系统的巨大访问压力.数据压缩可以缩小检查点文件尺寸,从而降低存储空间开销以及对通信和存储系统的访问压力.但是,它也带来额外的压缩计算开销.本文针对异构并行计算系统,提出流水线式并行压缩检查点技术,采用一系列优化技术来降低压缩引入的计算延时,包括:流水线式双重写缓存队列、文件写操作的合并、GPU加速的流水压缩算法和GPU资源的多进程调度,等等.本文介绍了该技术在天河一号系统中的实现,并对所实现的检查点系统进行综合评测.实验数据表明该方法在大规模异构并行计算系统中是可行、高效、实用的.
-
关键词
异构并行体系结构
检查点
数据压缩
软流水线
图形处理器
-
Keywords
heterogenous architecture
checkpoint
data compression
pipeline
graphic processing unit (GPU)
-
分类号
TP338.4
[自动化与计算机技术—计算机系统结构]
-