期刊文献+

面向大规模集群的并行I/O用户层配置优化策略 被引量:5

User-level parallel I/O configuration optimize strategy toward large-scale cluster
下载PDF
导出
摘要 影响应用I/O性能的关键因素主要有三个层次:包括应用的I/O接口实现、体系结构和文件系统组件的性能以及应用的I/O参数配置。从应用I/O配置优化的视角,分析了大规模集群并行I/O的配置调优空间,在此基础上,给出了一套大规模集群并行I/O性能特征测试分析方法。基于该方法,在某国产超级计算集群上开展了一系列I/O测试分析来刻画系统的I/O性能特征,进而指导并行应用程序的I/O配置优化。基于优化后的配置参数,在两类典型的并行I/O场景中,针对某类生产应用程序,8192进程下的重启动数据写操作时间下降了15%,4096核的程序作业加载时间从10 min缩短到了5 s。 Three key factors exert big influence upon the application′s I/O performance,including the I/O programming interface,the performance characteristic of I/O sub-system(both architecture and system software),and the I/O configuration parameters at user-level.From the user′s perspective,this paper discussed the user-level parallel I/O configuration optimize space toward large scale cluster.Besides,we proposed a method of testing and analyzing the I/O characteristic of large scale cluster.Based on this method,the I/O performance portrait of a domestic super computer was built up and several user-level parallel I/O optimize suggestions were put forward.With these carefully selected I/O configuration parameters,the time of restart data write operation was cut down by 15 percent under 8192 processes in a real application environment,while the program′s initial time is shortened from 10 minutes to 5 seconds at the scale of 4096 processes.
作者 田鸿运 武林平 董勇 景翠萍 罗红兵 莫则尧 TIAN Hongyun;WU Linping;DONG Yong;JING Cuiping;LUO Hongbing;MO Zeyao(Institute of Applied Physics and Computational Mathematics,Beijing 100094,China;College of Computer Science and Technology,National University of Defense Technology,Changsha 410073,China)
出处 《国防科技大学学报》 EI CAS CSCD 北大核心 2020年第2期23-30,共8页 Journal of National University of Defense Technology
基金 国家重点研发计划资助项目(2018YFB0204003)。
关键词 并行I/O优化策略 LUSTRE文件系统 大规模集群 传输数据量 条带数 parallel I/O optimize strategy Lustre file system large-scale cluster transfer size stripe count
  • 相关文献

参考文献10

二级参考文献101

  • 1沈卫超,曹立强,夏芳,宋磊.面向数值模拟数据的HDF5性能优化[J].计算机研究与发展,2012,49(S1):314-318. 被引量:10
  • 2周恩强,卢宇彤,沈志宇.一个适合大规模集群并行计算的检查点系统[J].计算机研究与发展,2005,42(6):987-992. 被引量:12
  • 3张继征,杨波,陆体军,贾惠波.NAS与SAN的融合[J].计算机应用研究,2005,22(8):190-192. 被引量:16
  • 4余寅辉,余镇危,杨传栋,张英.SAN存储系统的性能分析模型[J].计算机工程,2007,33(10):271-273. 被引量:11
  • 5Dries Kimpe,et al.A study of real world I/O performance in parallel scientific computing[J].Applied Parallel Computing,2008,4699:871-881.
  • 6Russel Sandberg,David Goldberg,Steve Kleiman,et al.Design and implementation of the sun network filesystem[C] //Pro-ceedings of the Summer 1985 USENIX Conference.Portland OR,1985:119-130.
  • 7Lustre Websit.High Performance and Scalability[EB/OL].ht-tp://wiki.lustre.org/index.php/Main_Page,2011 -03-01.
  • 8陈继军 魏玉琪 蔡贵新.高性能计算机系统结构及相关技术发展.高性能计算发展与应用,2005,:40-49.
  • 9IBTA.InfiniBand? Architecture Specification,Volume 1,2 (Release 1.1),InfiniBand Trade Association Administration[EB/OL].http://www.infinibandta.org,2010-01-10.
  • 10Weber R O.Information Technology--SCSI Object based Storage Device Commands(OSD)[EB/OL].http://www.t10.org/drafts.htm,2009-01-15.

共引文献64

同被引文献65

引证文献5

二级引证文献5

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部