期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
Intel Bensley平台下前端总线竞争对访存密集型程序的性能影响分析 被引量:1
1
作者 毛晓炜 陶先平 何万青 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2010年第2期149-158,共10页
对称多处理(symmetric multiprocessor,SMP)机群系统因其优越的性价比和良好的可扩展性,已经成为当今高性能计算的主流结构.其中,单节点采用Intel双路四核平台已经逐渐成为目前高性能计算服务器的主流平台.由于一个CPU的四个核心共享一... 对称多处理(symmetric multiprocessor,SMP)机群系统因其优越的性价比和良好的可扩展性,已经成为当今高性能计算的主流结构.其中,单节点采用Intel双路四核平台已经逐渐成为目前高性能计算服务器的主流平台.由于一个CPU的四个核心共享一根前端总线,而且两根前端总线并不完全独立,前端总线竞争对访存密集型程序的性能有很大的影响.本文针对Intel Bensley双路四核平台特性,给出了前端总线竞争对访存密集型message passing interface(MPI)程序性能影响的计算模型,并编写程序和利用实例验证的该计算模型的有效性. 展开更多
关键词 访存密集型应用 BENSLEY 前端总线 地址总线利用率 数据总线利用率
下载PDF
iCluster软件叠前时间偏移模块的优化方法 被引量:1
2
作者 金君 何万青 +1 位作者 乔楠 孔祥宁 《勘探地球物理进展》 2008年第6期433-437,共5页
对中国石化石油勘探开发研究院南京石油物探研究所iCluster地震成像软件系统中叠前时间偏移(PSTM)模块进行了性能剖析和调优。PSTM模块中,进程间通讯很少,理论上可以得到很好的加速比和可扩展性。由于存在大量的读写磁盘操作,导致CPU占... 对中国石化石油勘探开发研究院南京石油物探研究所iCluster地震成像软件系统中叠前时间偏移(PSTM)模块进行了性能剖析和调优。PSTM模块中,进程间通讯很少,理论上可以得到很好的加速比和可扩展性。由于存在大量的读写磁盘操作,导致CPU占用率很低,性能变差,一旦磁盘读写性能得到了很好的解决,性能将会大幅提升。此外,还发展了iCluster PSTM模块的多线程和混合并行方法。SMP集群上,通过多线程和混合并行方法不仅可以增加单节点的数据处理量,而且也很好地缓解了PSTM模块各进程对IO的竞争。另一方面,对原始代码中的热点循环进行了优化,实现了对代码的向量化,在某工区数据的测试中,性能提升了36.3%。 展开更多
关键词 地震资料处理 iCluster 叠前时间偏移 并行算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部