期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
面向并行文件系统的性能评估及相对预测模型 被引量:7
1
作者 赵铁柱 董守斌 +1 位作者 Verdi MARCH simon see 《软件学报》 EI CSCD 北大核心 2011年第9期2206-2221,共16页
基于Lustre文件系统,对并行文件系统的性能评估和性能建模进行了研究.通过对性能因子的调研,进行了一系列性能评估实验,并提出性能相关性模~(PRModel).在实验评估和PRModel分析中发现,在不同的性能因子之间存在着紧密的性能相... 基于Lustre文件系统,对并行文件系统的性能评估和性能建模进行了研究.通过对性能因子的调研,进行了一系列性能评估实验,并提出性能相关性模~(PRModel).在实验评估和PRModel分析中发现,在不同的性能因子之间存在着紧密的性能相关性,为了挖掘并利用这种相关性信息,提出了一种相对性能预测模(RPPModel)来预测不同性能因子条件下的性能.为了验证RPPModel的有效性,设计了大量实验用例.结果表明,预测结果的平均相对误差能够控制在170/o---28%的范围内,易于使用且具有较好的预测准确度. 展开更多
关键词 并行文件系统 性能评估 性能模型 LUSTRE文件系统
下载PDF
基于机器学习的并行文件系统性能预测 被引量:5
2
作者 赵铁柱 董守斌 +2 位作者 董守斌 Verdi March simon see 《计算机研究与发展》 EI CSCD 北大核心 2011年第7期1202-1215,共14页
并行文件系统能有效解决高性能计算系统的海量数据存储和I/O瓶颈问题.由于影响系统性能的因素十分复杂,如何有效地评估系统性能并对性能进行预测成为一个潜在的挑战和热点.以并行文件系统的性能评估和预测作为研究目标,在研究文件系统... 并行文件系统能有效解决高性能计算系统的海量数据存储和I/O瓶颈问题.由于影响系统性能的因素十分复杂,如何有效地评估系统性能并对性能进行预测成为一个潜在的挑战和热点.以并行文件系统的性能评估和预测作为研究目标,在研究文件系统的架构和性能因子后,设计了一个基于机器学习的并行文件系统预测模型,运用特征选择算法对性能因子数量进行约简,挖掘出系统性能和影响因子之间的特定的关系进行性能预测.通过设计大量实验用例,对特定的Lustre文件系统进行性能评估和预测.评估和实验结果表明:threads/OST、对象存储器(OSS)的数量、磁盘数目和RAID的组织方式是4个调整系统性能最重要因子,预测结果的平均相对误差能控制在25.1%~32.1%之间,具有较好预准确度. 展开更多
关键词 并行文件系统 性能评估 性能预测 性能模型 机器学习
下载PDF
异构集群上的宏基因组聚类优化
3
作者 韦建文 许志耿 +2 位作者 王丙强 simon see 林新华 《计算机科学》 CSCD 北大核心 2017年第3期20-22,47,共4页
宏基因组基因聚类是筛选致病基因的新型方法,其依赖于海量的测序数据、有效的聚类算法以及高效的计算机来实现。相关系数矩阵的计算是进行聚类前必须完成的操作,占总计算量的比重较大。以某基因库为例,包含1300个样本、每样本百万基因... 宏基因组基因聚类是筛选致病基因的新型方法,其依赖于海量的测序数据、有效的聚类算法以及高效的计算机来实现。相关系数矩阵的计算是进行聚类前必须完成的操作,占总计算量的比重较大。以某基因库为例,包含1300个样本、每样本百万基因的数据,单线程运行需要27年。充分发挥多核CPU的潜力,利用GPU加速卡强大的计算能力,将程序扩展到多节点集群上运行,是重要而迫切的工作。在仔细分析算法的基础上,首先针对单CPU节点和单GPU卡做了高效实现,获得了接近理想的加速比;然后利用缓存优化进一步提升性能;最后使用负载均衡方法在MPI线程间分发计算任务,实现了良好的扩展。相比未优化的单线程程序,16节点CPU获得了238.8倍的加速,6块GPU卡获得了263.8倍的加速。 展开更多
关键词 基因聚类 异构计算 缓存优化 负载均衡
下载PDF
星系分组算法的并行设计与优化:SGI系统与分布式集群对比 被引量:2
4
作者 司雨濛 韦建文 +1 位作者 simon see 林新华 《计算机科学》 CSCD 北大核心 2017年第10期80-84,共5页
Halo-based Galaxy Group Finder(HGGF)是一种有效的星系分组算法,它根据星系的空间位置、红移、质量等多种属性将星系分组,从而为星系组的形成与演化研究提供重要依据。但是,算法当前的OpenMP实现版本仅能利用单节点提供的资源,在大规... Halo-based Galaxy Group Finder(HGGF)是一种有效的星系分组算法,它根据星系的空间位置、红移、质量等多种属性将星系分组,从而为星系组的形成与演化研究提供重要依据。但是,算法当前的OpenMP实现版本仅能利用单节点提供的资源,在大规模星系分组问题上的应用受到限制。一种优化思路是采用多机并行,使其可以利用更多资源来解决更大规模的星系分组问题,并缩短执行时间。因此,有必要对算法重新进行设计与实现。实现此目标的一大挑战是程序中存在大量半随机性远端内存访问,其在多机并行环境下会对性能造成重大影响。为克服这一难题,设计中提出了邻接星系链表思想,并采用Unified Parallel C(UPC)进行程序实现。对于核代码部分,使用4,8,16节点时,可分别取得2.25,2.78,5.07倍的加速比;同时,对单个节点的内存需求也显著减少。OpenMP版本在SGI UV2000上的实验结果显示,受限于程序的访存特性与机器体系架构的特点,类似HGGF算法这种具有随机数据访问特征的程序,很难有效利用NUMA结构的共享内存系统中提供的大规模线程与内存资源来直接取得高加速比。在分布式内存集群上采用两级并行设计,以更好地利用局部性原理,可能是更好的解决方案。 展开更多
关键词 高性能计算 星系分组 并行计算 UPC OPENMP
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部