期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
神威超级计算机运行时故障定位方法
1
作者 高剑刚 郑岩 +6 位作者 于康 彭达佳 李宏亮 刘勇 何王全 陈德训 王飞 《计算机研究与发展》 EI CSCD 北大核心 2024年第1期86-97,共12页
随着高性能计算机的性能不断提升、系统规模不断提高,系统和应用的错误率也不可避免地持续增多.快速发现和定位系统及应用级的错误、为用户提供高质量服务,成为了超级计算机系统设计开发过程中急需考虑的问题.超级计算机系统中硬件故障... 随着高性能计算机的性能不断提升、系统规模不断提高,系统和应用的错误率也不可避免地持续增多.快速发现和定位系统及应用级的错误、为用户提供高质量服务,成为了超级计算机系统设计开发过程中急需考虑的问题.超级计算机系统中硬件故障与异常、软件程序的错误等都会导致用户大规模并行应用的错误、挂死与退出.如何快速准确定位错误现场,让管理员或用户以此为基础查看异常发生的故障进行高精度、高效率的诊断,是维护高性能计算系统可靠性的重要基础.高性能计算机传统的故障定位主要通过硬件异常跟踪、系统日志分析和程序主动探测等方法,缺乏对无日志信息、无明显故障现象的程序挂死问题的定位手段,并且技术的扩展性也面临挑战.针对“新一代神威超级计算机”体系结构和SW26010-Pro众核处理器特点,提出一种运行时故障定位方法,包括基于消息传递的故障关联分析、基于全局聚合信息的在线综合分析诊断、面向申威众核处理器的异常线程过滤方法等关键技术,阐述了如何有效检测、收集、处理大量系统资源和并行进程的异常信息问题,为应对未来超大规模高性能计算中故障高效定位难题提供有效支撑. 展开更多
关键词 E级计算机 可靠性 错误定位 运行时 众核处理器
下载PDF
面向神威众核超算系统的并行计算模型研究 被引量:1
2
作者 高剑刚 刘鑫 +4 位作者 李芳 刘勇 彭达佳 陈鑫 陈德训 《计算机学报》 EI CAS CSCD 北大核心 2023年第7期1339-1349,共11页
基于异构众核处理器的超级计算机已经成为TOP500高性能计算机的主流,BSP、LogP、PRAM等已有并行计算模型均针对基于多核处理器的超级计算机设计,不能满足日益迫切的基于众核架构的超级计算机和应用发展需求.本文面向“神威·太湖之... 基于异构众核处理器的超级计算机已经成为TOP500高性能计算机的主流,BSP、LogP、PRAM等已有并行计算模型均针对基于多核处理器的超级计算机设计,不能满足日益迫切的基于众核架构的超级计算机和应用发展需求.本文面向“神威·太湖之光”和神威E级原型系统的众核体系结构特点,提出P-PALN(Parallel-Parallel Access via LDM&NOC)并行计算模型,对于计算节点间的并行,该模型沿用BSP/LogP模型描述;对于计算节点内的众核并行,该模型提供私有存储访问和片上阵列通信的众核并行架构的有效描述PALN,能够协助用户进行众核并行算法设计,并在申威众核处理器硬件设计中指导参数的优化.实验结果表明,该模型可有效指导硬件设计和用户众核编程,从而提高系统和应用的性能. 展开更多
关键词 众核处理器 并行计算模型 P-PALN PALN 片上通信
下载PDF
基于可重构微服务器的高能效指纹比对方法 被引量:1
3
作者 钱磊 赵锦明 +3 位作者 彭达佳 李祥 吴东 谢向辉 《计算机研究与发展》 EI CSCD 北大核心 2016年第7期1425-1437,共13页
大规模指纹应用需要强大的后端指纹比对计算能力作为支撑.基于可重构微服务器(reconfigurable micro server,RMS)技术,提出一种软硬协同的高效指纹比对方法,该方法充分发挥可重构混合核心计算架构的优势,采用优化定制的硬件加速部件对... 大规模指纹应用需要强大的后端指纹比对计算能力作为支撑.基于可重构微服务器(reconfigurable micro server,RMS)技术,提出一种软硬协同的高效指纹比对方法,该方法充分发挥可重构混合核心计算架构的优势,采用优化定制的硬件加速部件对指纹比对算法中的计算密集部分进行加速.复杂控制流和离散访存较多的算法部分则以软件形式在通用计算核心上高效执行.在单个RMS计算节点上完成了算法原型的实现并进行了详细测试.测试结果表明:单个RMS节点上的指纹比对性能约为105万次/秒,功耗仅为5W.与相关工作相比,该性能是单个X86集群节点的15.5倍;能效是X86集群节点的583倍,是基于Tesla C2075的GPU服务器的5.4倍.与单纯的FPGA平台相比,基于RMS技术的实现方法更具灵活性和可扩展性,是未来构建大规模指纹比对系统的一种高效的技术解决方案. 展开更多
关键词 可重构微服务器 指纹比对 高能效计算 混合核心 硬件加速器 计算平台
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部